AIで文字起こし副業|WhisperとNottaで月2万円稼ぐ方法【2026年版】
「文字起こしって単純作業でしょ?AIに全部やってもらえばいいじゃん」
正直、最初そう思っていた。でも実際に副業として取り組んでみると、AIツールの使い方と人間の修正スキルを組み合わせることで、思った以上に単価を上げられることに気づいた。
2026年現在、文字起こし副業はAIの普及によって「単純作業」から「AI活用スキル」が問われる仕事に変わりつつある。この記事では、WhisperとNottaを使って月2万円を達成するための具体的な方法をまとめた。
AI文字起こし副業とは?市場規模と需要
文字起こし副業とは、音声・動画データをテキストに変換する仕事だ。
企業のウェビナー記録、インタビュー音源、議事録、YouTubeの字幕作成など、需要は多岐にわたる。
市場規模と需要の現状
2026年現在、文字起こしの需要が増えている主な理由は以下だ:
- オンライン会議の普及: コロナ禍以降、議事録・会議録の需要が急増
- 動画コンテンツの増加: YouTube・Podcast・ウェビナーの字幕・台本需要
- 法令対応: 金融・医療・法律分野での記録義務の厳格化
- AI音声の精度限界: 方言・専門用語・複数人の会話はまだ人間の確認が必要
クラウドワークスで「文字起こし」と検索すると、常時数百件の案件が表示される。単価こそ低めだが、AIを活用することで作業時間を大幅に短縮できるのが現在の文字起こし副業の特徴だ。
使えるツール比較
OpenAI Whisper
MicrosoftとOpenAIが開発した音声認識AIで、無料で使えるのが最大のメリットだ。
- 精度: 非常に高い(特に英語)、日本語も十分実用的
- コスト: 無料(ローカル実行)またはAPI利用(1分あたり約0.006ドル)
- 対応形式: MP3、MP4、WAV、M4A等
- 特徴: Pythonの知識があればローカルで無制限に使える
- デメリット: セットアップに技術的知識が必要
クラウドワークスで納品する一般的な案件なら、WhisperのAPIを利用するのが手軽だ。
Notta
日本語特化のAI文字起こしサービスで、使いやすさと精度のバランスが優れている。
- 精度: 日本語に特化して最適化済み、方言にも対応
- コスト: 無料プラン(月3時間まで)、Pro版(月1,980円)
- 対応形式: 動画・音声・Zoomなど広く対応
- 特徴: ブラウザで完結、スピーカー識別機能あり
- デメリット: 無料プランは時間制限あり
Clova Note(LINE)
LINEが提供する無料の音声メモ・文字起こしアプリ。スマートフォンで完結できるのが特徴。
- コスト: 無料
- 特徴: 話者識別、スマートフォンで録音から文字起こしまで一貫
- デメリット: 長時間の音声ファイルには不向き
ツール選択の指針
| ケース | 推奨ツール |
|---|---|
| 無料で始めたい | Clova Note / Whisper(ローカル) |
| 日本語の精度を優先 | Notta Pro |
| 大量処理をコスト効率よく | Whisper API |
| スマホだけで完結したい | Clova Note |
案件の種類と単価
案件の種類
1. 議事録・会議録
– 単価:1時間の音声で2,000〜5,000円
– 需要:法人の継続案件が多く、安定収入につながりやすい
– 難度:専門用語が多い場合は高単価
2. セミナー・ウェビナーの書き起こし
– 単価:1時間で3,000〜8,000円
– 需要:教育・研修コンテンツの増加で案件数が多い
– 難度:登壇者の話が明瞭なため比較的簡単
3. インタビュー文字起こし
– 単価:1時間で3,000〜6,000円
– 需要:メディア・ライター・研究者からの需要が安定
– 難度:複数話者が交互に話すため識別が必要
4. YouTube・Podcast字幕作成
– 単価:1動画で500〜3,000円(長さによる)
– 需要:コンテンツクリエイターからの依頼が増加中
– 難度:話し言葉の整形スキルが求められる
5. 医療・法律分野の専門書き起こし
– 単価:1時間で5,000〜15,000円
– 需要:専門知識が必要なため高単価
– 難度:専門用語の知識が必要
実際の作業フロー
AIを活用した文字起こし副業の実際のフローを紹介する。
ステップ1:音声データの受け取り
クライアントからMP3、MP4、WAV等の形式でデータが届く。GoogleドライブやDropboxでの共有が多い。受け取ったら必ずバックアップを取っておくこと。
ステップ2:AIで一次変換
Nottaにアップロードするか、Whisper APIに投げる。このステップで全体の70〜80%の文字起こしが完成する。
Nottaの場合:
1. ブラウザでNottaを開く
2. 「インポート」からファイルをアップロード
3. 自動で文字起こしが開始される(1時間の音声で約3〜5分)
4. 完了後にテキストをエクスポート
ステップ3:人間による修正・校正
AIが苦手な部分を人間が修正する。具体的には:
- 固有名詞・人名の誤変換: 「田中」が「多中」になっているなど
- 専門用語の修正: 業界特有の用語はAIが誤変換しやすい
- 話者識別の確認: 複数人の会話で発言者が混在していないか確認
- 句読点・改行の整形: 読みやすい文章に整える
- フィラー(えー、あの等)の処理: クライアントの指示に従って削除または残す
この修正作業が文字起こし副業で人間の価値が最も出る部分だ。
ステップ4:品質チェックと納品
音声と最終テキストを突き合わせてチェックする。全体の10〜20%をサンプリングして確認するだけでも精度は大幅に上がる。
クライアント指定の形式(Word、テキスト、Google Docs等)に整えて納品する。
案件獲得先
クラウドワークス
日本最大のクラウドソーシングサービス。文字起こし案件の数が最も多い。
登録手順:
1. 無料でアカウント作成
2. プロフィールに「AI文字起こしツール活用」と明記
3. 最初は低単価案件でも受注して実績を作る
4. レビューを5〜10件積んだら単価交渉へ
コツ:
– プロフィール画像を設定する(顔写真推奨)
– 得意分野(医療・法律・IT等)があれば明記する
– レスポンスの速さをアピールする
\ 無料で試してみる /
ランサーズ
クラウドワークスと並ぶ大手クラウドソーシング。「認定ランサー」制度があり、取得すると信頼性が上がる。
Bizseek・ミーツカンパニー
専門性の高い案件が多く、単価が高め。一定の実績を積んでから挑戦するのが現実的。
SNSでの直接営業
X(旧Twitter)でライターやコンテンツクリエイターに直接DMを送る方法も有効だ。「文字起こし対応します」とプロフィールに書いておくだけで問い合わせが来ることもある。
月2万円達成のステップ
月2万円の内訳イメージ
- 1案件:1時間の音声データ、単価3,000円
- 作業時間:AI活用で1時間の音声を1〜1.5時間で処理
- 月7案件で2万1,000円
週末2日間のみで取り組む場合、週2〜3件のペースで達成できる計算だ。
ステップ1(1〜2ヶ月目):ツールの習熟
- NottaまたはWhisperを使いこなせるようにする
- 30分の練習用音声(自分で録音でOK)で精度と速度を確認
- クラウドワークスに登録し、1件目を受注する(単価よりも経験を優先)
ステップ2(2〜3ヶ月目):実績を積む
- 週1〜2件のペースで受注
- レビューを5件以上集める
- 得意分野(業界)を絞って専門性をアピール
ステップ3(3〜4ヶ月目):単価を上げる
- 専門分野(医療・法律・IT等)の案件に絞る
- プロフィールに「AI活用で高速・高精度」と明記
- 1時間4,000〜5,000円以上の案件を狙う
ステップ4(4ヶ月目以降):継続案件を獲得する
- 法人クライアントとの直接契約を目指す
- 月5〜10万円の継続案件を1〜2本確保できれば安定収入になる
🤖 まずはChatGPT Plusを試してみよう
月20ドル(約3,000円)でGPT-4が使い放題。副業の生産性が3倍になる最初の投資として、これ以上コスパの良いものはない。無料版でも始められるけど、本気で稼ぎたいならPlus一択。
🤝 スキルを売るならココナラが最短
「AIで○○します」という出品が爆増中。ライティング、画像生成、プロンプト作成……AIスキルがあるなら、ココナラで今すぐ出品できる。初月から売上が立つ人も多い。
まとめ
AI文字起こし副業は、ツールを使いこなせる人と丁寧な修正ができる人が稼げる副業だ。
- Nottaは日本語精度と使いやすさのバランスが最高
- Whisperは大量処理をコスト効率よくこなしたい人向け
- 修正スキルを磨くことで時給1,500〜3,000円も十分狙える
- クラウドワークスで実績を積み、継続案件につなげるのが王道
月2万円は現実的な目標で、ツール習熟から3〜4ヶ月で達成できる。まずはNottaの無料プランで1件試してみることから始めよう。
関連記事:
– AI副業おすすめランキング2026
– AIツール無料おすすめ一覧
この記事で紹介したツール
| ツール名 | カテゴリ | リンク |
|---|---|---|
| クラウドワークス | クラウドソーシング | クラウドワークスで案件を探す → |
| ココナラ | クラウドソーシング | ココナラでスキルを販売する → |

