動画をテキストに
無料AI動画文字起こし
任意の動画ファイルの無料AI文字起こし。音声を自動抽出します。アカウント不要、分単位課金なし、メール不要。
使い方
動画をドロップ — またはYouTube URLを貼る
MP4、MOV、WEBM、AVI、その他一般的な動画コンテナに対応。スクリーンレコーディング、Vログ、ウェビナーのエクスポート、ZoomのMP4。ドラッグするかクリックして選択。新機能: アップロードの代わりにYouTubeリンクを貼れば、ダウンロード不要で数秒で文字起こしを取得できます。
音声を抽出してAIが文字起こし
動画から音声トラックを取り出して、それだけをWhisper large-v3に送ります。先にMP3に変換する必要はありません。30分の動画は通常約1分で完了。
コピー、ダウンロード、字幕取得
メモ用にTXT、または動画エディターに字幕として入れるためにSRTでダウンロード。エクスポート前に誤った単語をブラウザで修正。
なぜMictooが動画に向いているか
YouTubeのURLを直接貼り付け
YouTube動画ならダウンロード作業をスキップ。ドロップゾーン上のフィールドにリンクを貼れば、数秒で文字起こしが返ってきます。字幕がない動画は音声ファイルをアップロードすれば、Whisperが処理します。
音声抽出は自動
MP4をドロップ。内部で音声を取り出して音声モデルに送ります。自分でffmpegを実行する必要はありません。
出力は本物の動画エディターで動作
生成するSRTはPremiere Pro、DaVinci Resolve、Final Cut、CapCut、YouTube Studioで動作します。タイムコードはフレーム精度。
動画ファイルが大きい?動画ではなく音声を圧縮
200 MBの動画は通常195 MBの動画と5 MBの音声。全部を圧縮する必要はなく、音声トラックだけです。
ファイルは保存されない
動画が私たちに届き、音声を抽出して文字起こしプロバイダに送り、両方を破棄します。動画も音声もサーバーに保持しません。
動画文字起こしの用途
ソーシャルメディア動画の字幕
TikTok、Instagram Reels、YouTube Shortsは焼き付け字幕の恩恵を受けます。ここでSRTを生成し、CapCutやPremiereにインポートし、字幕を好みのスタイルにして動画に焼き付け。
チュートリアルとコースコンテンツ
スクリーンキャストチュートリアルを録画する場合、テキストバージョンがあるとSEO、アクセシビリティ、翻訳に役立ちます。動画の横に文字起こしをブログやコースプラットフォームに貼り付け。
ウェビナーのフォローアップ
1時間のウェビナーをやりました。録画を文字起こしし、軽く編集し、最後まで残れなかった参加者にフォローアップメールとして送信。
編集用のインタビューカット
長いビデオインタビューを編集する時、第2モニターで文字起こしを使って「ペーパー編集」ができます。残したいラインをマーク、タイムラインで見つける、スクラブよりずっと速い。
翻訳と吹替の準備
ソース言語で文字起こし、DeepLやChatGPTでテキストを翻訳、それを吹替や字幕翻訳のスクリプトとして使用。
動画文字起こしのコツ
動画が60 MB超なら先に音声を抽出
1080p動画は主にピクセルバイトで、どうせ捨てます。音声トラックだけ取り出す: ffmpeg -i video.mp4 -vn -ac 1 -b:a 64k audio.mp3。500 MBの動画が30 MB未満の音声に。
エクスポート前にエディタでバックグラウンドミュージックをミュート
動画のダイアログの下に音楽がある場合(Bロール、イントロ、トランジション)、アップロード用バージョンをエクスポートする前にエディタで音楽トラックをミュートまたはダウン。Whisperは音楽の下に埋もれたスピーチで時々単語を作ります。
音楽なしのスクリーンキャストが最も簡単
誰かがスライドについて話すLoom、Zoom、OBSの録画は最もクリーンな文字起こしを生みます。音楽なし、1つの声、クリアなマイク。ほぼ人間レベルの精度。
マルチスピーカー動画は可能なら別々のトラックを録音
録画をコントロールできるなら、各スピーカーを自分のトラックに録音。各トラックを別々に文字起こし。よりクリーンな帰属、重なりでのエラーが少ない。
フレームレートは関係ない、音声の品質だけ
Whisperは動画を見ません、音声だけ。悪い音声の4K動画はラベリアマイクの480p動画よりも文字起こしが悪い。努力は音声に注いでください。
SRTタイムコードは一部のエディタで小さなオフセットが必要
ほとんどのエディタはSRTタイムコードを完璧に整列します。古いエディタの中には最初の字幕が00:00:00,000ではなく00:00:01,000から始まることを期待するものもあります。字幕が1秒ずれている場合、通常これが原因です。
よくある質問
どの動画フォーマットに対応していますか?
MP4、MOV、WEBM、AVI、MKV、FLV。動画がVLCで再生できるなら、ここでもほぼ確実に動作します。音声を内部で抽出するので、動画コーデックはほとんど関係ありません。
動画ファイルがアップロードに大きすぎます。どうすれば?
2つのオプション。まず音声だけ抽出(ffmpegコマンド1つ、上記のコツ参照)してそれをアップロード。またはエディタからより小さいエクスポート(低解像度または低ビットレート)を使用。60 MB超のファイルには音声抽出が速い。
プレーンテキストだけでなくSRT字幕を取得できますか?
はい。文字起こし後、「SRTとしてダウンロード」をクリック。SRTはYouTube Studio、Premiere Pro、DaVinci Resolve、Final Cut、CapCut、任意の標準動画エディタで動作。
SRTのタイミングは動画のフレームと正確に一致しますか?
はい。SRTタイムコードはミリ秒単位で、任意の動画フレームレートよりも精密です。24、25、29.97、30、50、60 fpsで正しくフィットします。
音声なしの動画(画面上のテキストのみ)を文字起こしできますか?
いいえ。話された音声を文字起こしします。画面上のテキスト認識にはOCRが必要で、別のツールです。
動画からテキストへの精度はどれくらい?
音声によります。クリーンなボイスオーバー: ほぼ人間レベルの精度(95%以上)。室内音響の悪い会議動画: 約85〜90%。ダイアログの低い音楽中心の動画: それより下。
私の動画はYouTubeや第三者サービスにアップロードされますか?
いいえ。あなたの動画は文字起こしプロバイダにストリーミングされて破棄されます。YouTube、Google、その他にも何もアップロードされません。クラウドビデオストレージビジネスではありません。
ダウンロード前に文字起こしを編集できますか?
はい。エクスポート前にブラウザで誤った単語を修正。固有名詞や専門用語に便利。
360動画やVR動画フォーマットをサポートしていますか?
動画コーデックは私たちには関係ありません。ファイルが標準コンテナ(MP4、MOV)で音声トラックを含む限り、音声を抽出して文字起こしします。
動画に複数の音声トラック(コメント、オリジナル、音楽)がある場合は?
デフォルトトラックのみを使います。特定のトラックが欲しい場合は、そのトラックをデフォルトとして動画を再エクスポートするか、希望のトラックを抽出して音声としてアップロード。
動画の長さ制限はありますか?
無料で1ファイルあたり30分、登録で60分。長い動画はチャンクに分割。文字起こしは後で再結合できます。
ライブ動画ストリームを文字起こしできますか?
いいえ。録画されたファイルのみで動作します。ライブ文字起こしには別のカテゴリのツールが必要です。
文字起こしを始めますか?
上にスクロールしてファイルをドロップしてください。約1分でテキストが完成します。
↑ アップローダーに戻る