タイムコード付き文字起こし
無料タイムコード付き文字起こし
音声の各行または単語の正確なタイムコード。正確な瞬間に戻る、特定の引用、チャプター構築。無料、登録不要。
使い方
ファイルをドロップ
MP3、M4A、MP4、WAV、FLAC、OGG、WEBM、AAC。音声と動画フォーマットで動作。
AIが文字起こしとタイムコード
Whisper large-v3が各セグメント(オプションで各単語)のミリ秒精度タイムコード付き文字起こしを生成。
粒度を選んでダウンロード
文タイムコード(最も一般的)または単語タイムコード(精密な整列作業用)を選択。インラインタイムコード付きTXT、字幕ワークフロー用SRT、またはクリップボードにコピー。
タイムコード付き文字起こしにMictooを使う理由
ミリ秒精度のタイムコード
Whisperはミリ秒精度でタイムコードを出力。任意の一般的な動画フレームレートよりも精密で、引用作業には十分以上。
デフォルトで文レベル、必要なら単語レベル
文レベルは文字起こしを読みやすく保つ。単語レベルはノートには過剰だが、動画編集と音楽整列には不可欠。
無料
分カウンターなし。「タイムコードは別料金」ティアなし。純粋な文字起こしと同じ価格(無料)。
動画ワークフロー用SRTエクスポート
SRTフォーマットのタイムコードはPremiere、DaVinci、CapCut、YouTube Studioで字幕トラックとして直接動作。
引用用TXT内インラインタイムコード
各セグメントの先頭に[00:01:23]マーカー付きプレーンテキスト。研究ノート、ブログ投稿、ジャーナリズムドラフトに簡単に貼り付け。
ファイルは保存されない
音声は文字起こしプロバイダにストリーミングされて破棄。サーバーには何も残りません。
人々がタイムコード付き文字起こしを使う用途
ジャーナリズムと引用
インタビューからソースを引用?ノートで引用の横にタイムコードを置く。編集者やファクトチェッカーが「彼が正確にどこで言ったか」と聞くと、2秒で答えがあります。
ポッドキャスト用チャプターマーカー
文字起こしを生成、自然なセクション遷移をスキャン、それらのタイムコードをポッドキャストホストのチャプター機能にコピー。現代のプレーヤーは再生バーにチャプターを表示。
動画編集のラフカット
文字起こしを取得、残したい行をマーク、タイムコードでタイムライン上で見つける。「ペーパー編集」はスクラブよりずっと速い。
学術研究と質的コーディング
NVivo、Atlas.ti、MAXQDAの研究者はコードで文字起こしセグメントをタグ付け。タイムコードは曖昧な箇所をコード化する時に正確な瞬間のために音声に戻ることを可能にします。
シングアロング動画用音楽整列
カラオケスタイルまたはリリックビデオプロジェクト用の単語タイムコード。各単語は歌われる正確な瞬間に光ります。
タイムコード付き文字起こしのコツ
文タイムコードは95%のユースケースで動作
音楽整列や単語ごとの動画字幕作成をしているのでない限り、文レベルが欲しいもの。より読みやすく、編集しやすい。
単語タイムコードはファイルサイズと複雑さを膨らませる
30分講演の単語SRTは何千ものエントリ。本当に単語精度が必要な時のみ使用。
ポッドキャストでは自然な休憩からチャプターマーカーを生成
文字起こしでトピック遷移、議題変更、ゲスト紹介を探す。それらのタイムコードをポッドキャストホストのチャプターマーカーとしてコピー。
ジャーナリズムでは使う可能性のある引用ごとにタイムコードを保存
3週間後の未来のあなたは、引用がどのインタビューから来たか、ましてやインタビューのどこからかを覚えていません。タイムコードがこれを解決。
SRTタイムコードはゼロパディング、TXTタイムコードはそうでない
SRTは00:01:23,456を使用。TXTは通常[1:23]を使用。フォーマットを期待するCMSに貼り付けるなら、貼り付け前に変換。
動画編集では、私たちのSRTのタイムコードは元のファイルの音声と整列
異なるフレームレートで動画を再エクスポートしても、タイムコードはまだフィット。絶対時間(ミリ秒)で、フレームではないから。
悪い音声ではタイムコードがドリフトする
Whisperが音楽や無音中に単語を幻覚する場合、それらのゴースト単語のタイムコードは推定。実際のスピーチタイムコードは精密のまま。スピーチセクションを信頼し、音楽セクションを無視するだけ。
よくある質問
文タイムコードと単語タイムコードの違いは?
文レベル: テキスト行(通常文)ごとに1つのタイムコード。単語レベル: 単語ごとに1つのタイムコード。文レベルは読みやすく、引用、ポッドキャスティング、ほとんどの動画作業に良い。単語レベルは音楽整列、カラオケ動画、単語ごとの字幕アニメーション用。
タイムコードはどれくらい精度が高い?
Whisperはミリ秒でタイムコードを出力。任意の一般的な動画フレームレート(24、25、29.97、30、50、60 fps)でオフセットなしに正しくフィット。
長いファイルでタイムコードはドリフトしますか?
まれに。Whisperは実際の音声にタイムコードを整列するので、60分ファイルでも精密のまま。非常に長いファイルの最後のセグメントにサブ秒のドリフトが現れることがあります。気づいたら手動で調整。
各行の前に[00:01:23]のようなインラインタイムコード付きTXTを取得できますか?
はい。TXTでダウンロードすれば、文タイムコードをインラインで挿入。フォーマット: [00:01:23] 文テキストここ。
SRTにはタイムコードが含まれますか?
はい、SRTフォーマット全体のポイント。各字幕エントリには開始と終了のタイムコードがあります。
YouTubeのタイムコード付き自動字幕と比較してどうですか?
YouTubeの自動字幕にはタイムコードがありますが、句読点がなく精度が低い。私たちのは完全な句読点、より良い精度、任意の動画エディタで動作する標準SRT出力。
文字起こしから音声の特定のタイムコードにジャンプできますか?
結果ビューで任意のタイムコードをクリックして、音声プレーヤーをその瞬間に設定。ダウンロード後は別の音声プレーヤーが必要。
タイムコードはPremiereやDaVinci Resolveで動作しますか?
はい。SRTをタイムラインにインポート。字幕は自動的に正しい瞬間に表示。
タイムコード付き文字起こしにはどの言語がサポートされていますか?
純粋な文字起こしと同じ50以上の言語。タイムコードは言語に関係なくすべての文字起こしに自動的に付属。
音声は保存されますか?
いいえ。ファイルは文字起こしプロバイダにストリーミングされ、処理後に破棄。
カラオケ動画を作るのに単語タイムコードを使えますか?
はい、ただしJSONまたはSRTフォーマットから単語ごとのハイライトをレンダリングできる動画ソフトウェアが必要。一部のツール(Premiere、After Effects、専門カラオケソフトウェア)は直接サポート。
タイムコード付き文字起こしの生成にはどれくらい時間がかかりますか?
純粋な文字起こしと同じ、音声長さの約1〜2%。タイムコードは自動的に付属、追加処理時間なし。
文字起こしを始めますか?
上にスクロールしてファイルをドロップしてください。約1分でテキストが完成します。
↑ アップローダーに戻る