Question 1

MP3は文字起こしに最適なフォーマットですか?

Accepted Answer

ほとんどのユーザーには、はい。MP3は小さく、どこでもサポートされ、Whisperでの精度はWAVやFLACと実質同じです。ロスレス(WAV、FLAC)は編集にも音声が必要な場合だけ使ってください。

Question 2

どのMP3ビットレートが最適?

Accepted Answer

32 kbpsモノラルから320 kbpsステレオまで何でも。音声には64〜96 kbpsモノラルが実用的なスイートスポット。それより高くても文字起こしは改善せず、それより低いとモデルにとっての可解性が下がり始めます。

Question 3

MP3が60 MBを超えます。どうすれば?

Accepted Answer

2つのオプション。低ビットレートに再エンコード(64 kbpsモノラルはほとんどのMP3を4分の1以下に)、または60 MB以下のチャンクに分割。両方のガイドがあります。

Question 4

MP3の文字起こしにどれくらい時間がかかりますか?

Accepted Answer

音声の長さの約1〜2%。60分のMP3は約60秒で完了。10分のは10〜20秒。ネットワークアップロードが通常一番長い待ち時間です。

Question 5

MP3は保存または共有されますか?

Accepted Answer

いいえ。ファイルは音声プロバイダ(Groq、バックアップとしてOpenAI)に行き、文字起こしされて破棄されます。私たちのサーバーには書き込まれず、使用するプロバイダはAPIデータでトレーニングしません。

Question 6

複数のMP3をバッチでアップロードできますか?

Accepted Answer

まだワンクリックではできません。今は1つずつ文字起こしします。バッチアップロードは有料Proプランのロードマップにあります。

Question 7

どの言語をサポートしていますか?

Accepted Answer

50以上の言語。自動検出がほとんどのケースを処理。5分未満のファイルや音楽や無音で始まるファイルでは言語を手動で選んでください。

Question 8

MP3からタイムコードを取得できますか?

Accepted Answer

はい。SRT(字幕ファイル)としてダウンロードすれば数秒ごとのタイムコードが得られます。または単語レベルの粒度はタイムコード付き文字起こしページをお使いください。

Question 9

Mictooはチャプターマーカー付きポッドキャストMP3で動作しますか?

Accepted Answer

音声を抽出してチャプターメタデータは無視します。1つのドキュメントとして完全な文字起こしを取得。チャプター整列文字起こしが必要なら、事前にチャプター境界でMP3を分割してください。

Question 10

MP3の文字起こしにはスピーカーラベルがありますか?

Accepted Answer

デフォルトでは自動的にはありません。Whisperはダイアライゼーションを行いません。ラベルが必要なら、各スピーカーのトラックを別々にアップロードし(あれば)、自分でラベル付けしてください。

Question 11

AI生成音声のMP3を文字起こしできますか?

Accepted Answer

はい。TTS音声(ElevenLabs、OpenAI、Murfなど)は背景ノイズやためらいがないので、人間の声よりクリーンに文字起こしされます。

Question 12

MP3が珍しい言語です。動作しますか?

Accepted Answer

Whisperがその言語をサポートしているなら、はい。モデルは50以上の言語を良好な精度でカバーし、多くの他言語に基本サポートがあります。試してみてください。結果が使えない場合、その言語はトレーニングデータ外の可能性があります。

MP3をテキストに
無料MP3文字起こし

使い方

MP3をドロップ

AIが文字起こし

コピー、ダウンロード、編集

なぜMictooがMP3に向いているか

Whisper large-v3、無料層のために削られたモデルではない

MP3特有の扱いがうまい

ファイル変換不要

分カウンターなし

デフォルトでプライバシー

人々が「MP3をテキストに」を使う目的

ポッドキャストエピソード

通話録音

スマホからエクスポートしたボイスメモ

オーディオブックの抜粋や講義のリップ

AI音声とTTS出力

MP3文字起こしのコツ

可変ビットレートよりも一定ビットレートがWhisperには良い

MP3の音声は64 kbpsモノラルがスイートスポット

MP3が巨大(60 MB超)なら分割前に再エンコード

ファイルがギリギリならID3メタデータを削除

古いコンバータの悪いMP3エンコードは無音ギャップを引き起こす

電話通話のMP3(8 kHzモノラル)は精度がやや低めと見込む

よくある質問

文字起こしを始めますか?

MP3をテキストに無料MP3文字起こし

使い方