mictoo
MP3 · GRÁTIS · SEM CADASTRO

MP3 em texto
Transcrição grátis de MP3

Transcrição IA grátis para qualquer MP3. Solte o arquivo, receba o texto em segundos. Sem conta, sem cobrança por minuto, sem e-mail.

Resumo com IATraduzir, 28 idiomasOpenAI Whisper

Solte seu arquivo aqui

ou clique para procurar

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Máx. 25 MB  ·  Máx. 30 min (60 min · Entrar)

Arquivo maior? Veja como comprimir.

Gravação mais longa? Veja como dividir.

Como funciona

📂

Solte o MP3

Qualquer MP3 funciona. Download de podcast, export de memo de voz, rip de áudio, arquivos de voz gerada por IA. Arraste ou clique para escolher.

A IA transcreve

O Whisper large-v3 lê o MP3 e converte a fala em texto. Um podcast típico de 30 minutos termina em cerca de um minuto. Um memo de voz de 5 minutos em cerca de 15 segundos.

📋

Copie, baixe ou edite

Leia no navegador, copie para a área de transferência ou baixe como TXT ou SRT. Corrija palavras erradas inline antes de exportar.

Por que Mictoo para MP3

Whisper large-v3, não um modelo encolhido para o tier grátis

Não rodamos um modelo menor "para usuários free" e um maior para pagantes. Mesmo modelo, mesma precisão, todo arquivo.

Particularidades de MP3 bem tratadas

MP3 é com perdas, e algumas ferramentas engasgam em arquivos muito comprimidos (32 kbps, mono, sample rate baixo). O Whisper lida sem reclamar. Já vimos transcrições legíveis de MP3 de chamadas a 24 kbps.

Sem conversão de arquivo necessária

Algumas ferramentas "MP3 em texto" querem WAV por baixo e reencodam seu MP3 antes. Nós mandamos o MP3 direto ao modelo. Mais rápido, sem a perda de uma segunda encodagem.

Sem contador por minuto

Alguns concorrentes te dão 60 minutos grátis por mês e depois cobram 25 centavos por minuto. Nós somos financiados por publicidade, sem limite de minutos. Transcreva um arquivo ou cem.

Privacidade por padrão

O MP3 vai ao provedor de voz, é transcrito e descartado. Nunca gravamos seu áudio em disco do nosso lado.

Para que as pessoas usam "MP3 em texto"

Episódios de podcast

Arraste o MP3 do seu host de podcast (Anchor, Buzzsprout, Transistor) e ganhe o texto para show notes, reuso em blog ou acessibilidade.

Gravações de chamadas

MP3 é o export padrão da maioria dos apps de gravação de chamada. Transcreva para escanear rápido uma call longa e achar a parte que importa.

Memos de voz exportados do celular

Memos de Voz do iPhone são M4A por padrão, mas se você enviou um por AirDrop como MP3 ou usou um app Android que salva em MP3, esta é a ferramenta.

Trechos de audiobook ou rips de aula

Para estudo, ter o texto ao lado do áudio dobra a retenção. Só fique do lado certo do copyright.

Vozes IA e saídas TTS

Se você gerou voz com ElevenLabs, OpenAI TTS, Murf ou qualquer outra ferramenta de síntese, talvez queira a transcrição limpa de volta para trabalho de legenda ou alinhamento.

Dicas para transcrição de MP3

1

Bitrate constante melhor que variável para o Whisper

MP3 VBR (variable bitrate) pode confundir alguns decoders de áudio em casos extremos. Se você controla o export, escolha CBR a 64 ou 96 kbps mono. Menos trabalho para o modelo.

2

64 kbps mono é o ponto doce para voz em MP3

Maior que isso é desperdício para fala. Um episódio de 60 minutos a 64 kbps mono tem cerca de 28 MB. Cabe no tier grátis de 25 MB, ou confortavelmente no tier de 60 MB com login.

3

Se o MP3 está enorme (acima de 60 MB), reencode antes de dividir

Dividir e depois transcrever dois arquivos dá mais trabalho que reencodar uma vez a bitrate menor. ffmpeg: ffmpeg -i big.mp3 -ac 1 -b:a 64k small.mp3. Um original de 200 MB cai para 25-40 MB.

4

Remova metadados ID3 se o arquivo está no limite

Tags ID3 (capa, letras, etc.) podem somar vários MB num MP3. Se você está 1-2 MB acima do limite, remover tags com ffmpeg -i in.mp3 -map_metadata -1 -c:a copy out.mp3 pode bastar.

5

Encodagem MP3 ruim de conversores velhos causa gaps de silêncio

Se a transcrição pula trechos, o MP3 pode ter gaps reais de silêncio de um encoder bugado. Reencode da fonte se tiver, ou use o Find Silence do Audacity para confirmar.

6

Para MP3 de chamadas telefônicas (8 kHz mono), espere precisão um pouco menor

Áudio de telefone perde as frequências altas, o que custa alguns pontos de precisão. Continua legível, só planeje mais limpeza em nomes e números.

Perguntas frequentes

MP3 é o melhor formato para transcrição?

Para a maioria dos usuários, sim. MP3 é pequeno, suportado em toda parte, e a precisão com o Whisper é praticamente idêntica a WAV ou FLAC. Use lossless (WAV, FLAC) só se você também precisa do áudio para edição depois.

Quais bitrates de MP3 funcionam melhor?

Qualquer um de 32 kbps mono a 320 kbps stereo. Para voz, 64-96 kbps mono é o ponto doce prático. Maior não melhora a transcrição, menor começa a perder inteligibilidade para o modelo.

Meu MP3 passa de 60 MB. E agora?

Duas opções. Reencodar a bitrate menor (64 kbps mono divide a maioria dos MP3 por 4 ou mais), ou dividir o arquivo em pedaços abaixo de 60 MB. Temos guias para os dois.

Quanto demora para transcrever um MP3?

Cerca de 1-2% da duração do áudio. Um MP3 de 60 minutos fica pronto em cerca de 60 segundos. Um de 10 minutos em 10-20 segundos. O upload pela rede costuma ser a espera mais longa.

Meu MP3 vai ser salvo ou compartilhado?

Não. O arquivo vai ao nosso provedor de voz (Groq, com OpenAI como backup), é transcrito e descartado. Não gravamos nos nossos servidores, e os provedores que usamos não treinam em dados de API.

Posso enviar vários MP3 em lote?

Ainda não num clique. Por enquanto você transcreve um arquivo por vez. Upload em lote está no roadmap para o plano Pro pago.

Quais idiomas vocês suportam?

Mais de 50 idiomas. Detecção automática lida com a maioria dos casos. Para arquivos abaixo de 5 minutos ou arquivos que começam com música ou silêncio, escolha o idioma manualmente.

Consigo timecode a partir de um MP3?

Sim. Baixe como SRT (arquivo de legenda) e receba timecode a cada poucos segundos. Ou use nossa página de Transcrição com timecode para granularidade por palavra.

O Mictoo funciona com MP3 de podcast com marcadores de capítulo?

Extraímos o áudio e ignoramos metadados de capítulo. Você recebe a transcrição completa como um documento. Se quiser transcrições alinhadas aos capítulos, divida o MP3 nos limites dos capítulos antes.

A transcrição do meu MP3 vai ter etiquetas de oradores?

Não automaticamente. O Whisper não faz diarização por padrão. Se precisar de etiquetas, envie a faixa de cada orador separadamente (se você as tem) e etiquete você mesmo.

Posso transcrever um MP3 de voz gerada por IA?

Sim. Áudio TTS (ElevenLabs, OpenAI, Murf, etc.) costuma transcrever mais limpo que voz humana, porque não tem ruído de fundo nem hesitação.

Meu MP3 está num idioma raro. Vai funcionar?

Se o Whisper suporta o idioma, sim. O modelo cobre mais de 50 idiomas com boa precisão e suporte básico para muitos outros. Teste. Se o resultado for inutilizável, o idioma provavelmente está fora dos dados de treino.

Pronto para transcrever?

Role para cima e solte seu arquivo. A transcrição fica pronta em cerca de um minuto.

↑ Voltar ao uploader