mictoo
MP4 · MOV · WEBM · GRÁTIS

Vídeo em texto
Transcrição IA grátis de vídeo

Transcrição IA grátis para qualquer arquivo de vídeo. Extraímos o áudio automaticamente. Sem conta, sem cobrança por minuto, sem e-mail.

Resumo com IATraduzir, 28 idiomasOpenAI Whisper
Buscamos as legendas do vídeo. Grátis.
ou envie um arquivo

Solte seu arquivo aqui

ou clique para procurar

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Máx. 25 MB  ·  Máx. 30 min (60 min · Entrar)

Arquivo maior? Veja como comprimir.

Gravação mais longa? Veja como dividir.

Como funciona

🎬

Solte o vídeo ou cole uma URL do YouTube

MP4, MOV, WEBM, AVI ou qualquer container de vídeo comum. Screencasts, vlogs, exports de webinar, MP4s do Zoom. Arraste ou clique para escolher. Novo: cole um link do YouTube em vez de subir e puxamos a transcrição em segundos, sem necessidade de download.

Extraímos o áudio, a IA transcreve

Pegamos a trilha de áudio do vídeo e mandamos só ela para o Whisper large-v3. Não precisa converter para MP3 antes. Um vídeo de 30 minutos costuma ficar pronto em cerca de um minuto.

📋

Copie, baixe ou pegue legendas

Baixe como TXT para notas, ou SRT para colocar como legenda num editor de vídeo. Corrija palavras erradas no navegador antes de exportar.

Por que Mictoo para vídeo

Cole uma URL do YouTube direto

Pule o passo de download para vídeos do YouTube: solte o link no campo acima da área de upload e a transcrição volta em segundos. Para vídeos sem legendas, envie o arquivo de áudio e o Whisper resolve.

Extração de áudio é automática

Você solta o MP4. Nós tiramos o áudio internamente e mandamos ao modelo de fala. Você não precisa rodar ffmpeg.

A saída funciona em editores de vídeo reais

O SRT que geramos funciona no Premiere Pro, DaVinci Resolve, Final Cut, CapCut e YouTube Studio. Os timecodes são frame-accurate.

Arquivos de vídeo grandes? Comprima o áudio, não o vídeo

Um vídeo de 200 MB costuma ser 195 MB de vídeo e 5 MB de áudio. Você não precisa comprimir tudo, só a trilha de áudio.

Nenhum arquivo é guardado

O vídeo chega aqui, extraímos o áudio, mandamos ao provedor de transcrição e descartamos os dois. Não guardamos seu vídeo nem seu áudio nos nossos servidores.

Para que a transcrição de vídeo serve

Legendas para vídeos de redes sociais

TikTok, Instagram Reels, YouTube Shorts todos se beneficiam de legendas queimadas. Gere o SRT aqui, importe no CapCut ou Premiere, estilize as legendas ao gosto e queime no vídeo.

Tutoriais e conteúdo de cursos

Se você grava tutoriais em screencast, ter uma versão em texto ajuda SEO, acessibilidade e tradução. Cole a transcrição no seu blog ou plataforma de curso ao lado do vídeo.

Follow-ups de webinar

Você fez um webinar de uma hora. Transcreva a gravação, edite levemente e mande como e-mail de follow-up para os participantes que não conseguiram ficar até o fim.

Cortes de entrevista para edição

Editando uma entrevista de vídeo longa, dá para fazer um "paper edit" com a transcrição num segundo monitor. Marca as linhas que quer, acha na timeline, muito mais rápido que ficar fazendo scrub.

Preparação para tradução e dublagem

Transcreva no idioma original, passe o texto pelo DeepL ou ChatGPT para traduzir e use como roteiro para dublagem ou tradução de legendas.

Dicas para transcrição de vídeo

1

Extraia o áudio antes se o vídeo passa de 60 MB

Um vídeo 1080p é principalmente bytes de pixels que jogamos fora de qualquer jeito. Pegue só a trilha de áudio: ffmpeg -i video.mp4 -vn -ac 1 -b:a 64k audio.mp3. Um vídeo de 500 MB encolhe para menos de 30 MB de áudio.

2

Silencie música de fundo no editor antes de exportar

Se o vídeo tem música por baixo do diálogo (B-roll, intro, transições), abaixe ou silencie a trilha musical no editor antes de exportar a versão para upload. O Whisper às vezes inventa palavras quando a fala está enterrada sob música.

3

Screencasts sem música são os mais fáceis

Gravações de Loom, Zoom, OBS de alguém falando sobre slides geram as transcrições mais limpas. Sem música, uma voz, microfone claro. Você pega precisão quase humana.

4

Em vídeos multi-orador, grave faixas separadas se possível

Se você controla a gravação, grave cada orador na faixa dele. Transcreva cada faixa separadamente. Atribuição mais limpa, menos erros em sobreposição.

5

O framerate não importa, só a qualidade do áudio

O Whisper não olha para o vídeo, só para o áudio. Um vídeo 4K com áudio ruim transcreve pior que um 480p com microfone lavalier. Coloque o esforço no áudio.

6

Timecodes de SRT precisam de um pequeno offset em alguns editores

A maioria dos editores alinha timecodes de SRT perfeitamente. Alguns editores mais velhos esperam que a primeira legenda comece em 00:00:01,000 em vez de 00:00:00,000. Se as legendas estão deslocadas por um segundo, é normalmente isso.

Perguntas frequentes

Quais formatos de vídeo vocês suportam?

MP4, MOV, WEBM, AVI, MKV, FLV. Se o vídeo roda no VLC, quase certamente funciona aqui. Extraímos o áudio internamente, então o codec de vídeo quase não importa.

Meu arquivo de vídeo é grande demais para upload. E agora?

Duas opções. Extraia só o áudio primeiro (um comando ffmpeg, veja Dicas acima) e envie isso. Ou use um export menor do seu editor (resolução ou bitrate menor). Para arquivos acima de 60 MB, extrair áudio é mais rápido.

Posso pegar legendas SRT, não só texto puro?

Sim. Depois da transcrição, clique em "Baixar como SRT". O SRT funciona no YouTube Studio, Premiere Pro, DaVinci Resolve, Final Cut, CapCut e qualquer editor de vídeo padrão.

Os timings do SRT batem certinho com os frames do meu vídeo?

Sim. Timecodes de SRT são em milissegundos, mais preciso que qualquer framerate de vídeo. Calzam corretamente em 24, 25, 29.97, 30, 50 e 60 fps.

Posso transcrever um vídeo sem som (só texto na tela)?

Não. Transcrevemos áudio falado. Para reconhecer texto na tela você precisa de OCR, é outra ferramenta.

Quão precisa é vídeo em texto?

Depende do áudio. Voiceover limpo: precisão quase humana (95% ou melhor). Vídeos de conferência com acústica de sala ruim: cerca de 85-90%. Vídeos pesados em música com diálogo baixo: mais abaixo.

Meu vídeo é enviado para o YouTube ou serviços de terceiros?

Não. Seu vídeo é enviado ao nosso provedor de transcrição e descartado. Nada é enviado ao YouTube, Google ou outro lugar. Não estamos no negócio de cloud video storage.

Posso editar a transcrição antes do download?

Sim. Corrija palavras erradas no navegador antes de exportar. Útil para nomes próprios e termos técnicos.

Vocês suportam vídeo 360 ou formatos de VR?

O codec de vídeo não importa para nós. Enquanto o arquivo é um container padrão (MP4, MOV) com uma trilha de áudio, extraímos o áudio e transcrevemos.

E se meu vídeo tem várias trilhas de áudio (comentário, original, música)?

Usamos só a trilha padrão. Se você quer uma específica, reexporte o vídeo com aquela trilha como padrão, ou extraia a trilha desejada e envie como áudio.

Tem limite de duração para vídeos?

30 minutos por arquivo grátis, 60 minutos com cadastro. Para vídeos mais longos, divida em pedaços. As transcrições podem ser recombinadas depois.

Posso transcrever um stream ao vivo?

Não. Trabalhamos só com arquivos gravados. Para transcrição ao vivo você precisa de outra categoria de ferramenta.

Pronto para transcrever?

Role para cima e solte seu arquivo. A transcrição fica pronta em cerca de um minuto.

↑ Voltar ao uploader