MP3 in testo
Trascrizione MP3 gratuita
Trascrizione IA gratuita per qualsiasi MP3. Rilascia il file, ottieni il testo in pochi secondi. Senza account, senza tariffa al minuto, senza email.
Trascina il tuo file qui
o clicca per sfogliare
MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC · Max 25 MB · Max 30 min (60 min · Accedi)
Come funziona
Rilascia l'MP3
Qualsiasi MP3 funziona. Download di podcast, export di memo vocale, rip audio, file di voce generata da IA. Trascina o clicca per scegliere.
L'IA trascrive
Whisper large-v3 legge l'MP3 e converte la voce in testo. Un podcast tipico da 30 minuti finisce in circa un minuto. Un memo vocale da 5 minuti in circa 15 secondi.
Copia, scarica o modifica
Leggilo nel browser, copia negli appunti o scarica come TXT o SRT. Correggi le parole sbagliate inline prima di esportare.
Perché Mictoo per MP3
Whisper large-v3, non un modello sfoltito per i gratuiti
Non gestiamo un modello più piccolo "per utenti free" e uno più grosso per i paganti. Stesso modello, stessa precisione, ogni file.
Specificità MP3 gestite bene
MP3 è lossy, e alcuni strumenti si strozzano su file molto compressi (32 kbps, mono, sample rate basso). Whisper li gestisce senza lamentele. Abbiamo visto trascrizioni leggibili da MP3 di telefonate a 24 kbps.
Nessuna conversione di file richiesta
Alcuni strumenti "MP3 in testo" vogliono WAV in segreto e ri-codificano il tuo MP3 prima. Noi mandiamo l'MP3 direttamente al modello. Più veloce, senza la perdita di una seconda codifica.
Nessun contatore al minuto
Alcuni concorrenti ti danno 60 minuti gratis al mese, poi addebitano 25 centesimi al minuto. Noi siamo finanziati dalla pubblicità, senza limite di minuti. Trascrivi un file o cento.
Privacy di default
L'MP3 va al provider di voce, viene trascritto, poi scartato. Non scriviamo mai il tuo audio su disco dalla nostra parte.
A cosa serve la gente "MP3 in testo"
Episodi di podcast
Trascina l'MP3 dal tuo hosting podcast (Anchor, Buzzsprout, Transistor) e ottieni il testo per show notes, riuso in blog o accessibilità.
Registrazioni di telefonate
MP3 è l'export standard della maggior parte delle app di registrazione chiamate. Trascrivi per scorrere velocemente una chiamata lunga e trovare la parte che conta.
Memo vocali esportati dal telefono
I Memo Vocali iPhone sono M4A di default, ma se ne hai inviato uno via AirDrop come MP3 o usato un'app Android che salva in MP3, questo è il tuo strumento.
Estratti di audiolibri o rip di lezioni
Per studiare, avere il testo accanto all'audio raddoppia la memorizzazione. Resta solo dal lato giusto del copyright.
Voci IA e output TTS
Se hai generato voce con ElevenLabs, OpenAI TTS, Murf o qualsiasi altro strumento di sintesi, potresti volere una trascrizione pulita di ritorno per lavoro su sottotitoli o allineamento.
Consigli per la trascrizione MP3
Bitrate costante meglio di variabile per Whisper
MP3 VBR (variable bitrate) può confondere alcuni decoder audio in casi limite. Se controlli l'export, scegli CBR a 64 o 96 kbps mono. Meno lavoro per il modello.
64 kbps mono è il punto dolce per voce in MP3
Più alto è spreco per la voce. Un episodio da 60 minuti a 64 kbps mono è circa 28 MB. Sta comodo nel tier gratuito da 25 MB, o comodamente nel tier da 60 MB con login.
Se l'MP3 è enorme (oltre 60 MB), ri-codifica prima di dividere
Dividere e poi trascrivere due file è più lavoro che ri-codificare una volta a bitrate più basso. ffmpeg: ffmpeg -i big.mp3 -ac 1 -b:a 64k small.mp3. Un originale di 200 MB scende a 25-40 MB.
Togli i metadati ID3 se il file è al limite
I tag ID3 (cover, testi, ecc.) possono aggiungere diversi MB a un MP3. Se sei 1-2 MB sopra il limite, togliere i tag con ffmpeg -i in.mp3 -map_metadata -1 -c:a copy out.mp3 può bastare.
Codifica MP3 cattiva di vecchi convertitori causa gap silenziosi
Se la trascrizione salta sezioni, l'MP3 potrebbe avere effettivi gap silenziosi da un encoder buggato. Ri-codifica dalla sorgente se ce l'hai, o usa Find Silence di Audacity per confermare.
Per MP3 di telefonate (8 kHz mono), aspettati precisione leggermente più bassa
L'audio telefonico perde le alte frequenze, il che ti costa qualche punto di precisione. Resta leggibile, pianifica solo più pulizia su nomi e numeri.
Domande frequenti
MP3 è il formato migliore per la trascrizione?
Per la maggior parte degli utenti, sì. MP3 è piccolo, supportato ovunque, e la precisione con Whisper è essenzialmente identica a WAV o FLAC. Usa lossless (WAV, FLAC) solo se hai bisogno dell'audio anche per editing dopo.
Quali bitrate MP3 funzionano meglio?
Qualsiasi da 32 kbps mono a 320 kbps stereo. Per la voce, 64-96 kbps mono è il punto dolce pratico. Più alto non migliora la trascrizione, più basso inizia a perdere intelligibilità per il modello.
Il mio MP3 supera i 60 MB. E ora?
Due opzioni. Ri-codificare a bitrate più basso (64 kbps mono divide la maggior parte degli MP3 per 4 o più), o dividere il file in pezzi sotto i 60 MB. Abbiamo guide per entrambi.
Quanto ci mette a trascrivere un MP3?
Circa l'1-2% della durata audio. Un MP3 da 60 minuti finisce in circa 60 secondi. Uno da 10 minuti in 10-20 secondi. L'upload di rete è di solito l'attesa più lunga.
Il mio MP3 verrà salvato o condiviso?
No. Il file va al nostro provider di voce (Groq, con OpenAI come backup), viene trascritto, poi scartato. Non lo scriviamo sui nostri server, e i provider che usiamo non si addestrano sui dati API.
Posso caricare più MP3 in batch?
Non in un click per ora. Adesso trascrivi un file alla volta. L'upload batch è nella roadmap per il piano Pro a pagamento.
Quali lingue supportate?
Oltre 50 lingue. Il rilevamento automatico gestisce la maggior parte dei casi. Per file sotto i 5 minuti o file che iniziano con musica o silenzio, scegli la lingua manualmente.
Posso ottenere timecode da un MP3?
Sì. Scarica come SRT (file sottotitoli) e ottieni timecode ogni pochi secondi. Oppure usa la nostra pagina Trascrizione con timecode per granularità a livello di parola.
Mictoo funziona con MP3 di podcast con marker di capitoli?
Estraiamo l'audio e ignoriamo i metadati dei capitoli. Ottieni la trascrizione completa come un documento. Se vuoi trascrizioni allineate ai capitoli, dividi l'MP3 ai confini dei capitoli prima.
La trascrizione del mio MP3 avrà etichette dei parlanti?
Non automaticamente. Whisper non fa diarizzazione di default. Se servono etichette, carica la traccia di ogni parlante separatamente (se le hai) e etichettale tu.
Posso trascrivere un MP3 di voce generata da IA?
Sì. L'audio TTS (ElevenLabs, OpenAI, Murf, ecc.) di solito si trascrive più pulito della voce umana perché non c'è rumore di fondo o esitazione.
Il mio MP3 è in una lingua rara. Funzionerà?
Se Whisper supporta la lingua, sì. Il modello copre oltre 50 lingue con buona precisione e supporto base per molte altre. Prova. Se il risultato è inutilizzabile, la lingua è probabilmente fuori dai dati di training.
Pronto a trascrivere?
Scorri in alto e rilascia il file. La trascrizione è pronta in circa un minuto.
↑ Torna al caricamento