Audio en texte
Transcription IA gratuite
Transcription IA gratuite pour tout fichier audio. MP3, WAV, M4A, FLAC, OGG, AAC. Sans compte, sans tarif à la minute.
Déposez votre fichier ici
ou cliquez pour parcourir
MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC · Max 25 Mo · Max 30 min (60 min · Connexion)
Comment ça marche
Déposez l'audio
Tout format courant fonctionne. MP3 du téléphone, WAV d'un enregistreur, M4A des mémos vocaux iPhone, FLAC d'un export podcast. Glissez le fichier ou cliquez pour le choisir.
L'IA transcrit
On utilise OpenAI Whisper large-v3. Un fichier de 10 minutes prend environ 20 secondes. Un fichier de 30 minutes, moins d'une minute.
Copiez, téléchargez ou éditez
Lisez la transcription dans le navigateur. Téléchargez en TXT pour les notes, ou en SRT si vous voulez des horodatages. Corrigez les mots mal compris avant d'exporter.
Pourquoi Mictoo pour audio en texte
Un seul modèle, et c'est le bon
On utilise Whisper large-v3 pour tout le monde. Pas de combine « la version gratuite tourne sur un modèle moins bon ». Le même modèle qui équipe les transcriptions d'entreprise chères, c'est celui qui transcrit votre fichier.
Support de formats vraiment large
MP3, WAV, M4A, FLAC, OGG, WEBM, AAC, plus les formats vidéo avec audio dedans (MP4, MOV). Pas de friction « on n'accepte que du MP3, convertissez d'abord ».
Plus de 50 langues, y compris les fichiers bilingues
La détection automatique repère la langue dans les premières secondes. Si le fichier change de langue en cours d'enregistrement (fréquent en interview), Whisper suit.
Aucun fichier n'est conservé
Votre audio est transmis au prestataire de transcription, traité, puis supprimé. On n'écrit jamais le fichier dans notre base ou notre stockage. Les prestataires qu'on utilise (Groq, OpenAI) n'entraînent pas sur les données API.
Gratuit sans astérisque
Jusqu'à 30 minutes par fichier sans compte. Avec une connexion gratuite, vous passez à 60 minutes. Rien d'autre n'est verrouillé.
Quand l'audio en texte fait vraiment gagner du temps
Notes d'interview
Vous avez passé une heure avec une source. Au lieu de scruter l'enregistrement pour retrouver cette citation, vous faites Ctrl+F dans la transcription. Cinq secondes au lieu de cinq minutes.
Nettoyage de mémos vocaux
Vous avez dicté une idée à moitié formée dans votre téléphone en marchant. Maintenant vous la voulez en texte. Déposez le M4A, recevez des phrases, copiez dans Notion.
Révision de cours et de webinaires
Un cours de deux heures, c'est dur à revoir en x2. La transcription texte vous laisse parcourir section par section et creuser uniquement les parties qui comptent.
Préparation de traduction
Whisper transcrit dans la langue source. À partir de là, vous collez dans DeepL ou ChatGPT et traduisez proprement. Mieux que les traductions automatiques faites direct depuis l'audio brut.
Recherche dans l'archive audio
Des années d'appels, d'épisodes ou de réunions enregistrés ? Lancez la transcription en lot et vous obtenez soudain une archive consultable comme du texte. Moins cher que n'importe quel « assistant IA pour réunion » avec abonnement.
Astuces pour une transcription plus propre
Le mono suffit. La stéréo, c'est de la bande passante gaspillée
La voix n'a pas besoin de deux canaux. Si le fichier est énorme, ré-encodez en mono et vous coupez la taille de moitié sans perte pour la transcription. ffmpeg en une ligne : ffmpeg -i input.wav -ac 1 output.wav.
64 kbps MP3 suffit largement pour la voix
Si vous exportez depuis une DAW ou un éditeur, 64 kbps mono MP3 donne à Whisper tout ce dont il a besoin. Les bitrates plus élevés n'améliorent pas la précision, ils ne font que grossir le fichier.
Coupez les longs silences au début et à la fin
Si votre enregistrement a 90 secondes de blanc avant le premier mot, ces 90 secondes grignotent votre limite de durée. Coupez-les dans Audacity (Effect, Truncate Silence) avant l'upload.
Choisissez la langue manuellement pour les fichiers courts
La détection automatique échantillonne le premier morceau d'audio. Pour les fichiers de moins de 5 minutes, cet échantillon est petit et la détection n'est pas fiable. Sélectionnez la langue explicitement dans le menu.
La musique de fond fait halluciner Whisper
Si votre audio a de la musique sous la parole (jingles sponsorisés, intros, b-roll), le modèle insère parfois des mots inventés pendant les sections musique-seule. Si vous avez une version sans musique, prenez-la.
Pour les fichiers très bruités, nettoyez avant
Options gratuites : Audacity Noise Reduction (intégré), ou Adobe Podcast Enhance (outil web gratuit, étonnamment bon). Passez le fichier une fois, puis chargez la version nettoyée.
Questions fréquentes
Quel est le meilleur convertisseur audio-texte gratuit ?
On est biaisé, mais la réponse honnête : tout outil qui fait tourner Whisper large-v3 est en haut du segment gratuit. Mictoo fait tourner ce modèle sans mur d'inscription. Otter et Trint sont bons mais font payer à la minute au-delà de leur quota gratuit. Pour des transcriptions ponctuelles, le segment gratuit est le bon choix.
Quelle est la précision de l'audio en texte ?
Pour une voix propre dans une langue majeure, comptez 5 à 10 % de taux d'erreur sur les mots. Pour de l'audio bruité, des accents marqués ou un vocabulaire spécialisé, la précision baisse. Pour la plupart des usages (notes, recherche, brouillons), c'est largement suffisant. Pour des dossiers juridiques ou médicaux, prenez un humain.
Quels formats audio supportez-vous ?
MP3, WAV, M4A, FLAC, OGG, WEBM, AAC. Aussi les fichiers vidéo comme MP4 et MOV (on extrait l'audio automatiquement). AIFF et ALAC ne sont pas supportés directement. Convertissez-les d'abord en WAV ou FLAC.
Combien de temps prend la transcription ?
Un fichier de 5 minutes finit en général en 10 à 15 secondes. Un fichier de 30 minutes en 45 à 60 secondes. On traite le fichier entier en une seule requête, pas besoin de le découper de votre côté.
Puis-je transcrire l'enregistrement d'un appel téléphonique ?
Oui. Les appels sont en général en 8 kHz mono avec un peu de compression. Whisper les gère, la précision est un peu plus basse que pour de l'audio studio. Vérifiez que l'enregistrement de l'appel est légal dans votre juridiction.
Faut-il choisir la langue ?
Non, la détection automatique est activée par défaut. Pour de l'audio de moins de 5 minutes ou des fichiers qui commencent par autre chose que de la parole, choisissez la langue manuellement pour des résultats plus fiables.
Y a-t-il un coût à la minute ?
Aucun frais. La transcription est gratuite, sans compteur à la minute. On se finance via la publicité display et un futur tier Pro pour les gros utilisateurs.
Quelle est la taille de fichier maximale ?
25 Mo sans compte, 60 Mo une fois connecté (toujours gratuit). Si le fichier est plus gros, voyez notre guide de compression.
Mon audio est-il stocké sur vos serveurs ?
Non. On transmet le fichier directement au prestataire de transcription, on récupère le texte, on jette l'audio. Rien n'est écrit dans notre base ni dans notre stockage.
Puis-je éditer la transcription avant de la télécharger ?
Oui. Après la transcription, corrigez les mots faux directement dans le visualiseur, puis téléchargez la version éditée.
Quels formats de sortie sont disponibles ?
Texte simple (TXT), fichier de sous-titres (SRT) avec horodatages, et copie dans le presse-papiers. Le SRT fonctionne dans YouTube Studio, Premiere Pro, DaVinci Resolve et tout éditeur vidéo standard.
Mictoo fonctionne-t-il sur mobile ?
Oui. Le site est adapté aux mobiles. Vous pouvez uploader directement depuis votre téléphone, y compris depuis l'app Fichiers iOS ou le dossier de téléchargements Android.
Prêt à transcrire ?
Remontez et déposez votre fichier. La transcription est prête en environ une minute.
↑ Retour à l'uploaderPlus d'outils de transcription