mictoo
WAV · PCM · BWF · Gratuit

WAV en Texte
Transcrivez n’importe quel WAV en quelques secondes

Déposez un WAV de votre DAW, enregistreur de terrain ou équipement d’interview. Nous le transformons en une transcription modifiable avec des horodatages et des exports pour TXT, SRT, VTT et DOCX.

AI summaryTranslate, 28 langsOpenAI Whisper

Drop your file here

or click to browse

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Max 25MB  ·  Max 30 min (60 min · Sign in)

Got a bigger file? See how to compress.

Got a longer recording? See how to split.

Les fichiers WAV conservent l’audio original sans compression, c’est exactement pourquoi votre enregistreur, DAW ou équipement de studio a probablement enregistré un. Cette même propriété est la raison pour laquelle les WAV deviennent rapidement volumineux. Mictoo les accepte directement pour que vous n’ayez pas à convertir avant de transcrire.

Déposez le fichier, récupérez une transcription modifiable avec des horodatages, un résumé IA et des exports en un clic vers TXT, SRT, VTT ou DOCX. Utile pour les interviews, les notes de podcast, les archives de conférences, les journaux d’enregistrement sur le terrain et les légendes d’exports DAW.

Gratuit pour les fichiers jusqu’à 60 Mo. Pour les exports de studio plus longs ou les conférences de plusieurs heures, consultez comment compresser l’audio ou comment diviser l’audio avant de télécharger.

How it works

📂

Téléchargez votre WAV

PCM 8 à 32 bits flottant, mono ou stéréo, taux d’échantillonnage de 8 kHz à 192 kHz. Broadcast Wave (BWF) des enregistreurs professionnels Sound Devices, Zaxcom, Tascam fonctionne de la même manière.

L’IA transcrit le discours

Whisper large-v3 lit l’audio et convertit le discours en texte. Un fichier de 30 minutes se termine généralement en moins d’une minute. La vitesse de téléchargement est le goulot d’étranglement pour les gros WAV.

📋

Éditez et exportez

Corrigez les mots incorrects en ligne, puis téléchargez TXT, SRT, VTT ou DOCX. Copiez dans le presse-papiers si vous avez juste besoin du texte. Le résumé IA apparaît automatiquement à côté de la transcription.

Pourquoi utiliser Mictoo pour les fichiers WAV

Transcription directe de WAV, pas de conversion manuelle

Certains transcripteurs gratuits rejettent les WAV et vous disent de convertir d’abord en MP3. Mictoo accepte directement les WAV PCM standard, y compris 24 bits et 32 bits flottant. Une étape de moins dans votre flux de travail.

PCM et Broadcast Wave (BWF) fonctionnent tous deux

Les fichiers BWF des enregistreurs de terrain professionnels contiennent le timecode et les métadonnées de scène dans des morceaux supplémentaires. Nous lisons l’audio, ignorons les morceaux de métadonnées et ne réécrivons jamais votre fichier original. Votre timecode reste intact sur votre disque.

Taux d’échantillonnage et profondeurs de bits que nous gérons réellement

PCM 8 bits, 16 bits, 24 bits, 32 bits entier et 32 bits flottant. Mono et stéréo. Taux d’échantillonnage de 8 kHz à 192 kHz. Les WAV multicanaux sont automatiquement mixés avant la transcription.

Exports utiles prêts à l’emploi

Téléchargez en tant que TXT pour du texte brut, SRT ou VTT pour des sous-titres alignés sur vos horodatages, ou DOCX pour des documents Word prêts à être édités. Copiez dans le presse-papiers lorsque vous voulez simplement coller quelque part.

Conseils pratiques pour les gros fichiers WAV

Le WAV est non compressé, donc les fichiers deviennent rapidement volumineux. Lorsque le vôtre dépasse notre limite de 60 Mo, nous vous le disons immédiatement et vous guidons à travers la recette standard ffmpeg ou Audacity pour le réduire sans perdre la qualité de la transcription.

D’où viennent les fichiers WAV

Interviews

Les journalistes et chercheurs capturent des interviews sur des enregistreurs portables (Zoom H5, H6, Tascam DR-40X) qui par défaut enregistrent en WAV. La transcription devient la source de citations, de références et de l’ébauche de l’article.

Podcasts

Lorsque vous exportez un épisode terminé dans Logic, Reaper ou Pro Tools, le master est généralement un WAV 24 bits. Téléchargez ce WAV (pas le MP3 que vous publiez) pour la transcription la plus propre, qui devient vos notes d’émission et la page de l’épisode optimisée pour le SEO.

Conférences

Les enseignants enregistrant dans Audacity avec un micro USB se retrouvent avec des fichiers WAV mono. Transcrivez chaque conférence pour créer une archive consultable, donnez-la aux étudiants sous forme de légendes ou intégrez-la dans un LMS.

Enregistrements sur le terrain

Les documentaristes et enregistreurs de nature utilisent des équipements Sound Devices ou Zaxcom qui produisent des Broadcast Wave avec timecode. La transcription fournit des journaux de scène que vous pouvez associer à votre timecode sans toucher au fichier original.

Exports DAW et studio

Les narrateurs de livres audio, artistes de voix off, monteurs vidéo exportent tous des intermédiaires WAV 24 bits. Utilisez la transcription WAV pour générer des légendes correspondantes avant que le fichier ne soit compressé pour la livraison.

Audio d’archives

Les bibliothèques, musées et projets d’archives familiales se standardisent sur le WAV 24 bits pour la préservation à long terme. Passez chaque WAV par la transcription une fois et l’archive devient consultable en texte intégral pour toujours.

Paramètres WAV recommandés pour la transcription

1

Visez 16 kHz mono, 16 bits PCM

Whisper rééchantillonne à 16 kHz mono en interne avant la transcription. Le faire de votre côté d’abord rend le fichier environ 12 fois plus petit que l’original 48 kHz stéréo 24 bits, sans différence significative pour un discours clair. Ligne de commande ffmpeg : ffmpeg -i input.wav -ac 1 -ar 16000 -sample_fmt s16 output.wav.

2

Coupez le silence au début et à la fin

Les enregistreurs de terrain laissent souvent 30 à 60 secondes de silence avant et après le contenu réel. Audacity → Effet → Truncate Silence avec les paramètres par défaut le gère rapidement. Économisez votre budget de 60 Mo pour les mots qui comptent.

3

Gardez le WAV original dans votre dossier de projet

Le fichier rééchantillonné est uniquement pour le téléchargement. Votre master original 24 bits reste intact sur votre disque pour toute réédition future, copie d’archive ou export de meilleure qualité.

4

Pour les fichiers très longs, utilisez un MP3 temporaire

Un WAV mono 16 bits 16 kHz de 90 minutes fait encore 173 Mo. Pour les conférences ou podcasts longs, réencodez en un MP3 mono 64 kbps juste pour le téléchargement. Le MP3 fait environ 43 Mo et se transcrit sans différence de qualité significative pour un discours clair.

5

Pour les WAV bruyants, débruitez avant de télécharger

Le bruit de fond (vent, CVC, grondement de la pièce, sifflement de bande) réduit la précision plus que tout choix de réglage. Passez le WAV par Audacity → Effet → Réduction du bruit, ou utilisez l’outil web gratuit Adobe Podcast Enhance. Ensuite, téléchargez le WAV nettoyé.

Les fichiers WAV en langage simple

Un fichier WAV est, dans le cas standard, de l’audio PCM brut non compressé avec un petit en-tête au-dessus. Il n’y a pas de codec, pas de modèle perceptuel, pas de compression. Les octets dans le fichier sont l’enregistrement. Cette simplicité est la raison pour laquelle chaque DAW et enregistreur de terrain sur la planète peut exporter WAV sans négociation, et c’est aussi pourquoi les fichiers WAV sont beaucoup plus volumineux que les fichiers MP3 ou M4A de même longueur.

Pourquoi le WAV est si volumineux

La taille du fichier est déterminée presque entièrement par trois chiffres : le taux d’échantillonnage (combien d’échantillons par seconde), la profondeur de bits (combien de bits par échantillon) et le nombre de canaux (mono ou stéréo). Un enregistrement stéréo de qualité CD d’une minute (44,1 kHz, 16 bits, deux canaux) fait 10,1 Mo. Un enregistrement de terrain 24 bits 96 kHz d’une minute fait environ 33 Mo. Un master stéréo 32 bits flottant d’une heure à 48 kHz peut atteindre environ 1,4 Go. Le WAV ne compresse pas, donc ces chiffres évoluent linéairement avec la durée.

Ce que cela signifie pour la reconnaissance vocale

Whisper large-v3 (le modèle que nous utilisons) rééchantillonne tout ce que vous lui donnez à 16 kHz mono avant la première étape d’inférence. Un WAV multicanal 32 bits flottant 192 kHz finit par être façonné exactement de la même manière qu’un appel téléphonique mono 16 kHz par le modèle. Dans nos tests, la différence de qualité de transcription entre un WAV mono 16 kHz et un WAV stéréo 96 kHz 24 bits du même discours est statistiquement nulle. Ce qui change, c’est votre temps de téléchargement et votre budget de taille de fichier.

Quand le non compressé aide vraiment

Il y a une situation où le WAV bat un MP3 à faible débit pour la transcription : l’audio marginal. Voix très faibles, bruit ambiant important, coupures d’un micro-cravate défectueux. Les encodeurs MP3 à faible débit éliminent exactement la queue haute fréquence que Whisper utilise parfois pour désambiguïser les fricatives (sons s, f, sh). Si vous avez déjà un enregistrement qui se transcrit mal en MP3, la version WAV récupère parfois des mots que la copie compressée a manqués. Pour l’audio de studio propre à tout débit raisonnable, vous ne verrez pas la différence.

La variante Broadcast Wave (BWF)

Les enregistreurs de terrain professionnels (Sound Devices, Zaxcom, modèles pro récents de Tascam et Zoom) écrivent des Broadcast Wave, qui sont des WAV réguliers avec des morceaux de métadonnées supplémentaires : le morceau bext contient le timecode et les informations d’origine, iXML transporte les numéros de scène et de prise, parfois il y a un morceau chna pour le nommage multicanal. Mictoo lit les fichiers BWF de la même manière que tout autre WAV. Les métadonnées sont ignorées à des fins de transcription, l’audio est transcrit, et votre fichier original sur votre disque n’est jamais touché ou réécrit.

WAV vs autres formats audio pour la transcription

Les quatre formats fonctionnent dans Mictoo. Voici une comparaison pratique pour que vous puissiez choisir le bon format de départ.

WAV

Taille
La plus grande
Qualité
Non compressé
Meilleur pour
Studio, BWF, archives
Transcription
Fonctionne directement ; rééchantillonnez d’abord si plus de 60 Mo

MP3 →

Taille
La plus petite
Qualité
Avec perte (bonne à 128 kbps+)
Meilleur pour
Podcasts, longs fichiers, téléchargements
Transcription
Même précision que WAV pour un discours clair

FLAC →

Taille
Environ la moitié de WAV
Qualité
Compressé sans perte
Meilleur pour
Archives audiophiles, rips de CD
Transcription
Identique à WAV, fichier plus petit

M4A →

Taille
Petite
Qualité
AAC avec perte (très efficace)
Meilleur pour
Notes vocales iPhone, écosystème Apple
Transcription
Même précision que WAV en pratique

Besoin de convertir avant de télécharger ? Consultez comment compresser l’audio.

Frequently asked questions

Puis-je transcrire un WAV gratuitement ?

Oui. Mictoo est gratuit pour les fichiers jusqu’à 60 Mo. Pas besoin d’inscription, pas de filigrane sur les exports, pas de vente incitative après la première transcription. Pour les exports de studio longs ou les enregistrements de plusieurs heures, rééchantillonnez à 16 kHz mono ou réencodez en un court MP3 pour rester sous la limite.

Le WAV est-il meilleur que le MP3 pour la précision de la transcription ?

Pour un discours clair à tout débit MP3 raisonnable (128 kbps ou plus), pas de différence significative. Pour les enregistrements bruyants, à faible gain ou autrement marginaux, le WAV peut parfois récupérer des mots qu’un MP3 à faible débit manquerait. La plupart des audios de podcast et d’interview entrent dans la première catégorie.

Quels sont les meilleurs réglages WAV pour la transcription ?

16 kHz mono, 16 bits PCM est le point idéal pratique. Whisper rééchantillonne cela en interne de toute façon. Des taux d’échantillonnage et des profondeurs de bits plus élevés rendent le fichier plus volumineux sans améliorer la transcription. Gardez votre WAV de qualité studio original dans votre dossier de projet, et utilisez la version rééchantillonnée uniquement pour le téléchargement.

Prenez-vous en charge les WAV 24 bits et 32 bits flottant ?

Oui. Les deux fonctionnent directement. En interne, nous normalisons à 16 bits avant d’envoyer au modèle de parole, ce qui correspond à ce que Whisper attend. La profondeur de bits supplémentaire vous donne une marge de manœuvre pour l’édition dans votre DAW, mais ne change pas la transcription.

Prenez-vous en charge les fichiers Broadcast Wave (BWF) ?

Oui. Le BWF est un WAV standard avec des morceaux de métadonnées supplémentaires (bext, iXML, chna). Nous lisons l’audio et ignorons les métadonnées. Le fichier original sur votre disque reste intact, y compris toutes les informations de timecode et de scène/prise.

Les fichiers WAV de mon enregistreur Zoom, Tascam ou Sound Devices fonctionneront-ils ?

Oui. Zoom H1n, H5, H6, H8, Tascam DR-40X, DR-100mkIII, Portacapture X8, et Sound Devices MixPre / Scorpio par défaut enregistrent en WAV standard ou Broadcast Wave. Déposez le fichier directement, pas besoin de conversion.

Qu’en est-il des exports de Pro Tools, Logic, Reaper ou Audacity ?

Les quatre exportent par défaut des WAV PCM standard. Pro Tools et Logic écrivent généralement en 24 bits au taux d’échantillonnage de la session, Reaper similaire, Audacity écrit à la profondeur que vous avez configurée. Mictoo accepte tous tels quels.

Mon WAV dépasse la limite de 60 Mo, que dois-je faire ?

Le WAV ne compresse pas, donc la taille évolue avec le taux d’échantillonnage, la profondeur de bits, le nombre de canaux et la durée. Un fichier stéréo de 30 minutes 24 bits 48 kHz fait environ 250 Mo. Trois solutions, dans l’ordre : (1) rééchantillonnez à 16 kHz mono 16 bits, ce qui réduit généralement le fichier de 10 à 12 fois sans perte de qualité de transcription pour un discours clair ; (2) coupez le silence de début et de fin avec Audacity Truncate Silence ; (3) pour les fichiers très longs, réencodez en un MP3 mono 64 kbps juste pour le téléchargement. Consultez nos guides de compression et de division audio pour les étapes exactes.

Puis-je exporter des sous-titres SRT ou VTT ?

Oui. Après la transcription, vous pouvez télécharger SRT ou VTT avec des horodatages toutes les quelques secondes. Les deux formats s’alignent sur votre chronologie audio originale, donc ils s’intègrent directement dans votre éditeur vidéo ou flux de travail de sous-titres.

Puis-je obtenir des horodatages dans la transcription ?

Oui. La vue par défaut de la transcription montre des horodatages au niveau des segments que vous pouvez cliquer pour sauter à ce moment dans l’audio. Téléchargez en tant que VTT ou JSON pour une granularité au niveau des mots, ou en tant que SRT pour un format de sous-titres au niveau des segments.

Quelle est la précision de la transcription pour un WAV bruyant ?

Le bruit de fond (vent, CVC, trafic, sifflement de bande) réduit la précision de manière notable. Passez le WAV par Audacity → Effet → Réduction du bruit ou l’outil gratuit Adobe Podcast Enhance avant de télécharger. La version nettoyée se transcrit généralement beaucoup mieux.

Mon fichier WAV original sera-t-il modifié de quelque manière que ce soit ?

Non. Le fichier que vous téléchargez est lu par notre backend, envoyé au fournisseur de transcription et supprimé après la réception de la réponse. Votre fichier original sur votre ordinateur n’est jamais modifié. Nous ne vous renvoyons jamais une copie transformée.

Que puis-je faire avec la transcription après sa génération ?

Corrigez les mots incorrects en ligne avant d’exporter. Ensuite, téléchargez en tant que TXT (texte brut), SRT ou VTT (format de sous-titres avec horodatages), ou DOCX (document Word). Copiez directement dans le presse-papiers si vous avez juste besoin de coller quelque part. Le résumé IA apparaît automatiquement à côté de la transcription.

Téléchargez votre WAV et obtenez une transcription modifiable

Déposez le fichier, attendez moins d’une minute, copiez ou exportez le texte. Gratuit pour les fichiers jusqu’à 60 Mo. Pas d’inscription.

Transcrire un WAV maintenant