mictoo
MP4 · MOV · WEBM · KOSTENLOS

Video in Text
Kostenlose KI-Video-Transkription

Kostenlose KI-Transkription für jede Videodatei. Wir extrahieren das Audio automatisch. Ohne Konto, ohne Tarif pro Minute, ohne E-Mail.

KI-ZusammenfassungÜbersetzen, 28 SprachenOpenAI Whisper
Wir holen die Untertitel der Video. Kostenlos.
oder Datei hochladen

Datei hier ablegen

oder zum Auswählen klicken

MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC  ·  Max. 25 MB  ·  Max. 30 Min. (60 Min. · Anmelden)

Größere Datei? So komprimieren.

Längere Aufnahme? So aufteilen.

So funktioniert es

🎬

Video ablegen — oder YouTube-URL einfügen

MP4, MOV, WEBM, AVI oder jeder gängige Videocontainer. Bildschirmaufnahmen, Vlogs, Webinar-Exporte, Zoom-MP4s. Datei reinziehen oder zum Auswählen klicken. Neu: YouTube-Link einfügen statt hochzuladen und wir holen das Transkript in Sekunden, ohne Download.

Wir extrahieren das Audio, KI transkribiert

Wir holen die Tonspur aus dem Video heraus und schicken nur die an Whisper large-v3. Keine Notwendigkeit, zuerst in MP3 zu konvertieren. Ein 30-Minuten-Video ist meist in rund einer Minute fertig.

📋

Kopieren, herunterladen oder Untertitel holen

Laden Sie es als TXT für Notizen herunter, oder als SRT, um es als Untertitel in einen Video-Editor zu legen. Falsche Wörter im Browser vor dem Export korrigieren.

Warum Mictoo für Video

YouTube-URL direkt einfügen

Sparen Sie sich den Download-Schritt für YouTube-Videos — legen Sie den Link in das Feld über der Ablagezone und das Transkript kommt in Sekunden zurück. Für Videos ohne Untertitel laden Sie die Audiodatei hoch und Whisper erledigt den Rest.

Audio-Extraktion ist automatisch

Sie legen die MP4 ab. Wir holen das Audio intern raus und schicken es an das Sprachmodell. Sie müssen ffmpeg nicht selbst starten.

Die Ausgabe funktioniert in echten Video-Editoren

Die SRT, die wir erzeugen, funktioniert in Premiere Pro, DaVinci Resolve, Final Cut, CapCut und YouTube Studio. Zeitstempel sind framegenau.

Größere Videodateien? Audio komprimieren, nicht Video

Ein 200-MB-Video besteht meist aus 195 MB Video und 5 MB Audio. Sie müssen nicht alles komprimieren, nur die Tonspur.

Keine Datei wird gespeichert

Das Video kommt zu uns, wir extrahieren das Audio, schicken es an den Transkriptions-Anbieter und verwerfen beides. Wir behalten weder Ihr Video noch Ihr Audio auf unseren Servern.

Wofür Video-Transkription gut ist

Untertitel für Social-Media-Videos

TikTok, Instagram Reels, YouTube Shorts profitieren alle von eingebrannten Untertiteln. Erzeugen Sie die SRT hier, importieren Sie in CapCut oder Premiere, gestalten Sie die Untertitel nach Geschmack und brennen Sie sie ins Video ein.

Tutorials und Kursinhalte

Wenn Sie Screencast-Tutorials aufnehmen, hilft eine Textversion bei SEO, Barrierefreiheit und Übersetzung. Fügen Sie das Transkript in Ihren Blog oder Ihre Kursplattform als Begleitung zum Video ein.

Webinar-Follow-ups

Sie haben ein einstündiges Webinar gemacht. Transkribieren Sie die Aufnahme, bearbeiten Sie leicht und schicken Sie sie als Follow-up-Mail an Teilnehmer, die nicht bis zum Ende bleiben konnten.

Interview-Schnitte für die Bearbeitung

Beim Schneiden eines langen Video-Interviews können Sie mit dem Transkript auf einem zweiten Bildschirm einen „Paper Edit" machen. Markieren Sie die gewünschten Zeilen, finden Sie sie auf der Timeline, viel schneller als zu scrubben.

Übersetzungs- und Synchronisations-Vorbereitung

Transkribieren Sie in der Ausgangssprache, jagen Sie den Text durch DeepL oder ChatGPT zum Übersetzen und nutzen Sie das als Skript für Synchronisation oder Untertitelübersetzung.

Tipps für Video-Transkription

1

Audio zuerst extrahieren, wenn Ihr Video über 60 MB ist

Ein 1080p-Video besteht hauptsächlich aus Pixel-Bytes, die wir sowieso wegwerfen. Holen Sie nur die Tonspur: ffmpeg -i video.mp4 -vn -ac 1 -b:a 64k audio.mp3. Ein 500-MB-Video schrumpft auf unter 30 MB Audio.

2

Hintergrundmusik im Editor vor dem Export stummschalten

Wenn Ihr Video Musik unter dem Dialog hat (B-Roll, Intro, Übergänge), schalten Sie die Musikspur im Editor vor dem Export der hochzuladenden Version stumm oder leiser. Whisper erfindet manchmal Wörter, wenn Sprache unter Musik begraben ist.

3

Bildschirmaufnahmen ohne Musik sind am einfachsten

Loom-, Zoom-, OBS-Aufnahmen von jemandem, der über Slides spricht, ergeben die saubersten Transkripte. Keine Musik, eine Stimme, klares Mikro. Sie bekommen nahezu menschliche Genauigkeit.

4

Bei Multi-Speaker-Videos wenn möglich separate Audiospuren aufnehmen

Wenn Sie die Aufnahme kontrollieren, nehmen Sie jeden Sprecher auf seine eigene Spur auf. Transkribieren Sie jede Spur separat. Sauberere Zuordnung, weniger Fehler bei Überlappungen.

5

Die Framerate ist egal, nur die Audioqualität zählt

Whisper schaut nicht aufs Video, nur aufs Audio. Ein 4K-Video mit schlechtem Audio transkribiert schlechter als ein 480p-Video mit Lavalier-Mikro. Stecken Sie Ihre Mühe ins Audio.

6

SRT-Zeitstempel brauchen in manchen Editoren einen kleinen Versatz

Die meisten Editoren richten SRT-Zeitstempel perfekt aus. Ein paar ältere Editoren erwarten, dass der erste Untertitel bei 00:00:01,000 startet statt bei 00:00:00,000. Wenn Ihre Untertitel um eine Sekunde verschoben sind, liegt es meist daran.

Häufig gestellte Fragen

Welche Videoformate unterstützen Sie?

MP4, MOV, WEBM, AVI, MKV, FLV. Wenn Ihr Video in VLC läuft, funktioniert es fast sicher hier. Wir extrahieren das Audio intern, der Video-Codec spielt also kaum eine Rolle.

Meine Videodatei ist zu groß zum Hochladen. Was tun?

Zwei Optionen. Extrahieren Sie zuerst nur das Audio (ein ffmpeg-Befehl, siehe Tipps oben) und laden Sie das hoch. Oder nutzen Sie einen kleineren Export aus Ihrem Editor (niedrigere Auflösung oder Bitrate). Für Dateien über 60 MB ist Audio-Extraktion schneller.

Kann ich SRT-Untertitel bekommen, nicht nur reinen Text?

Ja. Klicken Sie nach der Transkription auf „Als SRT herunterladen". Die SRT funktioniert in YouTube Studio, Premiere Pro, DaVinci Resolve, Final Cut, CapCut und jedem Standard-Video-Editor.

Passen die SRT-Timings exakt zu meinen Video-Frames?

Ja. SRT-Zeitstempel sind in Millisekunden, was präziser ist als jede Videoframerate. Sie passen korrekt bei 24, 25, 29.97, 30, 50 und 60 fps.

Kann ich ein Video ohne Ton transkribieren (nur Text am Bildschirm)?

Nein. Wir transkribieren gesprochenes Audio. Für Texterkennung am Bildschirm brauchen Sie OCR, das ist ein anderes Tool.

Wie genau ist Video in Text?

Hängt vom Audio ab. Saubere Voiceover-Aufnahmen: nahezu menschliche Genauigkeit (95 Prozent oder besser). Konferenzvideos mit schlechter Raumakustik: rund 85 bis 90 Prozent. Musiklastige Videos mit leisem Dialog: weiter darunter.

Wird mein Video zu YouTube oder Drittdiensten hochgeladen?

Nein. Ihr Video wird zu unserem Transkriptions-Anbieter gestreamt und verworfen. Nichts wird zu YouTube, Google oder anderswo hochgeladen. Wir sind nicht im Cloud-Video-Storage-Geschäft.

Kann ich das Transkript vor dem Download bearbeiten?

Ja. Korrigieren Sie falsche Wörter im Browser vor dem Export. Nützlich für Eigennamen und Fachbegriffe.

Unterstützen Sie 360-Video oder VR-Videoformate?

Der Video-Codec spielt für uns keine Rolle. Solange die Datei ein Standard-Container (MP4, MOV) mit einer Tonspur ist, extrahieren wir das Audio und transkribieren.

Was, wenn mein Video mehrere Audiospuren hat (Kommentar, Original, Musik)?

Wir nutzen nur die Standardspur. Wenn Sie eine bestimmte Spur wollen, exportieren Sie das Video neu mit dieser Spur als Standard, oder extrahieren Sie die gewünschte Spur und laden Sie sie als Audio hoch.

Gibt es eine Längen-Begrenzung für Videos?

30 Minuten pro Datei kostenlos, 60 Minuten mit Anmeldung. Für längere Videos teilen Sie in Stücke. Die Transkripte lassen sich danach zusammenfügen.

Kann ich einen Live-Video-Stream transkribieren?

Nein. Wir arbeiten nur mit aufgenommenen Dateien. Für Live-Transkription brauchen Sie eine andere Kategorie von Tool.

Bereit zum Transkribieren?

Scrollen Sie nach oben und legen Sie Ihre Datei ab. Das Transkript ist in etwa einer Minute fertig.

↑ Zurück zum Uploader