Transkrypcja podcastu
Darmowy generator transkryptu
Zamień każdy odcinek w czysty tekst. Prześlij swój MP3, MP4 lub M4A i otrzymaj transkrypcję w kilka sekund. Bez konta, bez opłaty za minutę.
Upuść swój plik tutaj
lub kliknij, aby wybrać
MP3 · MP4 · WAV · M4A · OGG · WEBM · FLAC · Maks. 25 MB · Maks. 30 min (60 min · Zaloguj)
Jak to działa
Upuść odcinek
MP3, MP4, M4A, WAV lub FLAC. Cloud recording z Riverside, eksporty z Descript, surowe audio z Zooma, pliki z Anchor.fm. Wszystko działa.
AI wykonuje pracę
Whisper large-v3 działa na naszym backendzie i konwertuje audio na tekst. Większość odcinków 30-minutowych kończy się w mniej niż minutę.
Kopiuj, pobierz lub edytuj
Weź tekst jako TXT, jako SRT do napisów, lub wklej bezpośrednio do edytora show notes. Popraw błędne słowa w naszym viewerze przed eksportem.
Dlaczego podcasterzy używają Mictoo
Długie odcinki to nie problem
Do 60 minut na plik po darmowej rejestracji. Przy podziale na dwie części zachowujemy względne timecode, aby można było złożyć pliki SRT bez liczenia.
Akcenty i crosstalk wytrzymują
Whisper large-v3 to najsilniejszy otwarty model mowy, jaki znamy dla nienatywnego angielskiego. Jeśli twój co-host jest z Berlina lub São Paulo, transkrypcja nie zamienia się w papkę.
Music beds nie psują nic
Nasz pipeline uruchamia Voice Activity Detection przed transkrypcją. Długie instrumentalne intra są oznaczane jako cisza, nie jako wymyślone słowa. Sponsor reads z podkładem muzycznym też przechodzą czysto.
Bez subskrypcji
Wielu podcasterów transkrybuje jeden lub dwa odcinki miesięcznie. Płacenie 15 dolarów miesięcznego seat za to jest marnowaniem. Wgrywaj plik w razie potrzeby. Zarabiamy reklamami i planowanym planem Pro dla power userów.
Twoje audio nie jest zapisywane
Pliki są przekazywane bezpośrednio do dostawcy mowy, transkrybowane i usuwane. Nie przechowujemy twoich odcinków, a dostawcy (Groq, OpenAI) nie trenują na danych API.
Co podcasterzy naprawdę robią z transkrypcją
Show notes i posty na blog
Wklej transkrypcję do swojego CMS, oznacz rozdziały, dodaj linki, opublikuj post. Odcinek 45-minutowy zwykle daje 6000-8000 słów materiału źródłowego. Trzy lub cztery lekko edytowane posty z jednego nagrania.
Cytaty z odcinka na social media
Przeskanuj transkrypcję pod kątem linii, która trafiła, i zrób z niej grafikę. Dużo szybciej niż gonić timecode w audio na 1.5x.
Przeszukiwalne archiwum starego katalogu
Przepuść stare odcinki przez transkrypcję wsadową i nagle masz Ctrl+F nad latami rozmów. Przydatne, gdy gość wraca i chcesz pamiętać, o czym rozmawialiście ostatnio.
Zamiennik dla auto-napisów YouTube
Auto-napisy YouTube są średnie dla podcastów z dwoma głosami i muzyką. Prześlij zamiast tego SRT z Mictoo. Lepsza interpunkcja, mniej błędów, lepsza dostępność.
Link transkrypcji dla dostępności
Wielu podcasterów wstawia link "Przeczytaj transkrypcję" w show notes RSS. Pomaga niesłyszącym i niedosłyszącym słuchaczom oraz pomaga wyszukiwarkom znaleźć twoje treści.
Wskazówki do czystszych transkrypcji podcastu
Najpierw usuń muzykę intro i outro
Whisper dobrze ignoruje muzykę, ale 90-sekundowe instrumentalne cold open czasami wywołuje słowa-duchy. Jeśli twoje intro jest takie samo w każdym odcinku, wytnij pierwsze 1:30 w Audacity przed uploadem. Oszczędza kilka minut czyszczenia później.
Eksportuj w mono 64 kbps, jeśli surowy plik jest ogromny
Głos nie potrzebuje stereo, a 64 kbps wystarczy dla mowy. Dwugodzinny odcinek w mono 64 kbps to około 55 MB. Mieści się w limicie 60 MB z loginem bez dzielenia. ffmpeg: ffmpeg -i episode.wav -ac 1 -b:a 64k episode.mp3.
Dla wywiadów ze słabym audio gościa transkrybuj każdą ścieżkę osobno
Jeśli nagrywasz na Riverside lub SquadCast i masz osobne ścieżki audio na mówcę, prześlij każdą osobno. Whisper łatwiej radzi sobie z jednym głosem na raz. Czystsza atrybucja, mniej utraconych słów przy nakładaniu.
W krótkich odcinkach ustaw język wyraźnie
Auto-wykrywanie próbkuje pierwszy fragment audio. Jeśli otwierasz jednym słowem cold open lub śmiechem, wykrywanie może wpaść w zły język. Dla wszystkiego poniżej 5 minut wybierz język ręcznie.
Interpunkcja będzie niedoskonała. Popraw pierwsze 10 linii, resztę zostaw
Whisper trafia większość interpunkcji, ale czasem gubi średniki i mowę bezpośrednią. Dla show notes liczy się pierwsze 10 linii (ludzie skanują). Powyżej: wysyłaj tak jak jest.
Używaj eksportu SRT, nawet jeśli nie potrzebujesz napisów
SRT daje timecode co kilka sekund. Nawet jeśli wklejasz w posta na blog, te timecode pomagają wrócić w audio i zweryfikować cytat. Mamy darmowy generator SRT na miejscu.
Najczęściej zadawane pytania
Czy mogę transkrybować dwugodzinny odcinek?
Tak, ale najpierw podziel. Nasz limit pliku to 30 minut za darmo lub 60 minut po rejestracji. Dla dwugodzinnego odcinka podziel na dwa lub trzy kawałki i transkrybuj każdy. Nasz przewodnik podziału audio wyjaśnia jak w 60 sekund z ffmpeg lub Audacity.
Czy dostanę etykiety mówców (Host vs. Gość)?
Obecnie nie automatycznie. Whisper sam nie robi diaryzacji. Jeśli masz osobne ścieżki na mówcę (typowe w Riverside, SquadCast, Zencastr), prześlij każdą osobno i oznacz sam w końcowym transkrypcie. Patrzymy na diaryzację, ale wypuścimy ją tylko, jeśli zrobimy to dobrze.
Jak radzi sobie z akcentami i podcastami dwujęzycznymi?
Whisper large-v3 został wytrenowany na 680.000 godzinach wielojęzycznego audio. Nienatywny angielski, regionalne akcenty i code-switching działają lepiej niż w mniejszych modelach. Dla podcastu przełączającego się między angielskim a hiszpańskim w środku odcinka wybierz "Auto-wykrywanie" jako język, a Whisper podąży za przełączeniem.
Jakie formaty audio wspieracie dla podcastów?
MP3, M4A, WAV, FLAC, OGG, WEBM i AAC. Plus pliki wideo jak MP4 i MOV (wyciągamy audio). Jeśli twój hosting podcastów oferuje download w jednym z tych, jesteś gotów. AIFF i ALAC nie są obsługiwane bezpośrednio, skonwertuj na WAV wcześniej.
Czy jest limit słów na odcinek?
Bez limitu słów. Tylko limit rozmiaru pliku (25 MB za darmo, 60 MB z rejestracją) i czasu trwania (30 min za darmo, 60 min z rejestracją). Typowy odcinek 60-minutowy produkuje około 9000-11.000 słów.
Jak dokładna jest transkrypcja podcastu w porównaniu z ludzkimi transkryptorami?
Dla czystego audio studyjnego Whisper large-v3 ląduje typowo na 5-10% wskaźnika błędu słów. Ludzcy transkryptorzy są na 3-5%. Dla większości show notes i repurposingu na blog AI wystarczy. Dla zeznań sądowych lub cytatów akademickich weź człowieka.
Czy mój odcinek jest zapisywany na waszych serwerach?
Nie. Przekazujemy audio bezpośrednio do dostawcy transkrypcji (Groq, z OpenAI jako backup). Przetwarzają, a my odrzucamy. Nigdy nie zapisujemy twojego pliku podcastu w naszej bazie ani storage.
Czy mogę pobrać jako SRT do napisów?
Tak. Po transkrypcji kliknij przycisk pobierania SRT. Użyj bezpośrednio w YouTube Studio, Premiere Pro, DaVinci Resolve lub dowolnym edytorze wideo.
Czy liczycie za minutę?
Nie. Transkrypcja w Mictoo jest darmowa. Obecnie jesteśmy finansowani reklamami, z płatnym planem Pro nadchodzącym później dla użytkowników, którzy potrzebują dłuższych plików lub uploadu wsadowego.
Mój odcinek ma wulgaryzmy. Czy zostaną ocenzurowane?
Bez filtrowania. Transkrypcja odzwierciedla dokładnie to, co zostało powiedziane. Jeśli chcesz edytować przekleństwa dla czystej wersji, zrób to sam po pobraniu.
Czy mogę edytować transkrypcję przed pobraniem?
Tak. Jest prosty edytor w widoku wyniku. Popraw błędne słowa, potem pobierz edytowaną wersję jako TXT lub SRT.
Czy transkrypcja podcastu w Mictoo jest zgodna z RODO?
Nie przechowujemy audio ani transkryptu na naszych serwerach po opuszczeniu strony. Jesteśmy w Europie, a nasi dostawcy (Groq US, OpenAI US) podpisali DPA. Dla konkretnych pytań compliance zobacz naszą politykę prywatności lub napisz na info@mictoo.com.
Gotowy do transkrypcji?
Przewiń do góry i upuść plik. Transkrypcja będzie gotowa w około minutę.
↑ Wróć do uploaderaWięcej narzędzi do transkrypcji