This site uses cookies.
Some of these cookies are essential to the operation of the site,
while others help to improve your experience by providing insights into how the site is being used.
For more information, please see the ProZ.com privacy policy.
Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.
AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data... See more
Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.
AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data pouze pro jeden jazyk nebo více jazyků. Modely jsou buď malé nebo velké. Malé modely fungují rychle, ale nepřesně. Když malý model potřebuje na přepis 1 jednotku času, tak největší model potřebuje 32 jednotek času.
Pro češtinu je nyní k dispozici malý model Vosk. Modely Whisper mají pět velikostí. Modely jsou buď pro angličtinu nebo pro více než sto jazyků. Vícejazyčný model obsahuje různé množství dat jednotlivých jazyků. Pro kvalitní přepis češtiny potřebuji velký a pomalý model.
Běžný uživatel používá PC s Windows, takže potřebuje SW spustitelný ve Windows a modely, které SW může využívat. SW Whisper používá tyto modely.
Uživatelům jsou k dispozici zdarma. Všechno mi fungovalo až do okamžiku, kdy jsem chtěl přepsat řeč delší než 30 minut. Chtěl jsem přepsat 47 minut. Whisper s modelem "large.bin" vytvořil 500 titulků a do zbývajících 300 titulků umístil stejný text. Zjistil jsem, že SW uloží data do souboru titulků až po ukončení procesu. Když proces zpracoval 28 minut nahrávky byla RAM 32GB z 95% plná a swapovala data na harddisk. Na dobrý přepis bych potřeboval 48GB nebo 64GB. Problém jsem vyřešil rozdělením souboru na dva menší. Místo výsledkých titulků jsem použil pro import do SE prostý text vytvořený ze dvou souborů SRT.
Jeden vývojář nabízí program Buzz, který využívá modely Whisperu. Tento autor provozuje web https://freesubtitles.ai/ . Můžete si vyzkoušet sami a nepřesnosti opravit.
Video jsem nahrál na web, vybral češtinu a model "base". Po zpracování jsem stáhl titulky ve všech dostupných formátech. Video se zobrazenými titulky jsem si mohl zobrazit.
Na webu zůstal protokol a informace a zpracovaném videu:
Translate faster & easier, using a sophisticated CAT tool built by a translator / developer.
Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools.
Download and start using CafeTran Espresso -- for free
Exclusive discount for ProZ.com users!
Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value