Ochutnávka ASRPE
દોર પોસ્ટ કરનાર: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 04:56
અંગ્રેજી થી ઝેક
Dec 26, 2022

Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.

AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data
... See more
Na YouTube se vyskytují česká videa zpravidla bez titulků. Existují ale výjimky. U některých videí jsou přepisy a také ručně vytvořené titulky. Výjimečně se vyskytuje přepis a titulky nejsou zapnuté.

AI (Artificial Inteligence) je nástroj na dekódování lidské řeči a jejich převod na písmo.
Vývojáři a programátoři zpravidla používají programovací jazyk Python. AI používává jazykový model, což je sada souborů. Model obsahuje buď data pouze pro jeden jazyk nebo více jazyků. Modely jsou buď malé nebo velké. Malé modely fungují rychle, ale nepřesně. Když malý model potřebuje na přepis 1 jednotku času, tak největší model potřebuje 32 jednotek času.
Pro češtinu je nyní k dispozici malý model Vosk. Modely Whisper mají pět velikostí. Modely jsou buď pro angličtinu nebo pro více než sto jazyků. Vícejazyčný model obsahuje různé množství dat jednotlivých jazyků. Pro kvalitní přepis češtiny potřebuji velký a pomalý model.
Běžný uživatel používá PC s Windows, takže potřebuje SW spustitelný ve Windows a modely, které SW může využívat. SW Whisper používá tyto modely.

large.bin 3 094 623 691 (3,1GB)
medium.bin 1 533 763 059
small.bin 487 601 967
base.bin 147 951 465
tiny.bin 77 691 713 (77,7MB)

Uživatelům jsou k dispozici zdarma. Všechno mi fungovalo až do okamžiku, kdy jsem chtěl přepsat řeč delší než 30 minut. Chtěl jsem přepsat 47 minut. Whisper s modelem "large.bin" vytvořil 500 titulků a do zbývajících 300 titulků umístil stejný text. Zjistil jsem, že SW uloží data do souboru titulků až po ukončení procesu. Když proces zpracoval 28 minut nahrávky byla RAM 32GB z 95% plná a swapovala data na harddisk. Na dobrý přepis bych potřeboval 48GB nebo 64GB. Problém jsem vyřešil rozdělením souboru na dva menší. Místo výsledkých titulků jsem použil pro import do SE prostý text vytvořený ze dvou souborů SRT.

Jeden vývojář nabízí program Buzz, který využívá modely Whisperu. Tento autor provozuje web https://freesubtitles.ai/ . Můžete si vyzkoušet sami a nepřesnosti opravit.

Video jsem nahrál na web, vybral češtinu a model "base". Po zpracování jsem stáhl titulky ve všech dostupných formátech. Video se zobrazenými titulky jsem si mohl zobrazit.
Na webu zůstal protokol a informace a zpracovaném videu:

https://freesubtitles.ai/player/Sip-Reflex--25-December-2022_14_39_36

Milan
PS: PF 2023
Collapse


 


કોઇ મધ્યસ્થી સ્પષ્ટ રીતે આ મંચ માટે નિમવામાં આવ્યો નથી.
સાઇટના નિયમોના ઉલ્લંઘનોની જાણ કરવા અથવા મદદ મેળવવા, કૃપા કરી સાઇટ સ્ટાફ » નો સંપર્ક કરો


Ochutnávka ASRPE






CafeTran Espresso
You've never met a CAT tool this clever!

Translate faster & easier, using a sophisticated CAT tool built by a translator / developer. Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools. Download and start using CafeTran Espresso -- for free

Buy now! »
Wordfast Pro
Translation Memory Software for Any Platform

Exclusive discount for ProZ.com users! Save over 13% when purchasing Wordfast Pro through ProZ.com. Wordfast is the world's #1 provider of platform-independent Translation Memory software. Consistently ranked the most user-friendly and highest value

Buy now! »