Moje třetí vlna AI- umělé inteligence - ASR દોર પોસ્ટ કરનાર: Milan Condak
|
Moje třetí vlna AI- umělé inteligence
Programy AI v mém PC s MS Windows:
a) Nejprve jsem si nainstaloval Model pro rozpoznávání písma, které je obsažené v obrázcích, tj. OCR. Program se jmenuje TesserAct. (10. července 2021) Nyní jej většinou samostatně nepoužívám. Je součástí programů s vlastním grafickým uživatelským prostředím. Většinou používám v balíku PDF24.
b) potom jsem si nainstaloval strojový překladač OP... See more Moje třetí vlna AI- umělé inteligence
Programy AI v mém PC s MS Windows:
a) Nejprve jsem si nainstaloval Model pro rozpoznávání písma, které je obsažené v obrázcích, tj. OCR. Program se jmenuje TesserAct. (10. července 2021) Nyní jej většinou samostatně nepoužívám. Je součástí programů s vlastním grafickým uživatelským prostředím. Většinou používám v balíku PDF24.
b) potom jsem si nainstaloval strojový překladač OPUS-CAT pro překládání z češtiny a do češtiny v OmegaT (24. července 2021);
c) Na YouTube jsou velmi často anglické titulky. České titulky jsou pouze na některých kanálech, které spravují lidé, kteří umí titulky vytvořit.
Státní svátek 28. října 2022 jsem oslavil tím, že jsem si nainstaloval do SubtitleEdit 3.6.8 model Vosk/Kaldi pro přepis české řeči do titulků SRT. Vyzkoušel jsem na pěti stažených videích. Ještě mi zbývá otestovat Whisper, který má také položku v menu SubtitleEditu. Teoretici funkci nazývají ASR (Automatic Speech Recognition).
Milan
[Edited at 2022-10-29 10:41 GMT] ▲ Collapse | | | Milan Condak Local time: 19:52 અંગ્રેજી થી ઝેક વિષયની શરૂઆત કરનાર Editace titulků se zvukem | Oct 30, 2022 |
Milan Condak wrote:
...nainstaloval do SubtitleEdit 3.6.8 model Vosk/Kaldi pro přepis české řeči do titulků SRT.
Na videa s titulky jsem se díval v prohlížeči VLC. Všechno fungovalo. Automatický přepis není dokonalý (dokonalé jsou pouze přeslechy) a když ASR ví, že nerozumí, vloží tam slůvko [unk]. Často ASR neví, že nerozumí a v textu jsou zcela nesprávná slova (jako v MT).
ASR pravděpodobně vypnulo v SubtitleEditu 3.6.8 zvuk. Pro editaci titulků se zvukem používám starší verzi SE 3.6.4.
Na přepis české řeči ve svém PC jsem čekal více než deset let. Jsem šťasten, že jsem se dočkal.
Milan | | | Milan Condak Local time: 19:52 અંગ્રેજી થી ઝેક વિષયની શરૂઆત કરનાર První moje video je cizí nahrávka s automatickými českými titulky | Dec 7, 2022 |
Dnes jsem zveřejnil první video na YouTube
https://youtu.be/VDGPhdphgTA
Do videa z přednášky z roku 2019 jsem vypálil české titulky vytvořené automaticky programem Whisper s vícejazyčným modelem "large.bin". Modely Audio do textu by měly fungovat v programu Subtitle Edit.
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
... See more Dnes jsem zveřejnil první video na YouTube
https://youtu.be/VDGPhdphgTA
Do videa z přednášky z roku 2019 jsem vypálil české titulky vytvořené automaticky programem Whisper s vícejazyčným modelem "large.bin". Modely Audio do textu by měly fungovat v programu Subtitle Edit.
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
Titulky z programu Vosk jsou u této nahrávky nepoužitelné.
Milan ▲ Collapse | | | Milan Condak Local time: 19:52 અંગ્રેજી થી ઝેક વિષયની શરૂઆત કરનાર Mám nové PC pro ASR a ASRPE | Dec 19, 2022 |
Milan Condak wrote:
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
Program Whisper v mém pracovním PC nefungoval, protože měl nainstalovaný processor I7 navržený v roce 2012. Program Whisper používá příkazy, které zpracovávají procesory navržené po roce 2013.
V novém PC (dnes sestaveném) mi nefungoval model large.bin, který stáhl SubtitleEdit (SE). Nahradil jsem jej dříve staženým modelem.
large.bin 3 094 623 691 07.12.2022 19:27 dříve stažený = funguje
large.bin 2 147 470 636 19.12.2022 22:22 dnes stažený z programu SubtitleEdit = nefunguje
První zkušenosti:
HUDBA - nahrál jsem na mobil dětský sbor zpívající koledy; před rozpoznáváním řeči je vhodné použít program, který ze zvuku extrahuje pouze řeč (potlačí hudbu).
HLASITOST - na základě křivky zvuku v SE je vhodné zvuk před rozpoznáváním zesílit nebo zeslabit.
Post Editace: ani přepis s modelem "large" není perfektní. Vygenerovaný SRT přejmenuji na W.SRT (přepisem programem Whisper) nebo na V.SRT (přepisem programem Vosk). Opravy ukládám do souboru CS.SRT (dělám pouze přepisy české řeči).
ASRPE = Automatic Speech Recognition Post Editing. Opravený text může být přeložen do jiných jazyků.
Milan | |
|
|
Milan Condak Local time: 19:52 અંગ્રેજી થી ઝેક વિષયની શરૂઆત કરનાર Buzz pro přepis bez SubtitleEdit | Jan 7, 2023 |
Milan Condak wrote:
Post Editace: ani přepis s modelem "large" není perfektní. Vygenerovaný SRT přejmenuji na W.SRT (přepisem programem Whisper) ... programem Vosk).
Přepisy s malým modelem Vosk jsou méně přesné a již je nedělám.
Jako uživatel Windows sleduji aplikace, které fungují s Whisperem ve Windows.
a) Nejprve jsem spouštěl přepis řeči do titulků z Subtitle Editu. Proces se zastavil po dosažení 100% z 32 GB RAM.
b) Potom jsem spouštěl Whisper z příkazového řádku a v okně jsem viděl přepisovaný text. Pokud bylo v RAM nějaké místo a přepis nebyl zcela hotový, mohl jsem obsah okna zkopírovat do textového souboru a nepřepsanou část videa přepsat dodatečně.
c) Od 4. ledna používám program Buzz. Ve verzi 0.7.0 e mi podařilo stáhnout modely, se kterými Buzz pracuje.
Autor programu Buzz, David Mbugua, stejný den zveřejnil video, které jsem objevil včera.
https://www.youtube.com/watch?v=2NDwOoV62-k
What's new in Buzz v0.7.0
Video je dostatečně názorné, takže nemusím SW popisovat. Buzz má minimalistické rozhraní. Je možno přepisovat řeč, kterou snímá mikrofon nebo přepsat soubory (zvukové nebo video).
Kromě balíku SW, který má velikost 1GB je nutno stáhnout modely, které jsou přibližně stejně velké jako dříve uvedené modely. Vzhledem k horečnému vývoji a upgradům používám verzi, která se neinstaluje, ale pouze rozbalí na vybrané místo. Buzz lépe využívá RAM mého PC.
Přepsaný text je možno uložit jako TXT, SRT nebo VTT.
Milan
[Edited at 2023-01-07 23:05 GMT] | | | Milan Condak Local time: 19:52 અંગ્રેજી થી ઝેક વિષયની શરૂઆત કરનાર Buzz je lépe napsaný SW | Jan 8, 2023 |
Milan Condak wrote:
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
Whisper v SubtitleEdit ani samostatné verze Whisperu pro Windows
a) nefungovaly v PC bez procesoru, který nepodporoval AVX1 a AVX2;
b) v průběhu zpracování se neuvolňovala paměť v RAM.
Buzz je jiný software, který pracuje s původními mnohojazyčnými modely pro Whisper.
Buzz funguje i v mém původním PC a v 16 GB RAM je dostatek volného místa.
Správce souborů ale vykazuje vysokou spotřebu elektrické energie, která je v novém PC v normálních mezích.
Buzz nezpracovává signál z mikrofonů připojených konektorem přes zvukovou kartu; zpracovává vstupní signál z mikrofonu webové kamery, která má USB. Určitě zpracovává signál i z jiných USB mikrofonů.
Milan | | | કોઇ મધ્યસ્થી સ્પષ્ટ રીતે આ મંચ માટે નિમવામાં આવ્યો નથી. સાઇટના નિયમોના ઉલ્લંઘનોની જાણ કરવા અથવા મદદ મેળવવા, કૃપા કરી સાઇટ સ્ટાફ » નો સંપર્ક કરો Moje třetí vlna AI- umělé inteligence - ASR CafeTran Espresso | You've never met a CAT tool this clever!
Translate faster & easier, using a sophisticated CAT tool built by a translator / developer.
Accept jobs from clients who use Trados, MemoQ, Wordfast & major CAT tools.
Download and start using CafeTran Espresso -- for free
Buy now! » |
| Protemos translation business management system | Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!
The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.
More info » |
|
| | | | X Sign in to your ProZ.com account... | | | | | |