Entropija v slovenskih leposlovnih besedilihZaložba ZRC, 18. dec. 2002 - 208 strani Delo prinaša kvantitativni opis dveh vzorcev slovenskih leposlovnih besedil, skupaj dolgih 3.100.000 besed, in najpomembnejše parametre znakovnih n-terčkov, od enojčkov do štiriindvajseterčkov, ocenjena je tudi zgornja meja entropije v tovrstnih besedilih. Prvi vzorec vsebuje besedila 60 del 41 avtorjev, od Ivana Cankarja do Ivana Zorca, 46 izvirnih in 14 prevodov, z letnico izida od 1858 do 1996 in v skupnem obsegu 2.700.000 besed, drugi vzorec pa vsebuje celoten opus Cirila Kosmača, 52 del, objavljenih med letoma 1931 in 1988, s 400.000 besedami. Oba vzorca skupaj predstavljata med 0,5 % in 1 % celotne slovenske leposlovne produkcije. |
Vsebina
Del 1 | 5 |
Del 2 | 13 |
Del 3 | 35 |
Del 4 | 47 |
Del 5 | 57 |
Del 6 | 89 |
Del 7 | 115 |
Del 8 | 117 |
Del 9 | 127 |
Del 10 | 129 |
Del 11 | 137 |
Del 12 | 203 |
Del 13 | 205 |
Druge izdaje - Prikaži vse
Pogosti izrazi in povedi
algoritem besed besedila besednih oblik bita na znak bitov Cirila Kosmača črk črke dela delo dolžine drugega vzorca drugem vzorcu entropije frekvenco glagol GLmd GLme GLmp GLse GLsp GLžd GLže GLžp GPce GVbe GVbp Huffmanovo IOme4 IOže4 Jakopin kodiranje korpus n-terčki n-terčkov najpogostejših oba vzorca obeh vzorcih oblikoslovno označevalnik oznak Peter Majcen Pmd1 Pme1 Pme2 Pme3 Pme4 Pme4i Pme5 Pme6 Pmel Pmeli Pmeli,2 Pmp1 Pmp2 Pmp3 Pmp4 Pmp5 Pmp6 povedi premi govor programska oprema prvega vzorca prvem vzorcu Pse1 Pse2 Pse4 Pse5 Pse6 Psel Psp1 Psp2 Psp4 Psp6 Pže1 Pže2 Pže3 Pže4 Pže5 Pže6 Pžel Pžp1 Pžp2 Pžp4 Pžp5 Pžp6 rekel Smd1 Smd4 Sme1 Sme2 Sme3 Sme4 Sme5 Sme6 Smp1 Smp2 Smp3 Smp4 Smp5 Smp6 Sse6 SSKJ Szp1 Szp2 Szp4 Szp5 Szp6 Sžd4 Sže2 Sže3 Sže4 Sže5 Sže6 Sžel Sžp1 Sžp2 Sžp4 število Tabela videčima videnih vzorca vzorec znakov