Problemi in nekaj rešitev računalniških obdelav slovenskih besedil
Ključne besede:
slovenščina, besedna analiza, končnice, računalništvoPovzetek
Opisan je problem avtomatske besedne analize slovenskih besedil. Posebej je izpostavljen problem različnosti končnic pri sklanjatvah in spregatvah. Navedeni so vsi nizi različnih računalniških končnic, ki so bili najdeni pri pregledu in klasifikaciji približno 156.000 slovenskih besed. Predstavljeni računalniški slovar, katerega vsako geslo je sestavljeno iz računalniške osnove besede in pripadajočega niza računalniških končnic vsebuje približno 150.000 pregibnih in okrog 6.000 nepregibnih gesel. Opisani slovar omogoča dokajšnjo stopnjo avtomatizacije pri besedni analizi. Navedena sta tudi dva primera uporabe.Prenosi
Objavljeno
1999-03-15
Kako citirati
ZUPAN, J. (1999) „Problemi in nekaj rešitev računalniških obdelav slovenskih besedil“, Slavistična revija, 47(3), str. 277–296. Dostopno na: https://srl.si/ojs/srl/article/view/COBISS_ID-11228770 (Pridobljeno: 22 november 2024).
Številka
Rubrike
RAZPRAVE
Licenca
Slavistična revija (http://www.srl.si) is distributed under
Creative Commons, attribution 4.0 international.
Slavistična revija publishes fully open access journals, which means that all articles are available on the internet to all users immediately upon publication. Non-commercial use and distribution in any medium is permitted, provided the author and the journal are properly credited.