Problemi in nekaj rešitev računalniških obdelav slovenskih besedil

Avtorji

  • Jure ZUPAN

Ključne besede:

slovenščina, besedna analiza, končnice, računalništvo

Povzetek

Opisan je problem avtomatske besedne analize slovenskih besedil. Posebej je izpostavljen problem različnosti končnic pri sklanjatvah in spregatvah. Navedeni so vsi nizi različnih računalniških končnic, ki so bili najdeni pri pregledu in klasifikaciji približno 156.000 slovenskih besed. Predstavljeni računalniški slovar, katerega vsako geslo je sestavljeno iz računalniške osnove besede in pripadajočega niza računalniških končnic vsebuje približno 150.000 pregibnih in okrog 6.000 nepregibnih gesel. Opisani slovar omogoča dokajšnjo stopnjo avtomatizacije pri besedni analizi. Navedena sta tudi dva primera uporabe.

Prenosi

Objavljeno

1999-03-15

Kako citirati

ZUPAN, J. (1999) „Problemi in nekaj rešitev računalniških obdelav slovenskih besedil“, Slavistična revija, 47(3), str. 277–296. Dostopno na: https://srl.si/ojs/srl/article/view/COBISS_ID-11228770 (Pridobljeno: 22 november 2024).

Številka

Rubrike

RAZPRAVE