Izdelava seznama besed za množično raziskavo razširjenosti slovenskih besed




Ključne besede:

besedišče, razširjenost, množična raziskava, korpus, frekvenca, slovenščina


Članek predstavlja metodologijo izdelave seznama besed za množično raziskavo razširjenosti slovenskih besed. Pri oblikovanju seznama so bili uporabljeni geslovniki treh razlagalnih slovarjev slovenskega jezika: druge izdaje Slovarja slovenskega knjižnega jezika, eSSKJ in Sprotnega slovarja slovenskega jezika. Izbor besed je bil omejen z izbranimi merili, med drugim z dolžino besed in korpusno frekvenco ter z izločitvijo lastnih imen. Končni seznam obsega 79.413 besed in zajema sodobno občno besedje. Seznam je uporabljen v preizkusu besedišča, s katerim bodo pridobljeni podatki o razširjenosti besed, tj. o deležu govorcev slovenskega jezika, ki poznajo posamezno besedo. Rezultati bodo prispevali k boljšemu razumevanju mentalnega leksikona govorcev slovenščine.


