Dynamický rozvoj jazyka sa najvýraznejšie prejavuje v slovnej zásobe, ktorá je zároveň istým obrazom života používateľov jazyka a celej spoločnosti. Časť slovnej zásoby sa opisuje v rôznych typoch slovníkov: zvyčajne ide o najpoužívanejšie slová s ich významami (výkladový slovník), vzťahmi k iným slovám (synonymický slovník, prekladové slovníky) a pod. Najčastejšie používané slová sa v minulosti zisťovali ručnou analýzou jazykového materiálu obmedzeného rozsahu, v súčasnosti sa zisťujú pomocou štatistických nástrojov na veľkých textových korpusoch, ktoré sú vybudované aj pre slovenský jazyk.
Prvý frekvenčný slovník slovenčiny bol vydaný pred takmer 50 rokmi (Jozef Mistrík: Frekvencia slov v slovenčine. Bratislava: Vydavateľstvo Slovenskej akadémie vied 1969) a bol založený na 1 milióne slov z vtedajších textov. Nový frekvenčný slovník zachytáva slovnú zásobu súčasnej slovenčiny, ako sa používala v rozpätí 25 rokov z prelomu 20. a 21. storočia, a je založený na textových a jazykových zdrojoch Slovenského národného korpusu Jazykovedného ústavu Ľ. Štúra SAV:
- na korpuse prim-7.0-frk v rozsahu vyše 250 miliónov slovných a iných jednotiek nachádzajúcich sa v textoch z r. 1991 – 2015, ktorých zloženie je vyvážené (umelecký, náučný a publicistický štýl sú zastúpené rovnako jednou tretinou textov);
- na morfologickej databáze – slovníku tvarov Slovenského národného korpusu.
Frekvenčný slovník slovenčiny na báze Slovenského národného korpusu
obsahuje takmer 30 000 najfrekventovanejších slov v týchto častiach:
Slovník lem podľa absolútnej frekvencie
Slovník lem podľa priemernej redukovanej frekvencie
Slovník lem podľa abecedy s rozšírenými frekvenčnými údajmi
Údaje o ďalších jednotkách sú spracované v doplňujúcich frekvenčných zoznamoch: Frekvenčný zoznam interpunkčných znamienok, Frekvenčný zoznam grafických symbolov a číslic, Frekvenčný zoznam grafém, Frekvenčný zoznam grafém stojacich na začiatku slov, Frekvenčný zoznam slovných druhov. Frekvenčné slovníky a zoznamy sú využiteľné v ďalšom počítačovom spracovaní slovenčiny, pri tvorbe slovníkov a pri výskume jazyka v rôznych, aj nelingvistických oblastiach.
Odborní recenzenti:
Doc. Solomija Buk, Ph.D.
Mgr. Michal Křen, Ph.D.