Ovaj direktorij sadr"zi elektronske resurse vezane za rad: Vlado Ke"selj i Danko "Sipka. Pristup Izgradnji Stemera i Lematizatora za Jezike sa Bogatom Fleksijom i Oskudnim Resursima Zasnovan na Obuhvatanju Sufiksa. INFOteka, "Casopis za Bibliotekarstvo i Informatiku, Broj 1-2, god. IX, maj 2008. Sadr"zaj: 0_PROCXITAJ.TXT - Ova datoteka, koja sadr"zi opise datoteka i neke osnovne informacije na srpskom jeziku. 0_README.TXT - Verzija datoteke 0_PROCXITAJ.TXT na engleskom jeziku. all.zip - Sve datoteke izlistane ovde, osim all.zip, zipovane u jedom paketu. Basic-Serbian-Lexical-Resource.zip Osnovni leksi"cki resurs za srpski jezik, koji je kori"s'cen kao po"cetni resurs u radu. Ova zipovana datoteka sadr"zi slede'ce datoteke: list-w-l - lista parova oblik re"ci/lema list-w - lista oblika re"ci list-l - lista lema Datoteke sadr"ze re"ci koje su dodate, kao "sto je spomenuto u podnaslovu 5.2 rada. Trenutna statistika resursa je: list-l: 47489 lema (0.47 KB) list-w: 675140 oblika re"ci (7.3 MB) list-w-l: 696454 parova oblik re"ci/lema (14.6 MB) vreme-words.zip Tekstualni korpus magazina "Vreme" iz perioda od pet godina, od 2001. do 2005. Korpus je obradjen tako da datoteka sadr"zi samo re"ci, u poretku kao i u magazinu, i po jedna re"c na svaki red. Datotke sadr"zi 6,6 milona re"ci (42 MB). stem-classes.zip Klase stemova onako kako je opisano u Koraku 4.1 (Sekcija 5.3) rada. 677.868 re"ci se nalazi u 41.681 klasa stemova. out-word-stem.zip Generisani parovi re"ci i stemova (677.868 parova, 12,6MB). out-stems.zip Generisani stemovi sa frekvencijama (re"cni"cke frekvencije), 39.311 stemova. out-suffixes.zip Generisani sufiski sa re"cni"ckim frekvencijama (17.848 sufiksa). out-greedy-rules.zip Generisana sufiksna pravila na pohlepni na"cin (1000 pravila, kao "sto je opisano u 4.4b metodi u radu). Pravila se primenjuju kao "sto je to opisano u radu (prioritet na osnovu obuhvatanja sufiksa, tj. du"zi sufiksi imaju ve'ci prioritet). out-opt-rules.zip Generisana optimalna sufiksna pravila (17,838 pravila, kao "sto je opisano u 4.4c metodi u radu). Ova "optimalnost" ne treba da se shvati u smislu najboljeg stemera, nego onako kako je opisano u radu. Pravila se primenjuju kao "sto je to opisano u radu (prioritet na osnovu obuhvatanja sufiksa, tj. du"zi sufiksi imaju ve'ci prioritet). stemmer-greedy.pl Pohlepni stemer, kao "sto je opisano u metodi 4.4b u radu, napisan u programskom jeziku Perl. Ovo je samostalan program u Perlu, koji "cita standardni ulaz (ili datoteke "ciji su nazivi dati u komandnom redu), i daje stemiran izlaz. stemmer-opt.pl* Optimalni sufiksni stemer, kao "sto je opisano u metodi 4.4c u radu, napisan u programskom jeziku Perl. Ovo je samostalan program u Perlu, koji "cita standardni ulaz (ili datoteke "ciji su nazivi dati u komandnom redu), i daje stemiran izlaz. ---