UAIC Romanian Part of Speech Tagger


Acest Part Of Speech tagger românesc combină un model statistic cu unul bazat pe reguli. Dicționarul morfologic a fost extras în mare parte din DexOnline și conține 1,25 milioane de cuvinte distincte. POS tagger-ul are o precizie de 96.6% pe o varianta corectată a corpusului "1984"

Pentru orice utilizare a acestor resurse și instrumente vă rog să referiți una din lucrările următoare:

WSDL
maxim 10000000 caractere

Dicționarul morfologic folosit se găsește aici.