Rezumat articol ediţie STUDIA UNIVERSITATIS BABEŞ-BOLYAI

În partea de jos este prezentat rezumatul articolului selectat. Pentru revenire la cuprinsul ediţiei din care face parte acest articol, se accesează linkul din titlu. Pentru vizualizarea tuturor articolelor din arhivă la care este autor/coautor unul din autorii de mai jos, se accesează linkul din numele autorului.

 
       
         
    STUDIA INFORMATICA - Ediţia nr.Sp.Issue 1 din 2009  
         
  Articol:   A ROMANIAN STEMMER.

Autori:  CLAUDIU SORIN IRIMIAŞ.
 
       
         
  Rezumat:   This paper presents an improvement of the Romanian stemmer algorithm described on Martin Porters Snowball web-site. The changes made to the original algorithm are minimal but our experimental results indicate an increase of the accuracy with almost 10%, no loss being identified in the computationaltime. Two different experiments were made, the first was made on a 22,570 Romanian words vocabulary, and the second was accomplished using an article from a Romanian newspaper as input. The Romanian stemmer is based on a suffix stripping algorithm which consists of a set of rules to be applied to theinput word to find its root form. Because of its efficiency, especially in regards totime and accuracy the Romanian suffix stripping algorithm is suited to be usedin the information retrieval field for problems that require a smaller amount of computational time and do not necessitate that the accuracy of the result is over 80%.

Key words and phrases. suffix striping, stemming algorithm, Romanian stemmer.
 
         
     
         
         
      Revenire la pagina precedentă