Rezumat articol ediţie STUDIA UNIVERSITATIS BABEŞ-BOLYAI

În partea de jos este prezentat rezumatul articolului selectat. Pentru revenire la cuprinsul ediţiei din care face parte acest articol, se accesează linkul din titlu. Pentru vizualizarea tuturor articolelor din arhivă la care este autor/coautor unul din autorii de mai jos, se accesează linkul din numele autorului.

 
       
         
    STUDIA PHILOLOGIA - Ediţia nr.3 din 2020  
         
  Articol:   CLASIFICARE AUTOMATIZATĂ A DIFERITELOR VARIANTE DE NORVEGIANĂ UTILIZÂND EXTRAGEREA DIGITALIZATĂ A TEXTELOR NEANOTATE / AUTOMATISERT KLASSIFIKASJON AV NORSKE MÅLFORMER VHA. DATAUTVINNING AV UANNOTERT TEKST.

Autori:  FARTEIN THORSEN ØVERLAND.
 
       
         
  Rezumat:  
DOI: 10.24193/subbphilo.2020.3.08
Published Online: 2020-09-30
Published Print: 2020-09-30
pp. 107-124
FULL PDF

Clasificare automatizată a diferitelor variante de norvegiană utilizând extragerea digitalizată a textelor neanotate. Acest articol prezintă un model pentru clasificarea automată a diferitelor variante ale limbii norvegiene moderne (bokmål și nynorsk, între 1930 și 2011) cu ajutorul extragerii automatizate a textului neanotat. Modelul este construit în interfața de programare vizuală Orange și se bazează pe modificarea unui model-exemplu prezentat de proiect, care a avut ca scop inițial clasificarea semantică a tipurilor de povești din indexul Aarne-Thompson-Uther. Modulele de bază ale modelului sunt Bag-of-Words și Regresie logistică. Modelul este axat pe patru traduceri diferite ale Evangheliei lui Ioan și este validat de alegerea aleatorie a fragmentelor. Modelul s-a dovedit a fi foarte solid pentru clasificarea variației limbii norvegiene și obține o clasificare corectă în 100% din testări.

Cuvinte-cheie: variația limbii, extragerea digitalizată, interfața de programare Orange, clasificarea textelor, Bag-of-Words, regresie logistică, model predictibil, limbă norvegiană, nynorsk, bokmål
 
         
     
         
         
      Revenire la pagina precedentă