Rezumat articol ediţie STUDIA UNIVERSITATIS BABEŞ-BOLYAI

În partea de jos este prezentat rezumatul articolului selectat. Pentru revenire la cuprinsul ediţiei din care face parte acest articol, se accesează linkul din titlu. Pentru vizualizarea tuturor articolelor din arhivă la care este autor/coautor unul din autorii de mai jos, se accesează linkul din numele autorului.

 
       
         
    STUDIA INFORMATICA - Ediţia nr.2 din 2017  
         
  Articol:   A HYBRID APPROACH FOR SCHOLARLY INFORMATION EXTRACTION.

Autori:  ZALÁN BODÓ, LEHEL CSATÓ.
 
       
         
  Rezumat:  
DOI: 10.24193/subbi.2017.2.01

Published Online: 2017-12-15
Published Print: 2017-12-15
pp. 5-16
VIEW PDF: A Hybrid Approach for Scholarly Information Extraction

Metadata extraction from documents forms an essential part of web or desktop search systems. Similarly, digital libraries that index scholarly literature require to find and extract the title, the list of authors and other publication-related information from an article. We present a hybrid approach for metadata extraction, combining classification and clustering to extract the desired information without the need of a conventional labelled dataset for training. An important asset of the proposed method is that the resulting clustering parameters can be used in other problems, e.g. document layout analysis.

Keywords: information extraction, metadata, machine learning.

2010 Mathematics Subject Classification. 62H30, 68P20.
 
         
     
         
         
      Revenire la pagina precedentă