Named-entity recognition

aus Wikipedia, der freien Enzyklopädie

Named-entity recognition (NER) oder Eigennamenerkennung ist eine Aufgabe in der Informationsextraktion und bezeichnet die automatische Identifikation und Klassifikation von Eigennamen. Ein Eigenname ist eine Folge von Wörtern, die eine real existierende Entität beschreibt, wie z. B. ein Firmenname.[1][2]

Zur Evaluierung wird beispielsweise der MUC-7 Datensatz verwendet. Auf diesem wurde nach dem -Maß 93,39 % erreicht, wohingegen Menschen auf diesem Datensatz zwischen 96,95 % und 97,60 % erreichen.[3]

Einzelnachweise

  1. Kai-Uwe Carstensen: Anwendungen. In: Computerlinguistik und Sprachtechnologie. Spektrum Akademischer Verlag, 2010, ISBN 978-3-8274-2023-7, S. 596, doi:10.1007/978-3-8274-2224-8_5 (springer.com [abgerufen am 22. Oktober 2017]).
  2. Jing Jiang: Information Extraction from Text. In: Mining Text Data. Springer, Boston, MA, 2012, ISBN 978-1-4614-3222-7, S. 15, doi:10.1007/978-1-4614-3223-4_2 (springer.com [abgerufen am 22. Oktober 2017]).
  3. https://www-nlpir.nist.gov/related_projects/muc/proceedings/muc_7_proceedings/marsh_slides.pdf