Benutzer:Toschit/Sprachressourcen

aus Wikipedia, der freien Enzyklopädie

Sprachressourcen sind Sammlungen von Sprachdaten, die in der sprachwissenschaftlichen Forschung entstehen. Dazu zählen:

  • Textkorpora: große (elektronische) Sammlungen von Texten mit Zusatzinformationen, die von Forschern verwendet werden, um die Grammatik - genauer die Syntax - von Sprachen zu untersuchen, die Bedeutung von Wörtern, Phrasen und Sätzen zu verstehen (Semantik) oder als Grundlage für lexikalische Ressourcen zu verwenden. Auch zur Erforschung von Sprachentwicklung und Sprachverarbeitung werden solche Sammlungen eingesetzt, ebenso in der Übersetzungswissenschaft.
  • Multimodale Korpora: Sammlungen von Sprachaufnahmen (Audio, Video, etc. ) und ihrer zeitlichen alignierten Transkription - diese werden sowohl in der Spracherkennung, Sprachsynthese aber auch in der Erforschung von Spracherwerb, Sprachstörungen, etc. verwendet. Siehe auch [1]
  • lexikalische Ressourcen von historischen Enzyklopädien bis WordNets oder Datenbanken, die in Programmen der automatischen Sprachverarbeitung verwendet werden, etwa in Software, Übersetzung, etc.
  • Grammatiken
  • Sprachexperimente, zum Beispiel zum Sprachverstehen oder zum Spracherwerb
  • Besondere Computerprogramme mit denen Sprachdaten analysiert und weiterverarbeitet werden können.

Weiterführende Literatur

  1. Gibbon, et al. Handbook of Standards and Resources for Spoken Language Systems, Mouton de Gruyter, Berlin, 1997

DOI 10.1007/978-1-4615-4501-9