Benutzer:Toschit/Sprachressourcen
aus Wikipedia, der freien Enzyklopädie
< Benutzer:Toschit
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 19. Juli 2013 um 14:49 Uhr durch imported>Toschit(1687077) (References tag ergänzt).
Sprachressourcen sind Sammlungen von Sprachdaten, die in der sprachwissenschaftlichen Forschung entstehen. Dazu zählen:
- Textkorpora: große (elektronische) Sammlungen von Texten mit Zusatzinformationen, die von Forschern verwendet werden, um die Grammatik - genauer die Syntax - von Sprachen zu untersuchen, die Bedeutung von Wörtern, Phrasen und Sätzen zu verstehen (Semantik) oder als Grundlage für lexikalische Ressourcen zu verwenden. Auch zur Erforschung von Sprachentwicklung und Sprachverarbeitung werden solche Sammlungen eingesetzt, ebenso in der Übersetzungswissenschaft.
- Multimodale Korpora: Sammlungen von Sprachaufnahmen (Audio, Video, etc. ) und ihrer zeitlichen alignierten Transkription - diese werden sowohl in der Spracherkennung, Sprachsynthese aber auch in der Erforschung von Spracherwerb, Sprachstörungen, etc. verwendet. Siehe auch [1]
- lexikalische Ressourcen von historischen Enzyklopädien bis WordNets oder Datenbanken, die in Programmen der automatischen Sprachverarbeitung verwendet werden, etwa in Software, Übersetzung, etc.
- Grammatiken
- Sprachexperimente, zum Beispiel zum Sprachverstehen oder zum Spracherwerb
- Besondere Computerprogramme mit denen Sprachdaten analysiert und weiterverarbeitet werden können.
Weiterführende Literatur
- ↑ Gibbon, et al. Handbook of Standards and Resources for Spoken Language Systems, Mouton de Gruyter, Berlin, 1997
DOI 10.1007/978-1-4615-4501-9