Benutzer:Das.eis/Entwurf
Entwurf
Das Ubiquitous Knowledge Processing Lab (kurz UKP Lab) ist ein Forschungsinstitut am Fachbereich Informatik der Technischen Universität Darmstadt. Es wurde 2006 von Prof. Dr. Iryna Gurevych gegründet.
Struktur
Wissenschaftliches Profil
- Sprachverstehen für Information Management im Web (und Außerhalb): Effiziente Orientierung in der Informationsgesellschaft ermöglichen, Grundlagenforschung und praktische Anwendungen
- 3 Bereiche
- Interdisziplinäre Ausrichtung: zwischen Informatik, Sprachwissenschaft, Pädagogik und Geisteswissenschaften. Web-Technologien.
- Internationale Publikationen/
- Medienpräsenz
Projekte
Allgemeines bla:Customer-Relationship-Management, etc
Projekte sind unter anderem:
- THESEUS TEXO: In diesem Projekt werden Infrastrukturen für internet-basierte Dienste unter Einsatz semantischer Technologien entwickelt. Das Projekt wird gefördert vom Bundesministerium für Wirtschaft und Technologie im Rahmen des Leuchtturmprojekts THESEUS.
- SIGMUND - Semantik- und Emotionsbasiertes Gesprächsmanagement in der Kundenberatung. Durch Einsatz von Sprachtechnologie (Spracherkennung, Text Mining) werden dem Berater kontextrelevante Informationen in Echtzeit übermittelt. Das Projekt word gefördert vom Bundesministerium für Bildung und Forschung und Deutschen Institut für Luft- und Raumfahrt (DLR).
- Wikulu - Self Organizing Wikis: Dieses Projekt zur Entwicklung selbst-organisierender Wikis wird gefördert von der Klaus Tschira Stiftung.
- SIR - Semantic Information Retrieval: Projekt zur Entwicklung von Information Retrieval Algorithmen unter Einsatz von Semantic Relatedness und Web-basierten linguistischen Wissensquellen. Projektpartner sind Karls Universität Tübingen und Bundesagentur für Arbeit, Förderer ist die Deutsche Forschungsgemeinschaft.
- Educational Web 2.0: Entwicklung von Techniken für die (semi)automatische Entwicklung von Lern-, Lehr- und Prüfungsmaterialien unter Einsatz computerlinguistischer Verfahren. Projektpartner sind u.a. Leibniz Institut DIPF und DFKI
- Kollaboration mit Leibniz Institut DIPF, sowie was war das andere
- Gefördert von..
Software
Forschung
Am UKP Lab werden Methoden für automatisches Textverstehen entwickelt und in Systemen eingesetzt, die sich mit Information Retrieval, Frage-Antwort-Systemen und automatischer Strukturierung von Informationen in Wikis befassen[1].
Das UKP Lab ist eines der führenden Forschungsinstitute in der automatischen Sprachverarbeitung, die im Bereich der Erschließung von Web 2.0 Inhalten als Quelle lexikalisch semantischer Information für die automatische Textanalyse arbeiten. Wikipedia und Wiktionary werden als kollaborativ entwickelte lexikalisch-semantische Wissensdatenbanken eingesetzt, unter anderem mit dem Ziel, von Experten manuell erstellte linguistische Datenbanken wie WordNet zu erweitern. Ein Forschungsziel ist die Entwicklung mit semantischer Information erweiterter "intelligenter" Algorithmen für Websuche und Frage-Antwort-Systeme. Ein Beispiel hierfür ist die sogenannte "semantische Suche": Gibt ein Nutzer die Anfrage "Kuchen -Obst" in eine herkömmliche Suchmaschine ein, so wird diese Seiten liefern, die das Wort "Kuchen" aber nicht das Wort "Obst" enthalten. Es werden jedoch auch Seiten zu "Apfelkuchen" gefunden. Eine intelligente Suchmaschine "versteht", dass der Nutzer nur an Kuchenrezepten interessiert ist, die kein Obst, also auch keine Äpfel, enthalten und geeignete Seiten zurückgeben[2].
Die Forschung am UKP Lab befasst sich auch mit der automatischen Qualitätsbewertung von Texten und Sentimentanalyse, der automatischen Identifizierung der Meinung eines Autors zu Themen, die in dem von ihm verfassten Text behandelt werden.
Die Forschungsaktivitäten am UKP Lab sind in die folgenden Bereiche gegliedert:
- Automatische Sprachverarbeitung für E-Learning ("Educational Natural Language Processing")
- Sprachübergreifendes semantisches Informationsmanagement ("Multilingual Semantic Information Management")
- Automatische Sprachverarbeitung für Wikis ("Natural Language Processing and Wikis")
Ein weiterer Schwerpunkt der Forschung am UKP Lab ist der Einsatz von Algorithmen der Sprachverarbeitung und des Text Mining in praktischen Anwendungen. Dazu kollaboriert das UKP Lab mit Partnern aus Forschung und Industrie. Beispiele sind Anwendungen in Customer-Relationship-Management, Digital Humanities, E-Learning, oder im Bereich "öffentliche Sicherheit".
Software
Teil der Forschungsvorhaben am UKP Lab ist die Entwicklung von Software zur automatischen Sprachverarbeitung. Die folgenden Software-Pakete werden für Forschungszwecke kostenlos zur Verfügung gestellt:
DKPro
DKPro ist die Abkürzung für "Darmstadt Knowledge Processing Software Repository". DKPro baut auf der von IBM entwickelten offenen Plattform UIMA ("Unstructured Information Management Architecture") auf und stellt robuste, direkt einsetzbare (Software-Komponenten) für die automatische Sprachverarbeitung bereit.
DKPro enthält Komponenten für grundlegende Anwendungen der automatischen Sprachverarbeitung, wie zum Beispiel Part-of-Speech Tagging und Lemmatisierung. Darüber hinaus sind Komponenten enthalten, die die Verarbeitung von benutzergenerierten Web 2.0 Texten ermöglichen. Benutzergenerierter Text ist ungeeignet für die direkte Verarbeitung mit Sprachverarbeitungssoftware, die für redaktionell aufbereiteten Text entwickelt wurde, denn er enthält viele Rechtschreibfehler, Abkürzungen und Emoticons. DKPro stellt Komponenten für die Aufbereitung von Web 2.0 Text bereit, die vor der Weiterverarbeitung mit Standardwerkzeugen eingesetzt werden.
Wikipedia API
Die Java Wikipedia Library (JWPL)[3] wurde ebenfalls am UKP Lab entwickelt. JWPL ist eine Java-basierte API für Wikipedia und ermöglicht strukturierten programmatischen Zugang zu allen Informationen in Wikipedia.
Wiktionary API
Die Java Wiktionary Library (JWKTL)[3] ermöglicht programmatischen Zugriff auf die Informationen in den englischen und deutschen Versionen von Wiktionary.
Einzelnachweise
Weblinks
- Homepage Ubiquitous Knowledge Processing Lab
- Homepage Prof. Dr. Iryna Gurevych
- DKPro
- Wikipedia API
- Wiktionary API
Kategorie:Forschungseinrichtung (Informatik) Kategorie:Bildung und Forschung in Darmstadt