Das GeWiss-Forschungsprogramm als Ausgangspunkt für die computerlinguistische Aufbereitung des GeWiss-Korpus
18.04.2011, Universität Leipzig
Gäste
Dr. Wilfried Schütte (IDS Mannheim)
Dr. Thomas Schmidt (Universität Hamburg, SFB 538 Mehrsprachigkeit)
Dr. Stefan Bordag (MPI für ethnologische Forschung, Halle)
Prof. Gerhard Heyer (Institut für Informatik, Universität Leipzig)
Dr. Thomas Brunotte (VolkswagenStiftung)
Diskussionsfragen
- Präsentation und Diskussion erster Datenauswertungen zur Bearbeitung der geplanten Forschungsfragen und Entwicklung eines Forschungsprogramms
- Diskussion weiterer annotationsrelevanter Fragestellungen an den einzelnen Standorten
- Annotationsansätze in bestehenden gesprochensprachlichen Korpora wie MICASE, BASE, FOLK, die Korpora des SFB 538 Mehrsprachigkeit an der Universität Hamburg
- Bestehende Tagsets zu den Vergleichssprachen im GeWiss-Projekt (Deutsch, Englisch, Polnisch, Bulgarisch) und die Möglichkeiten eines POS-Taggings der gesprochenen GeWiss-Daten
- Erfahrungen mit der orthographischen Normalisierung gesprochener Daten am IDS Mannheim
- Möglichkeiten für eine manuelle Annotation (bspw. von pragmatischen Phänomenen) im EXMARaLDA Software-Paket
- Perspektiven der Anbindung des GeWiss-Projektes an die CLARIN-Infrastruktur