Inhaltspezifische Aktionen

Blog

Unser Blog begleitet den Aufbau des Korpus GiesKaNe (GIESsenKAsselNEuhochdeutsch). GiesKaNe ist ein syntaktisch tief annotiertes Korpus des Neuhochdeutschen, das in Ergänzung zum DTA (= Deutsches Textarchiv) einen Beitrag zu Referenzkorpora der Sprachgeschichte des Deutschen leisten will.

Der Aufbau eines Korpus ist eine vielschichtige Aufgabe. Es sind nicht nur scheinbar unendlich viele Entscheidungen zur Umsetzung der linguistischen Texterschließung in der Annotation zu treffen (bspw. zur Tokenisierung, also Festlegung der grundlegenden Analyseeinheiten, oder auch zum Umgang mit Ambiguität und Zweifelsfällen), sondern gerade auch die Überlegungen zur Nutzung aktuell verfügbarer Methoden der Datenaufbereitung und -präsentation spielen eine große Rolle im Arbeitsalltag. Ein auf zwei Standorte verteiltes Projekt hat sich darüber hinaus aber auch mit grundlegenden Fragen der Projektlogistik und des Datenmanagements zu beschäftigen.

Und schließlich sind da noch die Texte: Da GiesKaNe als ausgewogenes Korpus geplant ist, deckt es die Funktionalstile Alltagssprache, Wissenschaftssprache, Gebrauchsliteratur und Belletristik ab. In der alltäglichen Arbeit sind wir daher mit den unterschiedlichsten Textinhalten konfrontiert: Von wissenschaftlichen Abhandlungen zu sozialer Differenzierung (Georg Simmel) über die Reiseerlebnisse eines Kannengießers im 17. Jahrhundert (Augustin Güntzer) bis hin zu Überlegungen zum Umgang mit Vampiren (Harenberg).

Unser Blog begleitet den Aufbau von GiesKaNe in dem Sinne, dass es Beobachtungen und Überlegungen aus der gesamten Bandbreite des Arbeitsalltags vorstellt. Der Blog bietet somit Einblicke in die Irrungen und Wirrungen, aber auch Überraschungen, die das Projektteam im Alltag erlebt.