Inhaltspezifische Aktionen

Korpus

Das Korpus, das aus je drei nähesprachlichen und je einem distanzsprachlichen Text aus der zweiten Hälfte des 17. Jh. und der zweiten Hälfte des 19. Jahrhunderts besteht, ist Bestandteil des noch im Aufbau befindlichen Nähekorpus, das die Grundlage für die geplante Sprachstufengrammatik des Neuhochdeutschen (vgl. Ágel o.J.) bilden soll. Die Grundprinzipien der Korpuserstellung auf der Basis einer operationalisierbaren Nähe-Distanz-Theorie sind im Sammelband “Grammatik aus Nähe und Distanz” (Ágel/Hennig 2006) dokumentiert. Neben der Nähesprachlichkeit eines Korpustextes sind weitere Auswahlkriterien für die Korpuserstellung im Rahmenprojekt die Textlänge (alle Texte sollen einen Umfang von 12000 Wortformen aufweisen) und die regionale Verteilung der Texte. Dabei wird eine gleichrangige Verteilung von Korpustexten auf die drei dialektalen Großräume angestrebt. Als geeignete Textsorten für die Erstellung eines Nähekorpus haben sich insbesondere Privatbriefe, Tagebücher und Lebensberichte einfacher Leute erwiesen. Das Projektkorpus besteht aus den folgenden Texten:

 

Übersicht 1: Zusammensetzung des Korpus²
Text Textsorte Dialektraum Nähewerte
Mikro Makro Gesamt
Nähetexte Güntzer I Lebensbericht obd. 28,8 48,3 38,6
Bauernleben Chronik md. 26,2 44,4 35,3
Söldnerleben I Lebensbericht nd.¹ 24,2 62,7 43,4
Distanzkontrolltext Thomasius I 3,3 2,0 2,6
Nähetexte Zimmer V Tagebuch obd. 14,7 43,2 29
Koralek V Tagebuch md. 14,7 63,2 39
Briefwechsel V Privatbriefe nd. 41,8 36,7 39,3
Distanzkontrolltext Nietzsche V 4,9 3,4 4,1

Als ‘Nähetexte’ sind dabei solche Texte zu verstehen, die einen möglichst hohen Wert an Nähesprachlichkeit auf Mikro- und Makroebene aufweisen. Gemäß der in Ágel/Hennig (2006) vorgestellten Methode zur Ermittlung der Nähesprachlichkeit eines Textes weisen alle als ‘Nähetexte’ gekennzeichneten Texte einen Grad an Nähesprachlichkeit von etwa 30-40% auf. Für schriftsprachlich überlieferte Texte ist dies ein hoher Wert, mit hundertprozentig nähesprachlichen Texten kann hier nicht gerechnet werden. Nähetexte sind also solche Texte, die deutlich nähesprachlicher als andere schriftsprachlich überlieferte Texte ihrer Zeit sind. Distanztexte sind dagegen solche Texte, die kaum Nähemerkmale enthalten. Während das Korpus im Nähebereich gleichmäßig auf die drei dialektalen Großräume verteilt ist, damit die Möglichkeit gegeben ist, eine eventuelle dialektale Prägung der Merkmale zu berücksichtigen, wird in Bezug auf den Distanzbereich auf eine solche Möglichkeit verzichtet, weil hier ohnehin kaum mit einer ausgeprägten dialektalen Prägung der Texte zu rechnen ist. Vielmehr haben die Distanztexte ausschließlich Kontrollfunktion in Bezug auf die Nähetexte, d.h., mit Hilfe der Distanztexte soll sichergestellt werden, dass solche Merkmale, die mit der Nähesprachlichkeit von Texten in Beziehung gesetzt werden, tatsächlich bevorzugt in nähesprachlichen Texten vorkommen. Aufgrund der Kontrollfunktion wird die Berücksichtigung eines Distanztextes pro Zeitabschnitt als ausreichend angesehen.

 

 

¹Um die regionale Zugehörigkeit der Texte festzustellen, wurde zum Projektanfang externe dialektologische Expertise herangezogen. Im Falle von “Söldnerleben I” ergab der Dialektcheck die Einordnung ‘Niederdeutsch’, was zur Aufnahme des Textes in das Junktionskorpus geführt hatte. Gegen Ende des Projekts ist allerdings ein eher zufälliger zweiter externer Dialektcheck (durch einen anderen Dialektologen) zu der Einordnung ‘Mitteldeutsch’ gekommen. Diese Diskrepanz konnte im Rahmen des Projekts nicht mehr berücksichtigt werden.

²Die römischen Ziffern beziehen sich auf die Zeitabschnitte: I = 1650-1700, V = 1850-1900.