Inhaltspezifische Aktionen

Seiteneinsteiger:innenkorpus SeiKo

Das Seiteneinsteiger:innenkorpus (SeiKo) dokumentiert den Zweitspracherwerb von neu zugewanderten Kindern und Jugendlichen im schulischen Kontext. Es enthält mündliche und schriftliche Sprachdaten, die im Rahmen von Intensivklassen erhoben wurden.

SeiKo entsteht im Rahmen des DFG-Projekts Erwerb und Ausbau von Nominalgruppen durch neu zugewanderte jugendliche Lerner:innen an der Justus-Liebig-Universität Gießen. Mitarbeiter:innen des Projekts sind und waren:

Prof. Dr. Jana Gamper (Projektleitung)
Julia Schlauch (Wissenschaftliche Mitarbeit)
Aylin Braunewell (Wissenschaftliche Mitarbeit)
Dominik Kainz (Datenerhebung und Transkription)
Laura Meige (Transkription und Segmentierung)
Anna Vogel (Datenerhebung und Transkription)
Pauline Wardenski (Transkription)

Korpushandbuch

Eine erste Version des Korpushandbuches folgt in Kürze.

Korpusnutzung

Eine Veröffentlichung des Korpus ist für einen wissenschaftlichen Nutzer:innenkreis nach Projektabschluss geplant.

Kontext: Intensivklassen

Seiteneinsteiger:innen bilden eine sehr heterogene Gruppe, etwa hinsichtlich ihrer sprachlichen Hintergründe, Alter und Beschulungsmodalitäten. Gemeinsam ist ihnen lediglich, dass sie im schulpflichtigen Alter mit für den Regelunterricht unzureichenden Deutschkenntnissen nach Deutschland kommen (vgl. Massumi/von Dewitz 2015).

In den meisten Bundesländern existieren sogenannte Intensiv- oder Vorbereitungsklassen. Sie dienen als Übergangsphase mit dem Ziel, durch gezielte Sprachförderung die Integration in Regelklassen zu ermöglichen. Die sprachliche Entwicklung in dieser Phase ist allerdings vor allem im Hinblick auf den Erwerb bildungssprachlicher Kompetenzen bislang nur wenig erforscht (vgl. Goltsev/von Dewitz 2023, Twente/Marx im Druck).

Ziele von SeiKo

Neu zugewanderte Schüler:innen stehen vor der Herausforderung, in kurzer Zeit nicht nur basale kommunikative Fähigkeiten, sondern auch solche schulspezifischen Kompetenzen zu erwerben, die eine möglichst erfolgreiche Teilnahme am Regelunterricht ermöglichen. Im Fokus von SeiKo steht daher die Entwicklung der Verbstellung, die als Stellvertreter für den basalen Spracherwerb angesehen wird (vgl. die Processability Theory nach Pienemann 1998 sowie Czinglar 2014, 2018 und Schlauch 2022), sowie Attribution von Nominalgruppen als Merkmal ausgebauter Varietäten (vgl. Gamper 2022). Von besonderem Interesse ist das Zusammenspiel dieser Bereiche (vgl. Braunewell et al., angenommen).

Korpusdesign

SeiKo folgt einem longitudinalen Design mit monatlichen Datenerhebungen an hessischen Schulen. Grundlage ist ein Interviewsetting (inspiriert vom Language Situations-Ansatz von Wiese (2020). Mit Hilfe einer Auswahl von sechs Bildergeschichten werden Sprachdaten zu unterschiedlichen Sprechanlässen und Modalitäten (mündlich vs. schriftlich) elizitiert, um registerspezifische Variation sichtbar zu machen (vgl. Lüdeling et al. 2022).

Die Datenerhebung umfasst fünf Teile:

  • N-Part (narrative): mündliches Nacherzählen der Bildergeschichte für die Interviewer:innen
  • Q-Part (questionnaire): Verständnisfragen zur Sicherung des Textverständnisses
  • D-Part (decontextualised): diktierter Bericht für je abwesende Adressat:innen, z. B. eine Lehrer:in
  • T-Part (text): eigenständiger schriftlicher Bericht für diese Adressat:innen
  • F-Part (free): offenes Gespräch über Schule, Freizeit und Alltag

Datenaufbereitung und Annotation

Die erhobenen Daten werden manuell transkribiert und segmentiert (basierend auf Analysis of Speech Units, Foster et al. 2000). Für die mehrstufige Mehrebenannotation kommt der EXMARaLDA Partitur-Editor (Schmidt/Wörner 2014) zum Einsatz.

Die Annotation umfasst:

  • automatische Lemmatisierung (korrigiert)
  • automatisches POS-Tagging mit TreeTagger (Schmid 1995, korrigiert)
  • Annotation der Verbstellung (auf Basis modifizierter DAKODA-Spezifikationen, Ruppenhofer et al. 2024)
  • Annotation von Nominalgruppen und Attribution (Braunewell et al., angenommen)

Die XML-basierten EXMARaLDA-Dateien werden mit Hilfe einer Annatto-Pipeline zu einem ANNIS-Korpus konvertiert.

Vorliegende Annotationsebenen sind

Ebene Hinweise
tok_part tokenisierte Sprecher:innenspur
ctok_part von Pausen und Hesitationsmarkern bereinigte ctok_part-Spur
pos mit Treetagger automatisch erzeugtes und manuell korrigiertes part-of-speech-Tagging
lemma mit Treetagger automatisch erzeugte und manuell korrigierte Lemmatisierung
unit segmentierte Äußerungseinheiten
subclause abhängige Nebensätze
cons Satzkonstituenten 
stage Verbstellungsstufe     
ngr Nominalgruppen     
kern nominale Kerne

Subkorpora und Korpusgröße

Weil SeiKo in zwei Intervallen erhoben wurde, umfasst es die Subkorpora SeiKo1 und SeiKo2. Die Erhebung und Aufbereitung von SeiKo1 ist bereits größtenteils abgeschlossen und das Subkorpus umfasst folgende Elemente:

Ebene Größe
Elemente auf der Tokenspur 68.118
Elemente auf der bereinigten Tokenspur 42.999
Satzgefüge 9.440
Verbhaltige Satzgefüge 7.119
Nominalgruppen 6.071

SeiKo2 befindet sich derzeit noch in der Erhebungs- und Datenaufbereitungsphase.


Literatur (*Publikationen zu SeiKo)

Ahrenholz, B., Fuchs, I., & Birnbaum, T. (2016). “dann haben wir natürlich gemerkt der übergang ist der knackpunkt”—Modelle der Beschulung von Seiteneinsteigern in der Praxis. BiSS-Journal, 5.

Ahrenholz, B., & Maak, D. (2013). Zur Situation von SchülerInnen nicht‐deutscher Herkunftssprache in Thüringen unter besonderer Berücksichtigung von Seiteneinsteigern Abschlussbericht zum Projekt „Mehrsprachigkeit an Thüringer Schulen (MaTS)“, durchgeführt im Auftrage des TMBWK (Abschlussbericht Zum Projekt „Mehrsprachigkeit an Thüringer Schulen (MaTS)“, Durchgeführt Im Auftrage Des TMBWK No. Band 1; Berichte Und Materialien Www.Daz‐portal.de Bd. 1). Friedrich-Schiller-Universität Jena. https://www.daz-portal.de/de/publikationen/berichte-und-materialien/pdf-dateien-berichte-und-materialien/bm_band_01_mats_bericht_20130618_final.pdf

*Braunewell, A., Schlauch, J., & Gamper, J. (angenommen). Von der Verbstellung zur erweiterten Nominalgruppe? Zum Verhältnis zwischen verbalen und nominalen Ausbaustrukturen bei neu zugewanderten Schüler:innen in Vorbereitungsklassen. Germanistische Linguistik.

Czinglar, C. (n.d.). Zweitspracherwerb im Jugendalter. Die Bedeutung des Alters und literaler Kompetenzen von neu zugewanderten Jugendlichen. In N. Dewitz, H. Terhart, & M. Massumi (Eds.), Neuzuwanderung und Bildung Eine interdisziplinäre Perspektive auf Übergänge in das deutsche Bildungssystem (pp. 158–173).

Czinglar, C. (2014). Grammatikerwerb vor und nach der Pubertät: Eine Fallstudie zur Verbstellung im Deutschen als Zweitsprache. de Gruyter.

Decker-Ernst, Y. (2017). Deutsch als Zweitsprache in Vorbereitungsklassen: Eine Bestandsaufnahme in Baden-Württemberg. Schneider Verlag Hohengehren GmbH.

Diebel, J., & Ahrenholz, B. (2023). Schulische und sprachliche Voraussetzungen von Seiteneinsteiger*innen. Ergebnisse einer schriftlichen Befragung. In U. Ohm & J. Ricart Brede (Eds.), Zum Seiteneinstieg neu zugewanderter Jugendlicher ins deutsche Schulsystem: Ergebnisse und Befunde aus dem Projekt EVA-Sek (pp. 19–56). Schneider Verlag Hohengehren.

Foster, P., Tonkyn, A., & Wigglesworth, G. (2000). Measuring Spoken Language: A Unit for All Reasons.

Fuchs, I. (2022). Entscheidungskriterien und Gelingensbedingungen der erfolgreichen schulischen Integration neu zugewanderter SchülerInnen aus der Perspektive professioneller AkteurInnen – Ergebnisse einer Befragung. Arbeitspapiere EVA-Sek, Band 3. https://www.geku.uni-passau.de/fileadmin/dokumente/fakultaeten/geku/lehrstuehle/brede/EVA-Sek_AP3_2022-12-31.pdf

Gamper, J. (2022). Ausbau nominaler Strukturen in der Sekundarstufe I. Eine textkorpusanalytische Studie. KorDaF, 2(2), 13–42. https://doi.org/10.48694/kordaf.3551

Goltsev, E., & von Dewitz, N. (2023). Studien zu schulisch relevanten Kompetenzen neu zugewanderter Schüler*innen – Ein Scoping Review zur aktuellen Forschungslandschaft [PDF,XML]. https://doi.org/10.48694/ZIF.3732

Grein, M. (2024). Deutschförderkonzepte: Inland und Ausland im Vergleich. In H. Reiche & J. Schindler (Eds.), Sprachförderung in DaZ (pp. 13–36). Frank & Timme. https://doi.org/10.26530/20.500.12657/91166

Höckel, L. S., & Schilling, P. (2022) : Starting off on the right foot: Language learning classes and the educational success of immigrant children. Ruhr Economic Papers, No. 983. https://doi.org/10.4419/96973148

Karakayalı, J., Zur Nieden, B., Kahveci, Ç., Groß, S., & Heller, M. (2017): Die Kontinuität der Separation. Vorbereitungsklassen für neu zugewanderte Kinder und Jugendliche im Kontext historischer Formen der separierten Beschulung. Die Deutsche Schule, 109 (3), 223-235. https://doi.org/10.25656/01:25881  

Krause, T. (with Berlin, H.-U. Z., & Berlin, H.-U. Z.). (2019). ANNIS: A graph-based query system for deeply annotated text corpora. Humboldt-Universität zu Berlin. https://edoc.hu-berlin.de/handle/18452/20436

Lüdeling, A., Alexiadou, A., Adli, A., Donhauser, K., Dreyer, M., Egg, M., Feulner, A. H., Gagarina, N., Hock, W., Jannedy, S., Kammerzell, F., Knoeferle, P., Krause, T., Krifka, M., Kutscher, S., Lütke, B., McFadden, T., Meyer, R., Mooshammer, C., … Zeige, L. E. (2022). Register: Language Users’ Knowledge of Situational-Functional Variation. Register Aspects of Language in Situation, 1, 1–58. https://doi.org/10.18452/24901

Lüdeling, A., Hirschmann, H., Shadrova, A., & Wan, S. (2021). Tiefe Analyse von Lernerkorpora. In H. Lobin, A. Witt, & A. Wöllstein (Eds.), Deutsch in Europa: Sprachpolitisch—Grammatisch—Methodisch (Vol. 2020, pp. 235–284). De Gruyter. https://doi.org/10.1515/9783110731514-013

Massumi, M., & von Dewitz, N. (2015). Neu zugewanderte Kinder und Jugendliche im deutschen Schulsystem.

Petersen, I. (2025). Die Umsetzung des Mehrstufenmodells der DaZ-Sprachbildung für neu zugewanderte Schüler:innen an Schulen in Schleswig-Holstein: Ergebnisse einer Online-Befragung mit Lehrkräften. https://doi.org/10.38071/2025-00511-2

Pienemann, M. (1998). Developmental dynamics in L1 and L2 acquisition: Processability Theory and generative entrenchment. Bilingualism: Language and Cognition, 1(1), 1–20. https://doi.org/10.1017/S1366728998000017

Ruppenhofer, J., Schwendemann, M., Portmann, A., & Wisniewski, K. (2024). Specification of Processability Theory’s Developmental Stages. Work in Progress.

Rüter, M. (2023). Zwangsmigration und deren psychosoziale Folgen für Jugendliche – eine qualitative Analyse von Interviewdaten. In Zum Seiteneinstieg neu zugewanderter Jugendlicher ins deutsche Schulsystem: Ergebnisse und Befunde aus dem Projekt EVA-Sek (pp. 97–131). Schneider Verlag Hohengehren.

*Schlauch, J. (2022). Erwerb der Verbstellung bei neu zugewanderten Seiteneinsteiger:innen in der Sekundarstufe. Eine Fallstudie aus dem DaZ-Lerner:innenkorpus SeiKo. Korpora Deutsch Als Fremdsprache, 2(2), 43–62. https://doi.org/DOI:%252010.48694/kordaf.3550

Schmid, H. (1995). Improvements in Part-of-Speech Tagging with an Application to Germa. Proceedings of the ACL SIGDAT-Workshop. Dublin, Ireland.

Schmidt, T., & Wörner, K. (2014). EXMARaLDA. In Handbook on Corpus Phonology (pp. 402–419). Oxford University Press.

Schwendemann, M., Portmann, A., Schlauch, J., Gamper, J., & Wisniewski, K. (2024). FORSCHUNGSDATEN FÜR ALLE. Rechtliche Möglichkeiten und Herausforderungen bei der Veröffentlichung von Lernerkorpora. KorDaF, 4(2), 149–176. https://doi.org/10.48694/KORDAF.4138

Shadrova, A., Lüdeling, A., Klotz, M., Hartz, R. G., & Krause, T. (2025). „Step away from the Computer!“: Über die linguistische Datenkategorisierung als Erkenntnisprozess und daraus folgende Herausforderungen bei der Nachnutzung von Annotationen und Annotationstools. Zeitschrift Für Germanistische Linguistik, 53(1), 166–214. https://doi.org/10.1515/zgl-2025-2005

Twente, L., & Marx, N. (im Druck). How do we research language skills and linguistic repertoires of newly immigrated students? A scoping review of studies in German-majority contexts.

Vertovec, S. (2024). Superdiversität: Migration und soziale Komplexität. Suhrkamp.

Winkler, O., & Carwehl, A.-K. (2025). Institutional conditions and acquisition of language skills among young refugees: Investigating the German context. Acta Sociologica. https://doi.org/10.1177/00016993251351531