Seiteneinsteiger:innenkorpus SeiKo
Das Seiteneinsteiger:innenkorpus (SeiKo) dokumentiert den Zweitspracherwerb von neu zugewanderten Kindern und Jugendlichen im schulischen Kontext. Es enthält mündliche und schriftliche Sprachdaten, die im Rahmen von Intensivklassen erhoben wurden.
SeiKo entsteht im Rahmen des DFG-Projekts Erwerb und Ausbau von Nominalgruppen durch neu zugewanderte jugendliche Lerner:innen an der Justus-Liebig-Universität Gießen. Mitarbeiter:innen des Projekts sind und waren:
Prof. Dr. Jana Gamper (Projektleitung)
Julia Schlauch (Wissenschaftliche Mitarbeit)
Aylin Braunewell (Wissenschaftliche Mitarbeit)
Dominik Kainz (Datenerhebung und Transkription)
Laura Meige (Transkription und Segmentierung)
Anna Vogel (Datenerhebung und Transkription)
Pauline Wardenski (Transkription)
Korpushandbuch
Eine erste Version des Korpushandbuches folgt in Kürze.
Korpusnutzung
Eine Veröffentlichung des Korpus ist für einen wissenschaftlichen Nutzer:innenkreis nach Projektabschluss geplant.
Kontext: Intensivklassen
Seiteneinsteiger:innen bilden eine sehr heterogene Gruppe, etwa hinsichtlich ihrer sprachlichen Hintergründe, Alter und Beschulungsmodalitäten. Gemeinsam ist ihnen lediglich, dass sie im schulpflichtigen Alter mit für den Regelunterricht unzureichenden Deutschkenntnissen nach Deutschland kommen (vgl. Massumi/von Dewitz 2015).
In den meisten Bundesländern existieren sogenannte Intensiv- oder Vorbereitungsklassen. Sie dienen als Übergangsphase mit dem Ziel, durch gezielte Sprachförderung die Integration in Regelklassen zu ermöglichen. Die sprachliche Entwicklung in dieser Phase ist allerdings vor allem im Hinblick auf den Erwerb bildungssprachlicher Kompetenzen bislang nur wenig erforscht (vgl. Goltsev/von Dewitz 2023, Twente/Marx im Druck).
Ziele von SeiKo
Neu zugewanderte Schüler:innen stehen vor der Herausforderung, in kurzer Zeit nicht nur basale kommunikative Fähigkeiten, sondern auch solche schulspezifischen Kompetenzen zu erwerben, die eine möglichst erfolgreiche Teilnahme am Regelunterricht ermöglichen. Im Fokus von SeiKo steht daher die Entwicklung der Verbstellung, die als Stellvertreter für den basalen Spracherwerb angesehen wird (vgl. die Processability Theory nach Pienemann 1998 sowie Czinglar 2014, 2018 und Schlauch 2022), sowie Attribution von Nominalgruppen als Merkmal ausgebauter Varietäten (vgl. Gamper 2022). Von besonderem Interesse ist das Zusammenspiel dieser Bereiche (vgl. Braunewell et al., angenommen).
Korpusdesign
SeiKo folgt einem longitudinalen Design mit monatlichen Datenerhebungen an hessischen Schulen. Grundlage ist ein Interviewsetting (inspiriert vom Language Situations-Ansatz von Wiese (2020). Mit Hilfe einer Auswahl von sechs Bildergeschichten werden Sprachdaten zu unterschiedlichen Sprechanlässen und Modalitäten (mündlich vs. schriftlich) elizitiert, um registerspezifische Variation sichtbar zu machen (vgl. Lüdeling et al. 2022).
Die Datenerhebung umfasst fünf Teile:
- N-Part (narrative): mündliches Nacherzählen der Bildergeschichte für die Interviewer:innen
- Q-Part (questionnaire): Verständnisfragen zur Sicherung des Textverständnisses
- D-Part (decontextualised): diktierter Bericht für je abwesende Adressat:innen, z. B. eine Lehrer:in
- T-Part (text): eigenständiger schriftlicher Bericht für diese Adressat:innen
- F-Part (free): offenes Gespräch über Schule, Freizeit und Alltag
Datenaufbereitung und Annotation
Die erhobenen Daten werden manuell transkribiert und segmentiert (basierend auf Analysis of Speech Units, Foster et al. 2000). Für die mehrstufige Mehrebenannotation kommt der EXMARaLDA Partitur-Editor (Schmidt/Wörner 2014) zum Einsatz.
Die Annotation umfasst:
- automatische Lemmatisierung (korrigiert)
- automatisches POS-Tagging mit TreeTagger (Schmid 1995, korrigiert)
- Annotation der Verbstellung (auf Basis modifizierter DAKODA-Spezifikationen, Ruppenhofer et al. 2024)
- Annotation von Nominalgruppen und Attribution (Braunewell et al., angenommen)
Die XML-basierten EXMARaLDA-Dateien werden mit Hilfe einer Annatto-Pipeline zu einem ANNIS-Korpus konvertiert.
Vorliegende Annotationsebenen sind
| Ebene | Hinweise |
| tok_part | tokenisierte Sprecher:innenspur |
| ctok_part | von Pausen und Hesitationsmarkern bereinigte ctok_part-Spur |
| pos | mit Treetagger automatisch erzeugtes und manuell korrigiertes part-of-speech-Tagging |
| lemma | mit Treetagger automatisch erzeugte und manuell korrigierte Lemmatisierung |
| unit | segmentierte Äußerungseinheiten |
| subclause | abhängige Nebensätze |
| cons | Satzkonstituenten |
| stage | Verbstellungsstufe |
| ngr | Nominalgruppen |
| kern | nominale Kerne |
Subkorpora und Korpusgröße
Weil SeiKo in zwei Intervallen erhoben wurde, umfasst es die Subkorpora SeiKo1 und SeiKo2. Die Erhebung und Aufbereitung von SeiKo1 ist bereits größtenteils abgeschlossen und das Subkorpus umfasst folgende Elemente:
| Ebene | Größe |
| Elemente auf der Tokenspur | 68.118 |
| Elemente auf der bereinigten Tokenspur | 42.999 |
| Satzgefüge | 9.440 |
| Verbhaltige Satzgefüge | 7.119 |
| Nominalgruppen | 6.071 |
SeiKo2 befindet sich derzeit noch in der Erhebungs- und Datenaufbereitungsphase.
Literatur (*Publikationen zu SeiKo)
Ahrenholz, B., Fuchs, I., & Birnbaum, T. (2016). “dann haben wir natürlich gemerkt der übergang ist der knackpunkt”—Modelle der Beschulung von Seiteneinsteigern in der Praxis. BiSS-Journal, 5.
Ahrenholz, B., & Maak, D. (2013). Zur Situation von SchülerInnen nicht‐deutscher Herkunftssprache in Thüringen unter besonderer Berücksichtigung von Seiteneinsteigern Abschlussbericht zum Projekt „Mehrsprachigkeit an Thüringer Schulen (MaTS)“, durchgeführt im Auftrage des TMBWK (Abschlussbericht Zum Projekt „Mehrsprachigkeit an Thüringer Schulen (MaTS)“, Durchgeführt Im Auftrage Des TMBWK No. Band 1; Berichte Und Materialien Www.Daz‐portal.de Bd. 1). Friedrich-Schiller-Universität Jena. https://www.daz-portal.de/de/publikationen/berichte-und-materialien/pdf-dateien-berichte-und-materialien/bm_band_01_mats_bericht_20130618_final.pdf
*Braunewell, A., Schlauch, J., & Gamper, J. (angenommen). Von der Verbstellung zur erweiterten Nominalgruppe? Zum Verhältnis zwischen verbalen und nominalen Ausbaustrukturen bei neu zugewanderten Schüler:innen in Vorbereitungsklassen. Germanistische Linguistik.
Czinglar, C. (n.d.). Zweitspracherwerb im Jugendalter. Die Bedeutung des Alters und literaler Kompetenzen von neu zugewanderten Jugendlichen. In N. Dewitz, H. Terhart, & M. Massumi (Eds.), Neuzuwanderung und Bildung Eine interdisziplinäre Perspektive auf Übergänge in das deutsche Bildungssystem (pp. 158–173).
Czinglar, C. (2014). Grammatikerwerb vor und nach der Pubertät: Eine Fallstudie zur Verbstellung im Deutschen als Zweitsprache. de Gruyter.
Decker-Ernst, Y. (2017). Deutsch als Zweitsprache in Vorbereitungsklassen: Eine Bestandsaufnahme in Baden-Württemberg. Schneider Verlag Hohengehren GmbH.
Diebel, J., & Ahrenholz, B. (2023). Schulische und sprachliche Voraussetzungen von Seiteneinsteiger*innen. Ergebnisse einer schriftlichen Befragung. In U. Ohm & J. Ricart Brede (Eds.), Zum Seiteneinstieg neu zugewanderter Jugendlicher ins deutsche Schulsystem: Ergebnisse und Befunde aus dem Projekt EVA-Sek (pp. 19–56). Schneider Verlag Hohengehren.
Foster, P., Tonkyn, A., & Wigglesworth, G. (2000). Measuring Spoken Language: A Unit for All Reasons.
Fuchs, I. (2022). Entscheidungskriterien und Gelingensbedingungen der erfolgreichen schulischen Integration neu zugewanderter SchülerInnen aus der Perspektive professioneller AkteurInnen – Ergebnisse einer Befragung. Arbeitspapiere EVA-Sek, Band 3. https://www.geku.uni-passau.de/fileadmin/dokumente/fakultaeten/geku/lehrstuehle/brede/EVA-Sek_AP3_2022-12-31.pdf
Gamper, J. (2022). Ausbau nominaler Strukturen in der Sekundarstufe I. Eine textkorpusanalytische Studie. KorDaF, 2(2), 13–42. https://doi.org/10.48694/kordaf.3551
Goltsev, E., & von Dewitz, N. (2023). Studien zu schulisch relevanten Kompetenzen neu zugewanderter Schüler*innen – Ein Scoping Review zur aktuellen Forschungslandschaft [PDF,XML]. https://doi.org/10.48694/ZIF.3732
Grein, M. (2024). Deutschförderkonzepte: Inland und Ausland im Vergleich. In H. Reiche & J. Schindler (Eds.), Sprachförderung in DaZ (pp. 13–36). Frank & Timme. https://doi.org/10.26530/20.500.12657/91166
Höckel, L. S., & Schilling, P. (2022) : Starting off on the right foot: Language learning classes and the educational success of immigrant children. Ruhr Economic Papers, No. 983. https://doi.org/10.4419/96973148
Karakayalı, J., Zur Nieden, B., Kahveci, Ç., Groß, S., & Heller, M. (2017): Die Kontinuität der Separation. Vorbereitungsklassen für neu zugewanderte Kinder und Jugendliche im Kontext historischer Formen der separierten Beschulung. Die Deutsche Schule, 109 (3), 223-235. https://doi.org/10.25656/01:25881
Krause, T. (with Berlin, H.-U. Z., & Berlin, H.-U. Z.). (2019). ANNIS: A graph-based query system for deeply annotated text corpora. Humboldt-Universität zu Berlin. https://edoc.hu-berlin.de/handle/18452/20436
Lüdeling, A., Alexiadou, A., Adli, A., Donhauser, K., Dreyer, M., Egg, M., Feulner, A. H., Gagarina, N., Hock, W., Jannedy, S., Kammerzell, F., Knoeferle, P., Krause, T., Krifka, M., Kutscher, S., Lütke, B., McFadden, T., Meyer, R., Mooshammer, C., … Zeige, L. E. (2022). Register: Language Users’ Knowledge of Situational-Functional Variation. Register Aspects of Language in Situation, 1, 1–58. https://doi.org/10.18452/24901
Lüdeling, A., Hirschmann, H., Shadrova, A., & Wan, S. (2021). Tiefe Analyse von Lernerkorpora. In H. Lobin, A. Witt, & A. Wöllstein (Eds.), Deutsch in Europa: Sprachpolitisch—Grammatisch—Methodisch (Vol. 2020, pp. 235–284). De Gruyter. https://doi.org/10.1515/9783110731514-013
Massumi, M., & von Dewitz, N. (2015). Neu zugewanderte Kinder und Jugendliche im deutschen Schulsystem.
Petersen, I. (2025). Die Umsetzung des Mehrstufenmodells der DaZ-Sprachbildung für neu zugewanderte Schüler:innen an Schulen in Schleswig-Holstein: Ergebnisse einer Online-Befragung mit Lehrkräften. https://doi.org/10.38071/2025-00511-2
Pienemann, M. (1998). Developmental dynamics in L1 and L2 acquisition: Processability Theory and generative entrenchment. Bilingualism: Language and Cognition, 1(1), 1–20. https://doi.org/10.1017/S1366728998000017
Ruppenhofer, J., Schwendemann, M., Portmann, A., & Wisniewski, K. (2024). Specification of Processability Theory’s Developmental Stages. Work in Progress.
Rüter, M. (2023). Zwangsmigration und deren psychosoziale Folgen für Jugendliche – eine qualitative Analyse von Interviewdaten. In Zum Seiteneinstieg neu zugewanderter Jugendlicher ins deutsche Schulsystem: Ergebnisse und Befunde aus dem Projekt EVA-Sek (pp. 97–131). Schneider Verlag Hohengehren.
*Schlauch, J. (2022). Erwerb der Verbstellung bei neu zugewanderten Seiteneinsteiger:innen in der Sekundarstufe. Eine Fallstudie aus dem DaZ-Lerner:innenkorpus SeiKo. Korpora Deutsch Als Fremdsprache, 2(2), 43–62. https://doi.org/DOI:%252010.48694/kordaf.3550
Schmid, H. (1995). Improvements in Part-of-Speech Tagging with an Application to Germa. Proceedings of the ACL SIGDAT-Workshop. Dublin, Ireland.
Schmidt, T., & Wörner, K. (2014). EXMARaLDA. In Handbook on Corpus Phonology (pp. 402–419). Oxford University Press.
Schwendemann, M., Portmann, A., Schlauch, J., Gamper, J., & Wisniewski, K. (2024). FORSCHUNGSDATEN FÜR ALLE. Rechtliche Möglichkeiten und Herausforderungen bei der Veröffentlichung von Lernerkorpora. KorDaF, 4(2), 149–176. https://doi.org/10.48694/KORDAF.4138
Shadrova, A., Lüdeling, A., Klotz, M., Hartz, R. G., & Krause, T. (2025). „Step away from the Computer!“: Über die linguistische Datenkategorisierung als Erkenntnisprozess und daraus folgende Herausforderungen bei der Nachnutzung von Annotationen und Annotationstools. Zeitschrift Für Germanistische Linguistik, 53(1), 166–214. https://doi.org/10.1515/zgl-2025-2005
Twente, L., & Marx, N. (im Druck). How do we research language skills and linguistic repertoires of newly immigrated students? A scoping review of studies in German-majority contexts.
Vertovec, S. (2024). Superdiversität: Migration und soziale Komplexität. Suhrkamp.
Winkler, O., & Carwehl, A.-K. (2025). Institutional conditions and acquisition of language skills among young refugees: Investigating the German context. Acta Sociologica. https://doi.org/10.1177/00016993251351531