Inhaltspezifische Aktionen

Publikationen

zurück zur Homepage von Dr. Georg Rehm

 

 

Dr. Georg Rehm

 

 

Professional Qualification

  • Hypertextsorten: Definition, Struktur, Klassifikation. Georg Rehm, PhD thesis, Applied and Computational Linguistics Department, Giessen University, 2005 A PDF version is available in the Giessener Elektronische Bibliothek.
  • Vorüberlegungen zur automatischen Zusammenfassung deutschsprachiger Texte mittels einer SGML- und DSSSL-basierten Repräsentation von RST-Relationen. Georg Rehm, Magisterarbeit (Master's thesis), Institute for Semantic Information Processing (now: Institute for Cognitive Science), Osnabrück University, 1998
  • GLDV Award for Best Master's Thesis, 1999/2000 at the 2001 spring meeting of the Gesellschaft für Linguistische Datenverarbeitung at Giessen University. PDF, 142 pages,


Books and Edited Collections

  • Journal for Language Technology and Computational Linguistics 24 (1), special issue Automatic Genre Identification: State of the Art, Issues, and Prospects. Marina Santini, Georg Rehm, Alexander Mehler, Serge Sharoff (eds.), 2009.
  • Proceedings of the International Workshop "Towards Genre-Enabled Search Engines: The Impact of Natural Language Processing" (held in conjunction with RANLP 2007 on September 30th). Georg Rehm, Marina Santini (eds.), Shoumen, Bulgaria: Incoma. PDF, 61 pages
  • Hypertextsorten: Definition, Struktur, Klassifikation. Georg Rehm, Norderstedt: Books on Demand, 2007
  • Datenstrukturen für linguistische Ressourcen und ihre Anwendungen – Data Structures for Linguistic Resources and Applications. Proceedings of the Biennial GLDV Conference 2007. Georg Rehm, Andreas Witt, Lothar Lemnitzer (eds.), Tübingen: Narr, 2007


Journal Articles

  • Editorial. Georg Rehm, Marina Santini, Alexander Mehler, Serge Sharoff. Journal for Language Technology and Computational Linguistics 24 (1), special issue Automatic Genre Identification: State of the Art, Issues, and Prospects, 24 (1), 2009, pp. ii–vi.
  • SusTEInability of Linguistic Resources through Feature Structures. Andreas Witt, Georg Rehm, Erhard Hinrichs, Timm Lehmberg, Jens Stegmann. Literary and Linguistic Computing, 24 (3), 2009, pp. 363–372.
  • Sustainability of Annotated Resources in Linguistics: A Web-Platform for Exploring, Querying and Distributing Linguistic Corpora and Other Resources. Georg Rehm, Oliver Schonefeld, Andreas Witt, Erhard Hinrichs, Marga Reis. Literary and Linguistic Computing, 24 (2), 2009, pp. 193–21.
  • Digital Text Collections, Linguistic Research Data, and Mashups: Notes on the Legal Situation. Timm Lehmberg, Georg Rehm, Andreas Witt, Felix Zimmermann. Library Trends, 57 (1), special issue Digital Books and the Impact on Libraries, 2008, pp. 52–71.
  • A Web-Platform for Preserving, Exploring, Visualising and Querying Linguistic Corpora and other Resources. Georg Rehm, Oliver Schonefeld, Andreas Witt, Christian Chiarcos, Timm Lehmberg. Procesamiento del Lenguaje Natural, Revista 41, September, 2008, pp. 155–162.
  • Language-Independent Text Parsing of Arbitrary HTML-Documents. Towards a Foundation for Web Genre Identification, LDV Forum, 20 (2), special issue Corpus Linguistics, 2005, pp. 53–74.
  • eLearning und offene Standards: Zum Einsatz XML-strukturierter Lernobjekte. Henning Lobin, Maik Stührenberg, Georg Rehm. In: Sprache und Datenverarbeitung, 27 (1-2), special issue Computerlinguistik – Neue Wege in der Lehre, 2003, pp. 75–94.


Articles in Collections

  • Hypertext Types and Markup Languages. In: Linguistic Modelling of Information and Markup Languages, Andreas Witt, Dieter Metzing, (eds.), Springer, 2010, pp. 143–164.
  • Texttechnologische Grundlagen. In: Computerlinguistik und Sprachtechnologie – Eine Einführung, Kai-Uwe Carstensen et al. (eds.), Spektrum Akademischer Verlag, 2010, 3rd edition pp. 159–168.
  • Ontologie-basierte Hypertextsorten-Klassifikation. In: Automatische Textanalyse – Systeme und Methoden zur Annotation und Analyse natürlichsprachlicher Texte, Alexander Mehler, Henning Lobin (eds.), Verlag für Sozialwissenschaften, 2004, pp. 121–137.
  • Hypertextsorten-Klassifikation als Grundlage generischer Informationsextraktion. In: Automatische Textanalyse – Systeme und Methoden zur Annotation und Analyse natürlichsprachlicher Texte, Alexander Mehler, Henning Lobin (eds.), Verlag für Sozialwissenschaften, 2004, pp. 219–233.
  • Auf dem Weg zur adaptiven Lernumgebung: Zur Bedeutung offener Standards im eLearning. Henning Lobin, Maik Stührenberg, Georg Rehm. In: Aufgabenorientierung im Fremdsprachenunterricht, Andreas Müller-Hartmann, Marita Schocker-von Ditfurth (eds.), Narr. 2004. pp. 335–346.
  • Texttechnologische Grundlagen. In: Computerlinguistik und Sprachtechnologie – Eine Einführung, Kai-Uwe Carstensen et al. (eds.), Spektrum Akademischer Verlag, 2004, 2nd edition, pp. 138–147.
  • Das World Wide Web. In: Computerlinguistik und Sprachtechnologie – Eine Einführung, Kai-Uwe Carstensen et al. (eds.), Spektrum Akademischer Verlag, 2004, 2nd edition, pp. 455–460.
  • Texttechnologie und das World Wide Web. In: Texttechnologie – Perspektiven und Anwendungen, Henning Lobin, Lothar Lemnitzer (eds.), Stauffenburg. 2004, pp. 433–464.
  • Multimedia in der Informationsgesellschaft – Von Open Source zu Open Information. Henning Lobin, Georg Rehm. In: Psycholinguistik (= HSK, Handbücher zur Sprach- und Kommunikationswissenschaft), Gert Rickheit, Theo Herrmann (eds.), de Gruyter, 2003, pp. 889–899.
  • Schriftliche Mündlichkeit im World Wide Web. In: Kommunikationsform E-Mail, Arne Ziegler, Christa Dürscheid (eds.), Stauffenburg, 2002, pp. 263–308.
  • Das World Wide Web. In: Computerlinguistik und Sprachtechnologie – Eine Einführung, Kai-Uwe Carstensen et al. (eds.), Spektrum Akademischer Verlag, 2001, 1st edition, pp. 362–368.
  • Automatische Textannotation: Ein SGML- und DSSSL-basierter Ansatz zur angewandten Textlinguistik. In: Text im digitalen Medium – Linguistische Aspekte von Textdesign, Texttechnologie und Hypertext Engineering, Henning Lobin (ed.), Westdeutscher Verlag, 1999, pp. 179–195.
  • Internetkommunikation und Sprachwandel. Martin Haase, Michael Huber, Alexander Krumeich, Georg Rehm. In: Sprachwandel durch Computer, Rüdiger Weingarten (ed.), Westdeutscher Verlag, 1997, pp. 51–85.
  • Chapter Kommunikationsdienste (Communication Services), In: Internet vertraulich, Uwe Grigoleit, Sybex, 1995, pp. 289–323.


Articles in Conference Proceedings

  • Sustainability of Linguistic Resources Revisited. Georg Rehm, Oliver Schonefeld, Thorsten Trippel, Andreas Witt. In: Balisage 2010. International Symposium on XML for the Long Haul: Issues in the Long-term Preservation of XML, August 2, Montreal, Canada, 2010.
  • Licensing and Sharing Language Resources: An Approach Inspired by Creative Commons and Open Science Data Movements. John Hendrik Weitzmann, Georg Rehm, Hans Uszkoreit. In: LREC 2010 Workshop Legal Issues for Sharing Language Resources: Constraints and Best Practices, May 17, Malta, 2010.
  • SPLICR: A Sustainability Platform for Linguistic Corpora and Resources. Georg Rehm, Oliver Schonefeld, Andreas Witt, Christian Chiarcos, Timm Lehmberg. In: KONVENS 2008 (Konferenz zur Verarbeitung natürlicher Sprache) – Textressourcen und lexikalisches Wissen, September 30–October 02, Berlin, Germany, 2008, pp. 86–95
  • Sustainability of Annotated Resources in Linguistics. Georg Rehm, Andreas Witt, Erhard Hinrichs, Marga Reis. In: Proceedings of Digital Humanities 2008, June 25–29, Oulu, Finland, 2008.
  • Requirements of a User-Friendly, General-Purpose Corpus Query Interface. Jan-Philipp Söhn, Heike Zinsmeister, Georg Rehm. In: Proceedings of the LREC 2008 Workshop Sustainability of Language Resources and Tools for Natural Language Processing, May 31, Marrakech, Morocco, 2008.
  • Towards a Reference Corpus of Web Genres for the Evaluation of Genre Identification Systems. Georg Rehm, Marina Santini, Alexander Mehler, Pavel Braslavski, Rüdiger Gleim, Andrea Stubbe, Svetlana Symonenko, Mirko Tavosanis, Vedrana Vidulin. In: Proceedings of LREC 2008, May 28–30, Marrakech, Morocco, 2008.
  • Ontology-Based XQuery'ing of XML-Encoded Language Resources on Multiple Annotation Layer . Georg Rehm, Richard Eckart, Christian Chiarcos, Johannes Dellert. In: Proceedings of LREC 2008, May 28–30, Marrakech, Morocco, 2008.
  • The Metadata-Database of a Next Generation Sustainability Web-Platform for Language Resources. Georg Rehm, Oliver Schonefeld, Andreas Witt, Timm Lehmberg, Christian Chiarcos, Hanan Bechara, Florian Eishold, Kilian Evang, Magdalena Leshtanska, Aleksandar Savkov, Matthias Stark. In: Proceedings of LREC 2008, May 28–30, Marrakech, Morocco, 2008.
  • Masking Treebanks for the Free Distribution of Linguistic Resources and Other Applications. Georg Rehm, Andreas Witt, Heike Zinsmeister, Johannes Dellert. In: Proceedings of the Sixth International Workshop on Treebanks and Linguistic Theories (TLT 2007). December 7–8, Bergen, Norway, 2007, pp. 127–138.
  • Mapping Multi-Rooted Trees from a Sustainable Exchange Format to TEI Feature Structures. Andreas Witt, Georg Rehm, Timm Lehmberg, Erhard Hinrichs. In: TEI@20: 20 Years of Supporting the Digital Humanities. The 20th Anniversary Text Encoding Initiative Consortium Members' Meeting. October 31–November 3, University of Maryland, College Park, USA, 2007
  • An OWL- and XQuery-Based Mechanism for the Retrieval of Linguistic Patterns from XML-Corpora. Georg Rehm, Richard Eckart, Christian Chiarcos. In: RANLP 2007: Recent Advances in Natural Language Processing, September 27–29, Borovets, Bulgaria, 2007, pp. 510–514.
  • On the Lossless Transformation of Single-File, Multi-Layer Annotations into Multi-Rooted Trees. Andreas Witt, Oliver Schonefeld, Georg Rehm, Jonathan Khoo, Kilian Evang. In: Extreme Markup Languages, August 7–10, Montreal, Canada, 2007
  • Corpus Masking: Legally Bypassing Licensing Restrictions for the Free Distribution of Text Collections. Georg Rehm, Andreas Witt, Heike Zinsmeister, Johannes Dellert. In: Proceedings of Digital Humanities 2007, June 2–8, University of Illinois, Urbana-Champaign, USA, 2007, pp. 166–169.
  • Collecting Legally Relevant Metadata by Means of a Decision-Tree-Based Questionnaire System. Timm Lehmberg, Christian Chiarcos, Erhard Hinrichs, Georg Rehm, Andreas Witt. In: Proceedings of Digital Humanities 2007, June 2–8, University of Illinois, Urbana-Champaign, USA, 2007, pp. 164–166.
  • Rechtsfragen bei der Nutzung und Weitergabe linguistischer Daten. Timm Lehmberg, Christian Chiarcos, Georg Rehm, Andreas Witt. In: Datenstrukturen für linguistische Ressourcen und ihre Anwendungen – Data Structures for Linguistic Resources and Applications. Proceedings of the Biennial GLDV Conference 2007, Georg Rehm, Andreas Witt, Lothar Lemnitzer (eds.), Tübingen: Narr, 2007, pp. 93–102
  • Modelling Linguistic Data Structures. Kai Wörner, Andreas Witt, Georg Rehm, Stefanie Dipper. In: Extreme Markup Languages, August 7–11, Montreal, Canada, 2006
  • Avoiding Data Graveyards: From Heterogeneous Data Collected in Multiple Research Projects to Sustainable Linguistic Resources. Thomas Schmidt, Christian Chiarcos, Timm Lehmberg, Georg Rehm, Andreas Witt, Erhard Hinrichs. In: E-MELD Workshop Workshop on Digital Language Documentation: Tools and Standards – The State of the Art. East Lansing, Michigan, 2006
  • Towards Automatic Web Genre Identification – A Corpus-Based Approach in the Domain of Academia by Example of the Academic's Personal Homepage. In: Proceedings of the 35th Hawai'i International Conference on System Sciences. Big Island, Hawaii, 2002
  • korpus.html: Zur Sammlung, Datenbank-basierten Erfassung, Annotation und Auswertung von HTML-Dokumenten. In: Proceedings der Frühjahrstagung der Gesellschaft für Linguistische Datenverarbeitung (GLDV), Henning Lobin (ed.), Giessen University, 2001, pp. 93–103
  • Die Chronik der Chronik: Über die Konvertierung und Weiterverarbeitung proprietär annotierter Daten. Georg Rehm, Markus Reinsch. In: Proceedings der Frühjahrstagung der Gesellschaft für Linguistische Datenverarbeitung (GLDV), Henning Lobin (ed.), Giessen University, 2001, pp. 211–221
  • From Open Source to Open Information: Collaborative Methods in Creating XML-based Markup Languages. Henning Lobin, Georg Rehm. Electronic Publishing 2000, August 17th-19th, Kaliningrad/Svetlogorsk: Kaliningrad State University, Russia (International Federation for Information Processing and International Council for Computer Communication)
  • Internetkommunikation und Sprachwandel. Alexander Krumeich, Georg Rehm. Proceedings der 21. StuTS (Studentische Tagung Sprachwissenschaft), Münster University, 1997


Reviews

  • Review of Sprache und Kommunikation im Internet, by Jens Runkehl, Peter Schlobinski and Torsten Siever. In: Zeitschrift für Sprachwissenschaft 20 (1), 2001, pp. 153–155
  • Review of Linguistik im Internet by Elisabeth Cölfen, Hermann Cölfen and Ulrich Schmitz. In: Sprachtypologie und Universalienforschung (STUF) 50 (4), 1997, pp. 370–373


Miscellaneous

  • E-Mail-ähnliche Textstrukturen in studentischen Homepages. Unpublished paper, originally written for the Proceedings volume of Germanistentag 2001, but then withdrawn due to unforeseen circumstances. If you would like a copy, please let me know.
  • Projektbericht pronto: Probleme der Eigennamenerkennung. Katharina Kober, Alexander Krumeich, Klaus von der Landwehr, Hagen Langer, Georg Rehm. Osnabrück University, 1998
  • Studienprojekt Semf (semantikbasierte Fehlerbehandlung): Abschlussbericht. Gerd Bongardt, Klaus Dalinghaus, Henrik Dittmann, Michael Huber, Alexander Krumeich, Christoph Peylo, Georg Rehm, Andreas Rother, Wilfried Teiken. Osnabrück University, 1997


Selected Talks and Presentations

  • Von PageRank zu FactRank: Sprach- und texttechnologische Verfahren für den Aufbau der Wissensbasis von eyePlorer.com. Georg Rehm. Workshop Computerlinguistische Anwendungen und deren Potenzial für die Wirtschaft. September 29, 2009
  • Zur texttechnologischen Modellierung linguistischer Korpora – Ein Lösungsansatz für die Interoperabilität heterogen annotierter linguistischer Ressourcen. Georg Rehm. Ruhr-Universität Bochum (invited talk). July 2007
  • Zur Integration von Wissen über Text- und Hypertextsorten in computerlinguistische und sprachtechnologische Anwendungen. Georg Rehm. Universität Zürich (invited talk). Nov. 2006
  • Hypertextsorten. Georg Rehm. TaCoS 2003 (Tagung der Computerlinguistik-Studierenden), Giessen University, July 2003
  • Towards Automatic Web Genre Identification – A Corpus-Based Approach in the Domain of Academia by Example of the Academic's Personal Homepage. Georg Rehm. HICSS-35 (Hawai'i International Conference on System Sciences), Big Island, Hawaii, Jan. 2002
  • Hypertextsorten – Neuartige Möglichkeiten der Informationsrecherche im World Wide Web. Georg Rehm. Computerlinguistik-Kolloquium, Potsdam University, Dec. 2001
  • Linguistische Korpusanalysen von persönlichen Homepages: Erfahrungen – Beobachtungen – Perspektiven. Georg Rehm, Gerd Richter. Germanistentag 2001, Erlangen University, Sept. 2001
  • Hypnotic – Eine Korpus-Datenbank zur Analyse von HTML-Dokumenten, Georg Rehm. GLDV-Workshop Werkzeuge zur automatischen Analyse und Verarbeitung von Texten: Formate, Tools, Software-Systeme, Trier University, Sept. 2001
  • Zwei Jahre Computerlinguistik in Giessen – Erfahrungen eines ehemaligen CL/KI-Studenten. Georg Rehm. Vortragsreihe des Vereins der Freunde und Förderer des Instituts für Semantische Informationsverarbeitung, Osnabrück University, May 2001
  • Die Chronik der Chronik – Über die Konvertierung und Weiterverarbeitung proprietär annotierter Daten. Georg Rehm, Markus Reinsch. 12. Frühjahrstagung der Gesellschaft für Linguistische Datenverarbeitung (GLDV), Giessen University, Mar. 2001
  • korpus.html – Zur Sammlung, Datenbank-basierten Erfassung, Annotation und Auswertung von HTML-Dokumenten. Georg Rehm. 12. Frühjahrstagung der Gesellschaft für Linguistische Datenverarbeitung (GLDV), Giessen University, Mar. 2001
  • Vorüberlegungen zur automatischen Zusammenfassung deutschsprachiger Texte mittels einer SGML- und DSSSL-basierten Repräsentation von RST-Relationen. Georg Rehm. Presentation of Master's thesis in competition for the GLDV Award for the Best Master's Thesis, 1999/2000), 12. Frühjahrstagung der Gesellschaft für Linguistische Datenverarbeitung (GLDV), Giessen University, Mar. 2001
  • Internetkommunikation und Sprachwandel. Alexander Krumeich, Georg Rehm. 21. StuTS (Studentische Tagung Sprachwissenschaft), Münster University, May 1997
  • Das Studienprojekt Semf. Christoph Peylo, Georg Rehm Andreas Rother. TaCoS 1996 (Tagung der Computerlinguistik-Studierenden), Stuttgart University, May 1996Luis Bunuel." Jungle World (23. Februar 2000)