Theses
- (2004): Computergestützte Transkription – Modellierung und Visualisierung gesprochener Sprache mit texttechnologischen Mitteln. Dissertation, Supervisor: Prof. Dr. Angelika Storrer (Universität Dortmund). Published (2005) in the series „Sprache, Sprechen und Computer“, Peter Lang, Frankfurt.
- (2000): Acquisition of German NP structure and morphology in different acquisitional settings. Master's thesis, Supervisors: Prof. Dr. Carol Pfaff (FU Berlin) and Prof. Dr. Clive Perdue (Université Paris 8).
- (1998): Identifizierung und Analyse von temporalen Adverbialen in deutschen Fußballberichten über endliche Automaten. Master's thesis, Supervisor: Prof. Dr. Dieter Seelbach (Universität Mainz).
Research papers (selection)
(go to Bibliography for publications about the Kicktionary)
2009 / in preparation
- (2009a): Another extension of the stylesheet metaphor – Visualising multi-layer annotations as musical scores. To appear in: A. Witt & D. Metzing (Hrsg.): Linguistic modelling of information and Markup Languages. Dordrecht: Springer.
- (2009b) (with S. Duncan, O. Ehmer, J. Hoyt, M. Kipp, D. Loehr, M. Magnusson, T. Rose & H. Sloetjes): An exchange format for multimodal annotations. To appear in: M. Kipp, J.-C. Martin, P. Paggio, and D. Heylen (eds.): Multimodal corpora. Dordrecht: Springer.
- (2009c) (with Silke Merkel): Korpora gesprochener Sprache im Netz - eine Umschau. In: Gesprächsforschung (10), 70-93. [URL]
2008
- (2008a) (with Alexander Geyken & Angelika Storrer): Refining and Exploiting the Structural Markup of the eWDG. In: Proceedings of EURALEX 2008.
- (2008b) (with Jasmine Bennoehr): Rescuing Legacy Data. In: Language Documentation and Conservation. [URL]
2007
- (2007a) (with Nicole Baumgarten, Annette Herkenrath, Kai Wörner & Ludger Zeevaert): Studying Connectivity with the Help of Computer-Readable Corpora: Some Exemplary Analyses from Modern and Historical, Written and Spoken Corpora. In: Rehbein et al. (eds.): Connectivity in Grammar and Discourse. Hamburg Studies in Multilingualism (5). Amsterdam: Benjamins.
- (2007b): Transkriptionskonventionen für die computergestützte gesprächsanalytische Transkription. In: Gesprächsforschung (8), 229-241. [URL]
2006
- (2006a) (with K. Rohlfing, D. Loehr, S. Duncan, A. Brown, A. Franklin, I. Kimbara, J. Milde, F. Parrill, T. Rose, H. Sloetjes, A. Thies & S. Wellinghoff): Comparison of multimodal annotation tools. In: Gesprächsforschung (7), 99-123. [URL]
- (2006c) (with C. Chiarcos, T. Lehmberg, G. Rehm, A. Witt & E. Hinrichs): Avoiding Data Graveyards: From Heterogeneous Data Collected in Multiple Research Projects to Sustainable Linguistic Resources. Proceedings of the E-MELD workshop 2006, Michigan State University in East Lansing, Michigan. [URL]
2005
- (2005a): EXMARaLDA und die Datenbank "Mehrsprachigkeit" - Konzepte und praktische Erfahrungen. In: Dipper, Stefanie / Stede, Manfred (Hrsg.): Heterogenity in Focus: Creating and Using Linguistic Databases. ISIS (Interdisciplinary Studies on Information Structure), Working Papers of the SFB 632, Universität Potsdam. [URL]
- (2005b): Modellbildung und Modellierungsparadigmen in der computergestützten Korpusanalyse. In: Fisseni, Bernhard / Schmitz, Hans-Christian / Schröder, Bernhard / Wagner, Petra (Hrsg.): Sprachtechnologie, mobile Kommunikation und linguistische Ressourcen. Beiträge zur GLDV-Tagung 2005 in Bonn. (Sprache, Sprechen und Computer/Computer Studies in Language and Speech 8). Frankfurt a. M.
- (2005c): Datenarchive für die Gesprächsforschung. Perspektiven, Probleme und Lösungsansätze. In: Gesprächsforschung 6, 103-126. [URL]
- (2005d): Time-based data models and the Text Encoding Initiative's guidelines for transcription of speech. In: Arbeiten zur Mehrsprachigkeit (Working Papers in Multilingualism), Serie B (62). Hamburg. [URL]
- (2005e): (with Kai Wörner) Erstellen und Analysieren von Gesprächskorpora mit EXMARaLDA. In: Gesprächsforschung 6, 171-195. [URL]
2004
- (2004a): EXMARaLDA - ein System zur computergestützten Diskurstranskription. In: Mehler, Alexander / Lobin, Henning (Hrsg.): Automatische Textanalyse. Systeme und Methoden zur Annotation und Analyse natürlichsprachlicher Texte. Wiesbaden: Verlag für Sozialwissenschaften, 203-218.
- (2004b) (with B. MacWhinney, C. Martell, J. Wagner, P. Wittenburg & E. Hoffer): Collaborative Commentary: Opening Up Spoken Language Databases. In: Proceedings of the Language Resource and Evalutation Conference 2004, Lisbon, Paris: ELRA.
- (2004c) (with J. Rehbein, B. Meyer, F. Watzke & A. Herkenrath): Handbuch für das computergestützte Transkribieren nach HIAT. Arbeiten zur Mehrsprachigkeit, Folge B (Nr. 56). Hamburg. [URL]
2003
- (2003a): Visualising Linguistic Annotation as Interlinear Text. Arbeiten zur Mehrsprachigkeit, Serie B (46). Hamburg. [URL]
- (2003b): Korpus "Skandinavische Semikommunikation" - ein mehrsprachiges Diskurskorpus auf XML-Basis. In: Seewald-Heeg (Hrsg.): Sprachtechnologie für die multilinguale Kommunikation - Textproduktion, Recherche, Übersetzung, Lokalisierung (Beiträge der GLDV-Frühjahrstagung 2003). Sankt Augustin: gardez!. , 421-427.
2002
- (2002a): Gesprächstranskription auf dem Computer: das System EXMARaLDA. In: Gesprächsforschung 3, 1-23. [URL]
- (2002b): Stellungnahme zu Wolfgang Schneiders Artikel "Annotate in Transkriptionen aus DV-technischer Sicht". In: Gesprächsforschung 3, 237-249. [URL]
- (2002c): EXMARaLDA - un système de transcription computationelle comme base d'un corpus de la langue parlée multilingue. Journée d’Ètude de l’ATALA, Paris.
2001
- (2001): The transcription system EXMARaLDA: An application of the annotation graph formalism as the Basis of a Database of Multilingual Spoken Discourse. In: Steven Bird et al. (Hrsg.): Proceedings of the IRCS Workshop On Linguistic Databases, 11-13 December 2001. Philadelphia: Institute for Research in Cognitive Science, University of Pennsylvania, 219-227.
Websites (published software and language resources)
- EXMARaLDA: Extensible Markup Language for Discourse Annotation: Software and resources for the creation, management and analysis of spoken language corpora
- Kicktionary: A multilingual electronic lexical resource of the language of football (soccer)