Swiss-AL: Ein mehrsprachiges Schweizer Korpus für die Angewandte Linguistik
Swiss-AL ist ein mehrsprachiges Korpus der Schweizer öffentlichen Kommunikation. Es ermöglicht datenbasierte Analysen und Simulationen gesellschaftlicher Diskurse.

Das Schweizer Korpus für Angewandte Linguistik (Swiss-AL) ist eine linguistisch aufbereitete, mehrsprachige Sammlung von Texten zentraler Akteure der Schweizerischen öffentlichen Kommunikation. Es ermöglicht die datengestützte und datengetriebene Forschung zu gesellschaftlichen Diskursen in der Schweiz. Es enthält Schweizer Tages- und Wochenzeitungen, Online-Newsportale sowie Medienmitteilungen, Newsmeldungen und Blogbeiträge von Akteuren aus Politik, Wirtschaft, Wissenschaft und Zivilgesellschaft. Eine flexible Verarbeitungspipeline ermöglicht es, massgeschneiderte Teilkorpora für die Untersuchung von Diskursen zu modellieren.
Anwendungsgebiete
Swiss-AL wird vom Digital Discourse Lab der ZHAW in angewandten Forschungsprojekten zu öffentlichen Diskursen in der Schweiz eingesetzt. Dazu gehören unter anderem die folgenden Projekte:
Die in Swiss-AL enthaltenen Mediendaten bilden ausserdem die Grundlage für das Wort des Jahres Schweiz in den Sprachen Deutsch, Französisch, Italienisch und Rumantsch.
Das Korpus wird ausserdem in allen Studiengängen des Departements für die forschungsbasierte Lehre genutzt, beispielsweise bei der Erstellung von Abschlussarbeiten auf Bachelor- und Masterniveau.
Zugang
Ausgewählte Teilkorpora von Swiss-AL können mit Hilfe der eigens entwickelten Swiss-AL Workbench genutzt werden.
- Zugang für die Öffentlichkeit: https://swiss-al.linguistik.zhaw.ch
- Zugang für ZHAW-Angehörige: http://tools.linguistik.zhaw.ch
Zusammensetzung
Teilkorpus Swiss-AL-Base
- Inhalte: Schweizer Tages- und Wochenzeitungen, Online-Newsportale, Webseiten (Medienmitteilungen, News, Blogbeiträge) aus den Bereichen Politik, Wirtschaft, Wissenschaft, Zivilgesellschaft
- Zeitraum: 2010-2021
- Sprachen: de, fr, it
- Umfang (Stand November 2021): de: 2.15 Mrd. Wörter, fr: 1 Mrd. Wörter, it: 14 Mio. Wörter
Teilkorpus Swiss-AL-Media
- Inhalte: Schweizer Tages- und Wochenzeitungen, Online-Newsportale
- Zeitraum: 2016–2021
- Sprachen: de, fr, it, rm
- Umfang (Stand November 2021): de: 1.2 Mrd. Wörter, fr: 381 Mio. Wörter, it: 150 Mio. Wörter, rm: 5.9 Mio. Wörter
Teilkorpus Swiss-AL-Covid19
Thematisches Korpus zu Covid-19 in der Schweiz
- Inhalte: Schweizer Tages- und Wochenzeitungen, Online-Newsportale, Webseiten (Medienmitteilungen, News, Blogbeiträge) aus den Bereichen Politik, Wirtschaft, Wissenschaft, Zivilgesellschaft
- Zeitraum: 2020
- Sprachen: de, it
- Umfang (Stand November 2021): de: 23 Mio. Wörter, it: 6.7 Mio. Wörter
Publikationen
- Krasselt, J., Fluor, M., Rothenhäusler, K., & Dreesen, P. (2021). A workbench for corpus linguistic discourse analysis. In D. Gromann, G. Sérasset, T. Declerck, J. P. McCrae, J. Gracia, J. Bosque-Gil, F. Bobillo, & B. Heinisch (Hrsg.), 3rd conference on language, data and knowledge (LDK 2021) (Bd. 93, S. 26:1-26:9). Schloss Dagstuhl – Leibniz-Zentrum für Informatik. https://doi.org/10.4230/OASIcs.LDK.2021.26
- Krasselt, Julia, Philipp Dreesen, Matthias Fluor, Cerstin Mahlow, Klaus Rothenhäusler & Maren Runte. 2020. Swiss-AL: A Multilingual Swiss Web Corpus for Applied Linguistics. In Proceedings of The 12th Language Resources and Evaluation Conference, 4138--4144. Marseille, France. https://aclanthology.org/2020.lrec-1.510.