Eingabe löschen

Kopfbereich

Schnellnavigation

Hauptnavigation

Swiss-AL: Eine Plattform für Sprachdaten in den Angewandten Wissenschaften

Als mehrsprachige Textsammlung der Schweizer öffentlichen Kommunikation ermöglicht Swiss-AL die datenbasierte Analyse und Simulation gesellschaftlicher Diskurse. Es steht für Forschende und die Öffentlichkeit als Open-Research-Data-Ressource zur Verfügung.

Swiss-AL besteht als Sprachdatenressource aus (1) einer Familie von mehrsprachigen Korpora der Schweizer öffentlichen Kommunikation, (2) einer korpus- und computerlinguistischen Pipeline zur Erstellung und Verarbeitung dieser Korpora und (3) einer browserbasierten Workbench zur Analyse dieser Korpora. Swiss-AL ermöglicht datengestützte und datengetriebene Forschung zu gesellschaftlichen Diskursen in der Schweiz. Es enthält Schweizer journalistische Medien sowie Medienmitteilungen, Newsmeldungen und Blogbeiträge von Akteuren aus Politik & Verwaltung, Wirtschaft, Wissenschaft und Zivilgesellschaft. Eine flexible Verarbeitungspipeline ermöglicht es, massgeschneiderte Teilkorpora für die Untersuchung von Diskursen zu modellieren.

Anwendungsgebiete

Swiss-AL wird vom ZHAW Digital Discourse Lab  in angewandten Forschungsprojekten zur Analyse und Simulation öffentlicher Diskurse in der Schweiz eingesetzt. Dazu gehören unter anderem die folgenden Projekte:

Die in Swiss-AL enthaltenen Mediendaten bilden ausserdem die Grundlage für das Wort des Jahres Schweiz  in den Sprachen Deutsch, Französisch, Italienisch und Rumantsch.

Das Korpus wird ausserdem in allen Studiengängen des Departements für die forschungsbasierte Lehre genutzt, beispielsweise bei der Erstellung von Abschlussarbeiten auf Bachelor- und Masterniveau oder im studiengangübergreifenden Kernstudium.

Swiss-AL und Open Research Data

Swiss-AL steht als offene Forschungsressource zur Verfügung. Seit Januar 2023 wird Swiss-AL von der ZHAW und swissuniversities im Rahmen der Swiss Open Research Data Grants gefördert, um Praktiken im Umgang mit sprachbasierten Forschungsdaten weiterzuentwickeln und in konkrete Nutzungsformen zu überführen. Im Zentrum stehen Praktiken, die Forschende aus anwendungsorientieren, nicht-linguistischen Disziplinen ausüben, um Sprachdaten zu analysieren.

Zugang

Swiss-AL kann mit Hilfe der am Departement Angewandte Linguistik entwickelten Swiss-AL Workbench genutzt werden.

Zusammensetzung

Die Korpusfamilie Swiss-AL setzt sich aus drei Komponenten zusammen:

  1. Swiss-AL Base: eine Auswahl zentraler Akteure der Schweizer öffentlichen Kommunikation aus Journalismus, Politik & Verwaltung, Wissenschaft, Wirtschaft und Zivilgesellschaft zur Exploration von Diskursen.
  2. Swiss-AL Media: breite Zusammenstellung journalistischer Medien (Tages- und Wochenzeitungen, lokal/regional/überregional).
  3. Swiss-AL Projects: Korpora aus inter- und transdisziplinären Forschungsprojekten zu spezifischen Diskursen; methodische Innovationen in diesen Projekten fliessen in die Zusammenstellung und Erstellung von Swiss-AL Media und Base ein.

Die Korpora werden über eine an der ZHAW entwickelte korpus- und computerlinguistische Pipeline erstellt. Die Textdaten werden regelmässig und automatisiert aus dem Web heruntergeladen (Webcrawling) sowie – im Falle journalistischer Medien – über die Schweizer Mediendatenbank bezogen (Swissdox@LiRi).

Publikationen

Team