adbar / coronakorpus

Material zum Aufbau eines deutschsprachigen COVID-19-Webkorpus / Building a corpus in German dedicated to coronavirus

Home Page:https://www.dwds.de/d/k-web#corona

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Material zum Aufbau eines deutschsprachigen COVID-19-Webkorpus

Diese Linksammlung fokussiert auf deutschsprachige Webseiten zur COVID-19-Pandemie (u.a. mit erkenntnistheoretischer, gesellschaftlicher, politischer und wirtschaftlicher Perspektive) und zum Virus (u.a. aus medizinischer Sicht).

Die folgenden Kriterien werden beachtet, um ein Gleichgewicht zwischen den Quellen zu erzeugen, damit das Korpus vielfältig/vielschichtig und grob nach Quelle/Land und bestmöglich nach Genre ausgewogen werden kann.

  • Tages- und Wochenzeitungen (z.B. Der Freitag), Magazine und Online-Magazine (z.B. Manager-Magazin) sowie Nachrichtenquellen (z.B. Deutschlandfunk) werden zu erstrangigen Quellen, dabei muss ein Gleichgewicht im Sinne der Artikelanzahl zwischen einigen Großen/Bekannten bestehen.
  • Einige zusätzliche Quellen kommen dazu, weil sie von besonderem Interesse sind (keine Balance erwünscht: Ärzte Zeitung und Ärzteblatt), und (im einem kleineren Ausmaß) das politische Spektrum besser abdecken, z.B. Tichys Einblick oder Jungle World.
  • Weitere Online-Quellen, insbesondere Blogs, sollen zusätzliche qualitative Einblicke geben, z.B. literarische Tagebücher oder Podcasts mit Christian Drosten.

Auf Basis des zusammengetragenen Materials wird eine Sammlung von Webdokumenten erstellt, die im Anschluss der Öffentlichkeit zugänglich gemacht wird:

Es ist uns wichtig, das Korpus so umfangreich und belastbar wie möglich zu gestalten. Deshalb ermutigen wir alle Nutzer*innen ausdrücklich dazu, uns Hinweise zu weiteren Textressourcen zuzusenden.

Letzter Stand: ca. 78000 Links, November 2020.

N.B.: Nachfolger dieses Korpus ist ein Monitorkorpus aus Hunderten von Webquellen, der Webmonitor.

Kontext

Zentrum für digitale Lexikographie der deutschen Sprache (ZDL), Berlin-Brandenburgische Akademie der Wissenschaften.

Kontakt: Adrien Barbaresi.

Lizenz

CC BY-SA 4.0

About

Material zum Aufbau eines deutschsprachigen COVID-19-Webkorpus / Building a corpus in German dedicated to coronavirus

https://www.dwds.de/d/k-web#corona

License:Other