Digitale Sammlungen

Handlungsfeld

Die zunehmende Verfügbarkeit von Quellen für Daten und Texte in digitaler Form erlaubt es, vormals unzugängliche Forschungsfragen zu bearbeiten ebenso wie Software-Lösungen für neue Anwendungsbereiche (z.B. Sprachverständnis, Navigation im physischen Raum, intelligente Websuche) zu schaffen. Unverzichtbare Grundlage dafür ist die Verfügbarkeit von wohlgepflegten Datensammlungen und geeignet kuratierten Textkorpora mit passendem fachlichen Inhalt, angemessener Qualität und Aktualität und nachvollziehbaren Prozessen ihres Zustandekommens. Der Nutzen, den moderne, oftmals mit erheblichen Hoffnungen bezüglich Wirtschaftsentwicklung und wissenschaftlichem Potential gehandelten Analysemethoden wie Machine Learning (ML), Text und Datamining (TDM) und Künstlicher Intelligenz (KI) stiften können, hängt von der Verfügbarkeit geeigneter Datensammlungen und Textkorpora auf denen sie angewendet werden ab. Datensammlungen und Textkorpora sind dabei nicht nur Grundlage von Forschung, sondern auch im Rahmen öffentlich geförderter wissenschaftlicher Arbeit wie kommerzieller Anstrengungen entstehendes, für Forschung und Wirtschaft gleichermaßen wichtiges Endprodukt.

Schwerpunkte 2018 bis 2022

Wesentlich ist die Beförderung des Zugangs zum digitalen und digitalisierten kulturellen Erbe aus Bibliotheken, Archiven und Museen (wie Primärliteratur, Archivmaterial, Objekten und Artefakten), zu digitalen Forschungsdaten (einschließlich hochwertigen ausgezeichneten Daten für KI-Trainingszwecke) sowie zu Gebrauchs- und Funktionsdaten, die außerhalb des Forschungsprozesses entstanden sind, die aber für die Forschung interessant sind. Bedeutend für die wissenschaftliche Evaluation ist die freie Zugänglichkeit und Verwendbarkeit von Zitations- und Referenzdaten ebenso wie die Verfügbarkeit von Datensammlungen für alternative Metriken (altmetrics). Darüber hinaus soll die Verbreitung von Daten nach den Prinzipien Auffindbarkeit, Zugänglichkeit, Interoperabilität und Nachnutzbarkeit (FAIR Data Principles) befördert werden. Methodisch sollen insbesondere die Möglichkeiten des Text- und Dataminings (TDM) nutzbar gemacht werden. Rechtliche Fragen, z.B. im Zusammenhang mit TDM, werden in Zusammenarbeit mit dem Handlungsfeld „Recht für Wissenschaft im digitalen Zeitalter“ bearbeitet.

Arbeitsgruppe

Kontakt:

  • Vorsitzende:
    stellvertretende Vorsitzende:
  • Thomas Stäcker
    Jana Hoffmann

Name Benannt durch
Alexander Geyken Deutsche Forschungsgemeinschaft
Patrick Sahle Deutsche Forschungsgemeinschaft
Andrea Wuchner Fraunhofer-Gesellschaft
Christian Langenbach Helmholtz-Gemeinschaft
Nina Weisweiler Helmholtz-Gemeinschaft
Phillip Cimiano Hochschulrektorenkonferenz
Gerhard Heyer Hochschulrektorenkonferenz
Thomas Stäcker Hochschulrektorenkonferenz
Peer Trilcke Hochschulrektorenkonferenz
Reiner Mauer Leibniz-Gemeinschaft
Jana Hoffmann Leibniz-Gemeinschaft
Torsten Roeder Leopoldina
Margit Palzenberger Max-Planck-Gesellschaft
Friederike Kleinfercher
Max-Planck-Gesellschaft
Thomas Zastrow Max-Planck-Gesellschaft
Olaf Hering Bibliotheken der Ressortforschungseinrichtungen des Bundes (BRB) (Gast)