Digitale Sammlungen

Handlungsfeld

Die zunehmende Verfügbarkeit von Quellen für Daten und Texte in digitaler Form erlaubt es, vormals unzugängliche Forschungsfragen zu bearbeiten ebenso wie Software-Lösungen für neue Anwendungsbereiche (z.B. Sprachverständnis, Navigation im physischen Raum, intelligente Websuche) zu schaffen. Unverzichtbare Grundlage dafür ist die Verfügbarkeit von wohlgepflegten Datensammlungen und geeignet kuratierten Textkorpora mit passendem fachlichen Inhalt, angemessener Qualität und Aktualität und nachvollziehbaren Prozessen ihres Zustandekommens. Der Nutzen, den moderne, oftmals mit erheblichen Hoffnungen bezüglich Wirtschaftsentwicklung und wissenschaftlichem Potential gehandelten Analysemethoden wie Machine Learning (ML), Text und Datamining (TDM) und Künstlicher Intelligenz (KI) stiften können, hängt von der Verfügbarkeit geeigneter Datensammlungen und Textkorpora auf denen sie angewendet werden ab. Datensammlungen und Textkorpora sind dabei nicht nur Grundlage von Forschung, sondern auch im Rahmen öffentlich geförderter wissenschaftlicher Arbeit wie kommerzieller Anstrengungen entstehendes, für Forschung und Wirtschaft gleichermaßen wichtiges Endprodukt.

Schwerpunkte 2018 bis 2020

Wesentlich ist die Beförderung des Zugangs zum digitalen und digitalisierten kulturellen Erbe aus Bibliotheken, Archiven und Museen (wie Primärliteratur, Archivmaterial, Objekten und Artefakten), zu digitalen Forschungsdaten (einschließlich hochwertigen ausgezeichneten Daten für KI-Trainingszwecke) sowie zu Gebrauchs- und Funktionsdaten, die außerhalb des Forschungsprozesses entstanden sind, die aber für die Forschung interessant sind. Bedeutend für die wissenschaftliche Evaluation ist die freie Zugänglichkeit und Verwendbarkeit von Zitations- und Referenzdaten ebenso wie die Verfügbarkeit von Datensammlungen für alternative Metriken (altmetrics). Darüber hinaus soll die Verbreitung von Daten nach den Prinzipien Auffindbarkeit, Zugänglichkeit, Interoperabilität und Nachnutzbarkeit (FAIR Data Principles) befördert werden. Methodisch sollen insbesondere die Möglichkeiten des Text- und Dataminings (TDM) nutzbar gemacht werden. Rechtliche Fragen, z.B. im Zusammenhang mit TDM, werden in Zusammenarbeit mit dem Handlungsfeld „Recht für Wissenschaft im digitalen Zeitalter“ bearbeitet.

Arbeitsgruppe

Kontakt:

  • Vorsitzende:
    stellvertretender Vorsitzender:
  • Thomas Stäcker
    Jana Hoffmann

NameBenannt durch
Alexander GeykenDeutsche Forschungsgemeinschaft
Patrick SahleDeutsche Forschungsgemeinschaft
Andrea WuchnerFraunhofer-Gesellschaft
Mark AzzamHelmholtz-Gemeinschaft
Christoph HolzkeHelmholtz-Gemeinschaft
Phillip CimianoHochschulrektorenkonferenz
Fotis JannidisHochschulrektorenkonferenz
Gerhard HeyerHochschulrektorenkonferenz
Thomas StäckerHochschulrektorenkonferenz
Reiner MauerLeibniz-Gemeinschaft
Jana HoffmannLeibniz-Gemeinschaft
Rainer GodelLeopoldina
Paulina Zakrzewska Leopoldina
Margit PalzenbergerMax-Planck-Gesellschaft
Friederike Kleinfercher
Max-Planck-Gesellschaft
Thomas ZastrowMax-Planck-Gesellschaft
Olaf HeringBibliotheken der Ressortforschungseinrichtungen des Bundes (BRB) (Gast)