Open Password - Donnerstag, den 11. Juli 2019

# 590

 

Zukunft der Informationswissenschaft – Wissenschaftliche Bibliotheken – Dokumentenbasierung – Wissensbasierung – Digitalisierung – Sören Auer – Anna Kasprzik – Wissensgraphen – Google – Knowledge Graph – Semantic Web – Open Research Knowledge Graph – TIB – Transformation – Kollaboratives Kuratieren – Microsoft/Bing – Thomson Reuters – Clarivate – Dbpedia – Yogo – Freebase – Pure – Elsevier – ResearchGate – Open Knowledge Network – SpringerNature – Infrastruktureinrichtungen – Informationelle Souveränität – Automatisierung – Fachdomänen – Konsortium – Open Data – Open-Source-Software - Questex – FierceElectronics – Industry 4.0 – Google News – AP – Local Newsrooms – Equifax – Insider Trading – Thomson Reuters – Checkpoint Edge – AI – OAPEN Foundation – De Gruyter – EU Research Framework Programme – Springer Nature – SpringerLink – Press Ganey Online - Outsell - GDV - PSW GROUP – Gesundheitswesen – Verschlüsselung – Darknet – Bundesamt für Sicherheit in der Informationstechnik - Phishing

Zukunft der Informationswissenschaft – Teil „Wissenschaftliche Bibliotheken“

Von dokumentenbasierten
zu wissensbasierten Informationsflüssen

Die Rolle wissenschaftlicher Bibliotheken
im Transformationsprozess

Der Open Research Knowledge Graph

Von Sören Auer, Anna Kasprzik und Irina Sens

Zweiter Teil

________________________________________________________________________

Wissensgraphen

________________________________________________________________________

Der Term „Wissensgraph“ hat seine Ursprünge in den 80er-Jahren und ist spätestens seit der Einführung des Knowledge Graph von Google 2012 populär, üblicherweise in engem Zusammenhang mit Linked Data, Semantic-Web-Technologien, Big Data und Cloud Computing.[8],[9] Entsprechend gibt es auch eine gewisse Bandbreite an Definitionen für das Konzept dahinter, eine davon lautet: „Ein Wissensgraph aggregiert und integriert Information in einer Ontologie und wendet darauf Inferenztechniken an, um neues Wissen abzuleiten“.[10]

Folgende Aspekte machen einen Wissensgraphen aus:

• Ein Wissensgraph ist ein Netzwerk aus Beschreibungen von Konzepten, Klassen, Eigenschaften, Beziehungen und Entitäten.

• Er folgt einer formalisierten Wissensrepräsentation (üblicherweise auf Basis von Modellen und Beschreibungssprachen aus dem Semantic Web: RDF, RDFS, OWL).

• Er umfasst eine holistische Wissensrepräsentation, die diverse Domänen, Quellen und Granularitätsgrade abdeckt:

    ○ Instanzdaten (verifizierbar, Empirie)

○ offene (z.B. aus Wissensbasen wie DBpedia, WikiData) oder zugangsbeschränkte Daten (z.B. Produktionsdaten in der Industrie)

    ○ abgeleitete, aggregierte Daten

○ Daten zur semantischen Wissensorganisation und Kategorisierung von Entitäten (Vokabulare, Ontologien, Taxonomien)

○ Metadaten (z.B. Herkunft, Versionierung, Rechte zur Dokumentlizenzierung)

    ○ Links zwischen internen und externen Daten

○ Mappings zu Daten in anderen Systemen und Datenbanken.

Ein solcher Wissensgraph kann nun genutzt werden, um auch wissenschaftliche Arbeit und alle durch sie produzierten Artefakte einschließlich der Kommunikation zwischen Wissenschaftlern strukturiert und semantisch aufbereitet darzustellen, um sie so unmittelbar nachvollziehbar und nachnutzbar zu machen.

________________________________________________________________________

Der Open Research Knowledge Graph

________________________________________________________________________

Der von der TIB mit Partnerorganisationen avisierte Open Research Knowledge Graph (ORKG) ist ein zentrales Element in dem beschriebenen Transformationsprozess. Er repräsentiert originäre Forschungsergebnisse explizit semantisch und verknüpft vorhandene Metadaten, Daten, Wissens- und Informationsressourcen reichhaltig miteinander (vgl. Abbildung 1). Der Graph kann von Bibliotheken (Weiterentwicklung der Sacherschließung) und den jeweiligen Forschungsgemeinschaften kollaborativ kuratiert werden. Er sichert die Herkunft (“Provenance”) und repräsentiert den wissenschaftlichen Diskurs und die Weiterentwicklung des aktuellen Standes der Wissenschaft, macht übergreifende und fachspezifische Konzepte eindeutig identifizierbar und vernetzt diese semantisch (über klar beschriebene Relationen) untereinander und mit relevanten Artefakten (Daten, AV-Medien, Software, domänenspezifische Informationsmodelle usw.).

Abbildung 1: Der geplante Open Research Knowledge Graph als Forschungsinfrastruktur vernetzt eine explizite semantische Repräsentation von Forschungsergebnissen mit einer Vielzahl weiterer Informationsquellen und Infrastrukturen

 

Wissensgraphen werden mittlerweile von vielen großen Unternehmen (u.a. Google, Microsoft/Bing, Thomson Reuters, Clarivate) zur Vernetzung ihrer Daten genutzt. Mit DBpedia[11], Yago und Freebase entstanden vor etwa zehn Jahren erste Wissensgraphen zur Repräsentation enzyklopädischen Wissens. Diese haben sich in den letzten Jahren wesentlich weiterentwickelt und stellen mittlerweile viele Milliarden Fakten zu enzyklopädischem Faktenwissen in einer Vielzahl von Domänen bereit. Auf unternehmerischer Seite entwickelt Google den von Freebase entwickelten Wissensgraphen strategisch weiter, indem vielfältige Datenquellen angebunden und integriert werden.

Derzeit beginnende Entwicklungen – wie die zunehmende Verbreitung kommerzieller Forschungsinformationssysteme (z.B. Pure von Elsevier) und sozialer Netzwerke (z.B. ResearchGate) sowie außereuropäische Initiativen (z.B. das Open Knowledge Network[12] der großen US-Forschungsförderer) – zeigen, dass der Wandel von dokumentenbasierten zu wissensbasierten Informationsflüssen in Wissenschaft und Technik in den nächsten Jahren bevorsteht. Insbesondere ResearchGate, Elsevier[13] und SpringerNature[14] scheinen bereits aktiv in die Entwicklung von Wissensgraphen zu investieren. Wenn diese Entwicklung allerdings allein von außereuropäischen oder kommerziellen Akteuren vorangetrieben werden sollte, besteht die Gefahr, dass sich Wissenschaft und Technik nach der Abhängigkeit und Monopolisierung von Verlagen im Kontext dokumentenbasierter Informationsflüsse in eine noch stärkere Abhängigkeit bei wissensbasierten Informationsflüssen begeben. Es ist daher von überragender wissenschaftspolitischer Bedeutung, dass wissenschaftliche Infrastruktureinrichtungen ein offenes Gegengewicht zu kommerziellen Entwicklungen etablieren – zur Sicherung der informationellen Souveränität.

Der ORKG kann in einer synergetischen Kombination von automatisierten und manuellen Verfahren aus vier komplementären Quellen gespeist werden:

• existierenden Metadaten, Daten, Taxonomien, Ontologien und Informationsmodellen

• Beiträgen von Wissenschaftlern, die ihre eigene Forschung unterstützt durch intelligente Schnittstellen und halbautomatisiert generierte Vorschläge beschreiben

• automatisierten Verfahren zur Wissensextraktion und Vernetzung

• Kuratierung und Qualitätssicherung durch Bibliothekare und Informationswissenschaftler in einer erweiterten Form der Sacherschließung.

Nur eine Kombination dieser verschiedenen Quellen und Kuratierungsmethoden kann erfolgreich sein, da automatisierte Verfahren allein die notwendige Abdeckung und Genauigkeit nicht erreichen, eine vollständig manuelle Kuratierung zu aufwendig ist, Bibliothekaren und Informationswissenschaftlern das notwendige domänenspezifische Fachwissen zur tiefen Repräsentation fehlt und Wissenschaftlern der jeweiligen Domäne die notwendige Expertise bei der Wissensrepräsentation mangelt. Durch eine sinnvolle Kombination der vier Quellen und Kuratierungsmethoden können diese ihre jeweiligen Stärken zur Geltung bringen und die Schwachstellen kompensiert werden.

Abbildung 2: Vernetzung übergreifender und fachspezifischer Konzepte und Artefakte wissenschaftlicher Arbeit in den verschiedenen Fachdomänen


Der ORKG sollte als offene digitale Forschungsinfrastruktur von einem breiten und offenen Konsortium betrieben werden und stellt neben generischen auch domänenspezifische Vernetzungs-, Integrations-, Visualisierungs-, Explorations- und Suchfunktionen für Fachdomänen bereit. Er ermöglicht Wissenschaftlern, sich wesentlich schneller einen Überblick über neue Entwicklungen in einem bestimmten Fachgebiet zu verschaffen und relevante Forschungsprobleme zu identifizieren. Er repräsentiert die Evolution des wissenschaftlichen Diskurses in den einzelnen Fachgebieten und ermöglicht Wissenschaftlern, durch die semantische Beschreibung ihrer Arbeit diese ihren Fachkollegen und potentiellen Anwendern in der Industrie leichter zugänglich zu machen. Das folgende Beispiel illustriert einen Ausschnitt eines Wissensgraphen für die Chemie.

 

Abbildung 3: Ausschnitt eines Wissensgraphen zu einer Publikation in der Bio-Chemie


Ein Wissenschaftler zum Beispiel im Bereich Batterieforschung kann dann mit einer Anfrage an den ORKG aktuelle Forschungsergebnisse zu Nanomaterialien für hocheffiziente Batterien identifizieren und diese nach Reifegrad, erzielter Energiedichte und genutzten chemischen Verbindungen filtern. Ergebnisse können übersichtlich tabellarisch dargestellt und verglichen werden, und es können auch künftige Aktualisierungen abonniert werden. Bei neuen Forschungsergebnissen, die zur Suchanfrage passen, wird der Wissenschaftler automatisch – etwa per E-Mail – informiert. Forschungsförderer können sich (z.B. über ebenfalls als Wissensgraphen dargebotene Forschungsberichte) wesentlich aktueller, präziser und umfassender über den aktuellen Stand der Forschung in einem Gebiet und die konkreten Auswirkungen von Förderprogrammen informieren.

Ein solcher ORKG-Dienst eröffnet eine Vielzahl von Anwendungen, die Forschern gänzlich neue Möglichkeiten bieten, schneller, intuitiver und effizienter zusammenzuarbeiten. Einige Beispiele der Vorteile und Anwendungsmöglichkeiten sind: die Erstellung domänenspezifischer Vokabulare und Taxonomien (z.B. für Forschungsdatenmanagement), die automatische Generierung von strukturierten Überblickssichten über Forschungsgebiete, der Vergleich verschiedener Forschungsansätze, die Erhebung von Meinungsbildern von Wissenschaftlern, die Visualisierung von Wissenschaftsgebieten und die proaktive Benachrichtigung bei neuen Entwicklungen in einem abgegrenzten Gebiet.

Ein ORKG-Dienst sollte von Anfang an konsequent als Open-Source-Software realisiert werden, um es einer möglichst großen Zahl von Partnern, Nutzern und Stakeholdern zu ermöglichen, sich an der Entwicklung zu beteiligen. Alle im Wissensgraph gespeicherten Daten und Informationen sollen unter einer offenen Lizenz als Open Data und Open Knowledge bereitgestellt werden, damit die Community diese Daten für die Integration mit weiteren Diensten, neue Anwendungen und domänenspezifische Analysen nutzen kann.

Lesen Sie in der abschließenden Folge: Open Research Knowledge Graph: Schritte zu seiner Realisierung – Die wissenschaftlichen Bibliotheken im Transformationsprozess

GDV - PSW GROUP

Datenschutz und Verschlüsselung im Gesundheitswesen mangelhaft

Um den Datenschutz im Gesundheitswesen ist es schlecht bestellt: Eine neue Studie der GDV zeigt, dass Ärzte sowie Apotheken hierzulande nachlässig im Umgang mit Passwörtern sind. Hinzu kommt die Tatsache, dass viele auf Verschlüsselung verzichten – fatal, wenn es um medizinische Daten geht. Demnach setzen neun von zehn Ärzten auf einfach zu erratende Passwörter. Gerne wird der Name des Arztes verwendet oder aber Wörter wie "Behandlung". In 9 Prozent aller Arztpraxen sowie 60 Prozent der Kliniken werden sogar Login- und Passwort-Kombinationen genutzt, die von Kriminellen im Darknet angeboten werden. https://www.psw-group.de/blog/datenschutz-im-gesundheitswesen-verschluesselung-mangelhaft/7025. Zudem gefährden Praxen und Kliniken den Datenschutz zusätzlich durch das interne Teilen von Zugängen.

Noch schlimmer als beim Passwortschutz sieht es laut Studie bei der Verschlüsselung personenbezogener Daten aus: Lediglich 0,4 Prozent, folgen den Empfehlungen zum Datenschutz im Gesundheitswesen des Bundesamts für Sicherheit in der Informationstechnik (BSI) und nutzen, wie es gesetzlich geboten wäre, E-Mail-Zertifikate.   Der Gesundheitssektor wird zusätzlich durch das Risiko von Phishing-Mails gefährdet: In jeder zweiten Praxis öffnen die Mitarbeiter potenziell schadhafte E-Mails. 20 Prozent von ihnen klickten aus Unwissenheit oder mangelndem Sicherheitsempfinden sogar auf Links oder öffneten Anhänge.

Eine Forsa-Umfrage zeigte, dass 81 Prozent aller Ärzte glauben, die eigenen Computersysteme seien umfassend geschützt.  https://www.psw-group.de/blog/datenschutz-im-gesundheitswesen-verschluesselung-mangelhaft/7025

Quelle: PSW GROUP

 

Digitale Transformation
in der Elektrotechnik

Questex, an information services company, has launched FierceElectronics in a bid to address the transformation being seen in electronics engineering. Electronics engineers need to be informed on new technologies, new products and new business models. Speed, scale and innovation are being driven by the convergence of digital technology and its ability to fuse physical, digital and biological elements. Industry 4.0 is expected to create up to $3.7 trillion in value by 2025 (World Economic Forum), creating a complete transformation of entire systems.

Tool für die Kooperation zwischen Lokalredaktionen. With support from the Google News Initiative, AP will build an online tool that enables members to share their coverage plans to more efficiently cover local news. It will also allow participating news organizations to share their journalism, increasing the amount of local news stories in their communities.

Equifax-Manager wegen Insiderhandel ins Gefängnis. A former Equifax executive will serve four months in federal prison for selling his shares in the company just two weeks before the consumer credit reporting agency announced its data was breached. 

Künstliche Intelligenz gegen die Komplexität der Steuergesetzgebung. Thomson Reuters announced the launch of Thomson Reuters Checkpoint Edge, an AI-powered tax research platform that provides the fastest answers to the most complex tax law and regulatory questions. Checkpoint Edge draws on the Checkpoint tax databases, which include tax law, insights and analysis updates each month from the Checkpoint editorial team.

Open-Access-Vereinbarung zwischen OAPEN Foundation und De Gruyter. The OAPEN Foundation and De Gruyter have developed a framework agreement that outlines good practice for retroactive open access to books and chapters resulting from research funded by the European Research Council under the 7th EU Research Framework Programme. The framework agreement between De Gruyter and the OAPEN Foundation supports authors by establishing compliance with the ‘best effort’ requirement to make publications open access.

Start einer peer-reviewten Videoserie auf SpringerLink. Springer Nature is launching a new collection of educational, standalone, peer-reviewed videos on its online content platform SpringerLink. Available from July, the videos cover a wide range of content from demonstrations of surgical techniques to tailored lecture series and interviews with researchers. Content for the videos is created by academics and practitioners.

Digitale Transformation im Gesundheitswesen. Press Ganey released its digital analytics and reporting platform, Press Ganey Online. This technology is designed to engage stakeholders across the enterprise and enable alignment around improvement strategies to accelerate transformational change. The platform supports the company’s suite of Transformational Solutions and delivers insights and performance analytics that allow health care organizations to identify and act on improvement opportunities to drive results across the system.

Quelle: Outsell

 

Open Password

Forum und Nachrichten
für die Informationsbranche
im deutschsprachigen Raum

Neue Ausgaben von Open Password erscheinen viermal in der Woche.

Wer den E-Mai-Service kostenfrei abonnieren möchte - bitte unter www.password-online.de eintragen.

Die aktuelle Ausgabe von Open Password ist unmittelbar nach ihrem Erscheinen im Web abzurufen.  www.password-online.de/push-dienst-archiv/. Das gilt auch für alle früher erschienenen Ausgaben.

International Co-operation Partner:
Outsell (London)
Business Industry Information Association/BIIA (Hongkong)

---