🏠 » Lexikon » K » Knowledge Graph

Knowledge Graph

Der Knowledge Graph, deutsch Wissensgraph, stellt eine Sammlung von miteinander verknüpften Beschreibungen von Entitäten dar, die Objekte, Ereignisse oder Konzepte repräsentieren können. Wie auch bei Datenbanksystemen werden Objekte und Ereignisse der realen Welt oder abstrakten Konzepten (z. B. Dokumente) abgebildet.

Der Knowledge Graph stellt Daten über die Verknüpfungen und semantischen Metadaten in einem Kontext dar und bietet auf diese Weise einen Rahmen für die Datenintegration, -vereinheitlichung, -analyse und -weitergabe.

Die Beschreibungen haben eine formale Semantik, die es sowohl Menschen als auch Computern ermöglicht, sie effizient und eindeutig zu verarbeiten. Die Entitätsbeschreibungen sind miteinander verknüpft und bilden ein Netzwerk, in dem jede Entität einen Teil der Beschreibung der Entitäten darstellt, die mit ihr in Beziehung stehen, und einen Kontext für ihre Interpretation liefert.

Die Abbildung stellt einen kleinen Knowledge Graph dar, in dem die Beziehungen von Rollen, Schauspielern bzw. Darstellern und Filmen über das gemeinsame Genre abgebildet sind:

Knowledge Graph Definition & Erklärung | Datenbank Lexikon

Merkmale eines Knowledge Graph

In einem Knowledge Graph fließen mehrere Eigenschaften (Merkmale) aus den Datenverwaltungsparadigmen zusammen. Aus dem Bereich der Datenbanken stammen Eigenschaften, durch die Daten über strukturierte Abfragen analysiert werden können. Aus dem Bereich der Graphen stammt die Möglichkeit jede andere Netzwerkdatenstruktur analysieren zu können. Durch Eigenschaften aus Wissensbasen stammen formale Semantiken, die zur Interpretation der Daten und zur Ableitung neuer Fakten verwendet werden.

Knowledge Graphs werden mittels RDF (Resource Description Framework) dargestellt. RDFs bieten den besten Rahmen für Datenintegration, Vereinheitlichung, Verknüpfung und Wiederverwendung von Strukturen, da sie verschiedene Aspekte kombinieren:

Ausdruckskraft: RDF(S) und OWL - ermöglichen eine fließende Darstellung verschiedener Arten von Daten und Inhalten. Sie beinhalten Datenschemata, Taxonomien und Vokabulare, alle Arten von Metadaten, Referenz- und Stammdaten.

Leistung: Alle Spezifikationen wurden durchdacht und in der Praxis erprobt, um eine effiziente Verwaltung von Graphen mit Milliarden von Fakten und Eigenschaften zu ermöglichen.

Interoperabilität: Es gibt eine Reihe von Spezifikationen für die Serialisierung von Daten, den Zugriff (SPARQL Protokoll für Endpunkte), die Verwaltung (SPARQL Graph Store) und die Föderation. Auch die Verwendung von weltweit eindeutigen Bezeichnern erleichtert die Datenintegration und -veröffentlichung.

Standardisierung: Durch den W3C-Community-Prozess werden formale Beschreibungen standardisiert, um sicherzustellen, dass die Anforderungen der verschiedenen Akteure erfüllt werden.

Abgrenzung zu anderer Datenhaltung und -strukturierung

Nicht jeder RDF-Graph ist ein Knowledge Graph. So ist z. B. ein Satz statistischer Daten, die in RDF dargestellt werden, kein Knowledge Graph. Eine Graphen-Darstellung von Daten ist oft nützlich, aber sie kann unnötig sein, um das semantische Wissen der Daten zu erfassen. Es sind die Verbindungen und der Graph, die den Knowledge Graph ausmachen, nicht die Sprache, die zur Darstellung der Daten verwendet wird.

Auch nicht jede Wissensbasis ist ein Knowledge Graph. Ein wesentliches Merkmal eines Knowledge Graph ist, dass Entitätsbeschreibungen miteinander verknüpft sein sollten. Die Definition einer Entität schließt eine andere Entität ein. Durch diese Verknüpfung wird der Graph gebildet (z. B. A ist B. B ist C. C hat D. A hat D). Wissensbasen ohne formale Struktur und Semantik, z. B. Q&A "Wissensbasis" über ein Softwareprodukt, stellen ebenfalls keinen Knowledge Graph dar.

Es ist möglich, ein Expertensystem zu haben, das eine Sammlung von Daten hat, die in einem Format organisiert sind, das kein Graph ist, sondern automatisierte deduktive Prozesse verwendet, wie z. B. einen Satz von "Wenn-dann"-Regeln, um die Analyse zu erleichtern.

Aufbau von Knowledge Graphs - Ontologien und formale Semantik

Ontologien stellen das Rückgrat der formalen Semantik eines Knowledge Graphs dar. Sie können als das Datenschema des Graphen angesehen werden. Sie dienen als formaler Vertrag zwischen den Entwicklern des Knowledge Graph und seinen Anwendern bezüglich der Bedeutung der Daten in ihm. Ein Benutzer kann ein anderer Mensch oder eine Softwareanwendung sein, die die Daten auf zuverlässige und präzise Weise interpretieren möchte. Ontologien gewährleisten ein gemeinsames Verständnis der Daten und ihrer Bedeutungen.

Wenn formale Semantik verwendet wird, um die Daten eines Knowledge Graph auszudrücken und zu interpretieren, gibt es eine Reihe von Darstellungs- und Modellierungsinstrumenten. Zu ihnen gehören Klassen, Beziehungstypen, Kategorien und Freitext-Beschreibungen.

Knowledge Graphs Beispiele

In den letzten Jahren sind einige Knowledge Graphs entstanden, deren Informationsgehalt für die Entwicklung intelligenter Anwendungen nutzbar gemacht wurde. Zu diesen zählen der Google Knowledge Graph, DBPedia, Geonamen, Wordnet und FactForge.

Google Knowledge Graph: Der Begriff Knowledge Graph wurde mit der Ankündigung seines Knowledge Graphs im Jahr 2012 populär. Über diesen gibt es jedoch sehr wenige technische Details zur Organisation, Abdeckung und Größe. Außerhalb von Google Projekten ist es kaum möglich den Google Knowledge Graph für eigenen Projekten zu nutzen.

DBPedia: Ist ein Projekt und nutzt die Wikipedia Infoboxen und deren Struktur, um einen riesigen Datensatz von 4,58 Dingen und eine Ontologie zu erstellen, die eine enzyklopädische Abdeckung von Entitäten wie Personen, Orten, Filmen, Büchern, Organisationen, Arten, Krankheiten usw. aufweist. Dieser Datensatz gehört zur Open Linked Data-Bewegung.

Geonamen: Nutzer des Geonames-Datensatzes haben Zugriff auf 25 Millionen geografische Entitäten und Merkmale.

Wordnet: Eine der bekanntesten lexikalischen Datenbanken für die englische Sprache, die Definitionen und Synonyme bereitstellt. Wordnet wird oft verwendet, um die Leistung von NLP- und Suchanwendungen zu verbessern.

FactForge: Ontotext hat seinen Wissensgraphen aus Linked Open Data und Nachrichtenartikeln über Personen, Organisationen und Orte erstellt. Er enthält die Daten aus den oben beschriebenen Knowledge Graphs sowie spezialisierte Ontologien wie die Financial Industry Business Ontology.

Einsatzbereiche von Knowledge Graph

Große Knowledge Graphs liefern umfangreiches Hintergrundwissen, menschenähnliches Konzept- und Entitätswissen, um eine genauere Interpretation des Textes zu ermöglichen. Das macht sie vor allem in der Analyse von Textdaten interessant, vor allem im Natural Language Processing und Unterstanding.

Die Ergebnisse der Analyse sind semantische Tags (Annotationen), die Referenzen im Text mit bestimmten Konzepten im Graphen verknüpfen. Diese Tags stellen strukturierte Metadaten dar, die eine bessere Suche und weitere Analysen ermöglichen. Aus dem Text extrahierte Fakten können hinzugefügt werden, um den Wissensgraphen anzureichern, was ihn für Analyse, Visualisierung und Reporting sehr wertvoll macht.

Zudem gibt es eine Reihe spezifischer Anwendungen und Einsatzbereiche, die sich auf Knowledge Graphs stützen. Dazu gehören daten- und informationsintensive Dienste wie intelligente Wiederverwendung von Inhalten und Paketen, reaktionsschnelle und kontextbezogene Inhaltsempfehlungen, semantische Suche, Investment Market Intelligence und Informationsentdeckung in regulatorischen Dokumenten.

Knowledge Graph - Definition & Erklärung - Zusammenfassung

Im Zusammenhang mit dem Lexikoneintrag Knowledge Graph sollte man sich folgende Punkte merken:

  • Der Knowledge Graph, deutsch Wissensgraph, stellt eine Sammlung von miteinander verknüpften Beschreibungen von Entitäten dar, die Objekte, Ereignisse oder Konzepte repräsentieren können.
  • In den letzten Jahren sind einige Knowledge Graphs entstanden, wie zum Beispiel der Google Knowledge Graph, DBPedia, Geonamen, Wordnet und FactForge.
  • Große Knowledge Graphs liefern umfangreiches Hintergrundwissen, menschenähnliches Konzept- und Entitätswissen, um eine genauere Interpretation des Textes zu ermöglichen.