Browse Prior Art Database

Nutzung der DEDICOM Tensor Zerlegung für Instance Matching

IP.com Disclosure Number: IPCOM000205978D
Original Publication Date: 2011-Apr-11
Included in the Prior Art Database: 2011-Apr-11
Document File: 1 page(s) / 71K

Publishing Venue

Siemens

Related People

Juergen Carstens: CONTACT

Abstract

Instance Matching spielt vor allem bei der Zusammenführung von unterschiedlichen Datenbanken eine Rolle. Die Aufgabe von Instance Matching ist die Identifizierung von Instanzen, die auf gleiche reale Entitäten verweisen. Instance Matching findet zudem im semantischen Web Verwendung, da dort heterogene Daten aus unterschiedlichen Quellen aufeinander abgebildet werden, um Informationen für den Computer verwertbar zu machen. Derzeit wird das Instance Matching mithilfe graphischer Modelle durchgeführt. Hierbei wird anhand von Ähnlichkeitsmaßen entschieden, ob zwei Instanzen identisch sind. Zur Berechnung der Ähnlichkeit werden dabei linguistische und strukturelle Eigenschaften herangezogen. Die linguistischen Eigenschaften werden üblicherweise vom WordNet bereit gestellt. Das WordNet besteht aus einer Datenbank, die semantische und lexikalische Bezüge zu den Wörtern enthält. Die strukturellen Eigenschaften dagegen sind abhängig von dem verwendeten Modell. Eine strukturelle Eigenschaft kann beispielsweise die Wahrscheinlichkeit einer Ähnlichkeit zweier benachbarter Knoten in einem graphischen Modell sein.

This text was extracted from a PDF file.
This is the abbreviated version, containing approximately 51% of the total text.

Page 01 of 1

(This page contains 01 pictures or other non-text object)

(This page contains 00 pictures or other non-text object)

Nutzung der DEDICOM Tensor Zerlegung für Instance Matching

Idea: Maximilian Nickel, DE-München; Dr. Volker Tresp, DE-München

Instance Matching spielt vor allem bei der Zusammenführung von unterschiedlichen Datenbanken eine Rolle. Die Aufgabe von Instance Matching ist die Identifizierung von Instanzen, die auf gleiche reale Entitäten verweisen. Instance Matching findet zudem im semantischen Web Verwendung, da dort heterogene Daten aus unterschiedlichen Quellen aufeinander abgebildet werden, um Informationen für den Computer verwertbar zu machen.

Derzeit wird das Instance Matching mithilfe graphischer Modelle durchgeführt. Hierbei wird anhand von Ähnlichkeitsmaßen entschieden, ob zwei Instanzen identisch sind. Zur Berechnung der Ähnlichkeit werden dabei linguistische und strukturelle Eigenschaften herangezogen. Die linguistischen Eigenschaften werden üblicherweise vom WordNet bereit gestellt. Das WordNet besteht aus einer Datenbank, die semantische und lexikalische Bezüge zu den Wörtern enthält. Die strukturellen Eigenschaften dagegen sind abhängig von dem verwendeten Modell. Eine strukturelle Eigenschaft kann beispielsweise die Wahrscheinlichkeit einer Ähnlichkeit zweier benachbarter Knoten in einem graphischen Modell sein.

Im Folgenden wird vorgeschlagen, das Instance Matching Problem mithilfe der DEDICOM (DEcomposition into DIrectional COMponents) Tensor Zerlegung zu lösen. Diese Zerlegung findet wie folgt statt: Zunächst werden aus den verschiedenen Daten ein Tensor 3.Ordnung gebildet. Hierbei wird den Instanzen 2 Moden und den Relationen eine Mode zugesprochen. Auf diesen Tensor wird dann die DEDICOM Zerlegung angewand...