Reklassifikation von Produktdaten elektronischer Produktkataloge
Produktform: Buch
Produkte in elektronischen Produktkatalogen werden durch eine Vielzahl von Informationen charakterisiert. Die Anzahl der Produktkataloge und der darin verfügbaren Produktdaten sind in den letzten Jahren stark angestiegen und haben zum Beispiel im Rahmen des e-Procurements erheblich an Bedeutung gewonnen. Klassifikationssysteme definieren eine Anzahl festgelegter Klassen (oftmals mehrere tausend), die zumeist hierarchisch angeordnet sind. Sie dienen innerhalb elektronischer Produktkataloge als Ordnungssystem und gruppieren ähnliche Produktdaten in ihren Klassen. Die im Produktkatalog enthaltenen Produktdaten werden dazu der Klasse eines oder mehrerer Klassifikationssysteme zugeordnet. Dies ennöglicht zum Beispiel ein schnelles Auffinden ähnlicher Produkte und erleichtert das Verwalten großer Produktmengen durch die Bereitstellung einer gemeinsamen Taxonomie.
Im Bereich der Güterklassifikation haben sich parallel mehrere Standards etabliert wie z.B. eCI@ss, ETIM oder UNSPSC. Zudem finden in Produktkatalogen häufig herstellereigene Klassifikationssysteme Anwendung. Diese Situation verkompliziert die reibungslose Zusammenarbeit verschiedener Geschäftspartner. Sie erschwert die Integration der Katalogdaten in Unternehmenssysteme bei der Verwendung unterschiedlicher Klassifikationssysteme. In diesen Fällen ist eine neue Einordnung der Produkte in Form einer Reklassifikation notwendig. Dabei werden die Produktdaten des bereits klassifizierten Kataloges erneut klassifiziert, so dass sie anschließend im benötigten Klassifikationssystem vorliegen.
Eine manuelle Reklassifikation von Produktdaten ist bei Katalogen, die oftmals mehrere tausend Produkte enthalten, nicht nur sehr aufwändig sondern erzeugt zudem signifikante Kosten. Es sind deshalb die Methodiken einer semi-automatischen Reklassifikation von Produktdaten zielführend. Die Arbeit zeigt auf, welche Schritte dazu erforderlich sind, welche existierenden Ansätze verwendet werden können und wo bislang ungenutzte Potentiale für eine derartige semi-automatische Reklassifikation liegen. Die Arbeit beschreibt einen entsprechenden Ansatz, der anhand eines Prototyps umgesetzt und evaluiert wird.
Im Fokus der Dissertation steht die zentrale These, dass sich im Anwendungsfall der Reklassifikation von Produktdaten durch die Heranziehung von bestehenden Klassifikationsinformationen signifikante Zusatzinformationen gewinnen lassen, um den Klassifikationsprozess zu präzisieren und damit Kostensenkungen zu ernöglichen.
Als Methodik zur Durchführung der Reklassifikation wird die bisherige Einordnung des Produktes in bestehende Klassifikationsangaben untersucht. Dabei werden beispielsweise die Produktverknüpfungen betrachtet, sowie die Vererbungsbeziehungen der Klassen des Klassifikationssystems. Es sind dazu sowohl die Produktdaten wie z.B. die Produktbeschreibungen auszuwerten, als auch die Beziehungen zwischen den Klassen der beteiligten Klassifikationssysteme. Hierzu wird auf Methodiken des Ontologymatchings zurückgegriffen (wie z.B. auf das Name-Matching oder das Instance-Matching). Diese Methodiken werden zur Erstellung von Analyseverfahren verwendet, in denen vereinzelt Machine-Learning Ansätze zum Einsatz kommen, um einen Trainingseffekt bei umfangreichen Produktkatalogen auszunutzen. Die Kombination verschiedener Analyseverfahren erzielt dabei bereits zu Beginn des Reklassifikationsprozesses eine hohe Erfolgsrate bei der Klassenzuordnung.weiterlesen