Schlussbericht mtrade - ISS - Umwelt-Campus Birkenfeld
Schlussbericht mtrade - ISS - Umwelt-Campus Birkenfeld
Schlussbericht mtrade - ISS - Umwelt-Campus Birkenfeld
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
! "<br />
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Prof. Dr. Rolf Krieger | Prof. Dr. Norbert Kuhn<br />
Dipl.-Inform. Stefan Naumann | Dipl.-Inform. Cordula Schürmann<br />
Dipl.-Inform. (FH) Christian Sommer
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Herausgeber<br />
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung (<strong>ISS</strong>)<br />
Fachhochschule Trier, Standort <strong>Umwelt</strong>-<strong>Campus</strong> <strong>Birkenfeld</strong><br />
Postfach 13 80<br />
D-55761 <strong>Birkenfeld</strong><br />
© <strong>ISS</strong> 2004<br />
2
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Gefördert im Rahmen des Förderprogramms „Wissensintensive Dienstleistungen“<br />
des Bundesministeriums für Bildung und Forschung<br />
Projekt-Nr. 126TV9BF, Förderkennzeichen 01HW0118<br />
Projektträger: Deutsches Zentrum für Luft- und Raumfahrt (DLR)<br />
Projektlaufzeit 1. August 2001 – 31. Dezember 2003<br />
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
<strong>Umwelt</strong>-<strong>Campus</strong> <strong>Birkenfeld</strong>, Standort der Fachhochschule Trier<br />
Postfach 1380<br />
D-55761 <strong>Birkenfeld</strong><br />
Prof. Dr. Rolf Krieger | Prof. Dr. Norbert Kuhn<br />
Dipl.-Inform. Stefan Naumann | Dipl.-Inform. Cordula Schürmann<br />
Dipl.-Inform. (FH) Christian Sommer<br />
3
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
4
INHALTSVERZEICHNIS<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
I PROJEKTPLANUNG........................................................................................ 10<br />
1 Einleitung....................................................................................................................... 10<br />
1.1 Fachliche Spezifikation und Klassifikation von gebrauchten Maschinen ..... 10<br />
1.2 Matching Service für Angebot und Nachfrage .................................................. 11<br />
1.3 Branchenspezifische Suchverfahren (Suchspider/-crawler)........................... 11<br />
1.4 Prototypische Integration von Komponenten .................................................... 11<br />
2 Grundlagen und Ablauf des Vorhabens................................................................ 12<br />
2.1 Arbeitspakete ......................................................................................................... 13<br />
2.2 Projektverlauf ......................................................................................................... 14<br />
2.3 Klassifikationen ...................................................................................................... 15<br />
2.4 Produktkataloge..................................................................................................... 16<br />
2.5 Information Retrieval-Verfahren .......................................................................... 16<br />
3 Zusammenarbeit mit anderen Stellen.................................................................... 17<br />
II PROJEKTERGEBN<strong>ISS</strong>E.................................................................................. 18<br />
1 Klassifikationssysteme und Katalogformate....................................................... 18<br />
1.1 Analyse bestehender Anbieter/ Handelsbörsen ............................................... 18<br />
1.2 Anforderungen an Klassifikationssysteme und Produktkataloge................... 21<br />
1.2.1 Strukturelle Anforderungen .......................................................................... 21<br />
1.2.1.1 Referenzhierarchie .................................................................................... 21<br />
1.2.1.2 Merkmale und Merkmalleisten................................................................. 22<br />
1.2.2 Inhaltliche Anforderungen ............................................................................ 23<br />
1.2.3 Zusammenfassung........................................................................................ 23<br />
1.3 Analyse einschlägiger Klassifikationssysteme.................................................. 25<br />
1.3.1 Elektronisch verfügbare Klassifikationssysteme....................................... 25<br />
1.3.1.1 eClass 4.0................................................................................................... 25<br />
1.3.1.2 United Nations Standard Products and Services Code System ........ 28<br />
1.3.1.3 Elektro-Technisches Informations-Modell (ETIM) ................................ 29<br />
1.3.2 Weitere Klassifikationssysteme................................................................... 29<br />
1.3.2.1 DIN 8580 Fertigungsverfahren ................................................................ 29<br />
1.3.2.2 Klassifikation AWF 310............................................................................. 30<br />
1.3.2.3 Klassifizierung auf Grundlage eines Merkmallexikons ........................ 31<br />
1.3.3 Zusammenfassung........................................................................................ 32<br />
5
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
6<br />
1.4 Betrachtung verschiedener XML-Austauschformate für Produktkataloge ... 33<br />
1.4.1 Allgemeine Anforderungen........................................................................... 33<br />
1.4.2 Analyse einschlägiger Produktkatalogformate.......................................... 35<br />
1.4.2.1 BMEcat........................................................................................................ 35<br />
1.4.2.2 XML Common Business Library 3.5 (xCBL) ......................................... 37<br />
1.4.2.3 commerce eXtensible Markup Language Version 1.1 (cXML)........... 38<br />
1.4.3 Bewertung....................................................................................................... 38<br />
1.5 Datenstruktur eines generischen Klassifikationssystems ............................... 39<br />
2 Such- und Klassifizierungsstrategien in Klassifikationssystemen und<br />
elektronischen Produktkatalogen................................................................................... 41<br />
2.1 Verfahren des Information Retrieval................................................................... 41<br />
2.2 Suchstrategien in Produktkatalogen................................................................... 41<br />
2.2.1 Aufbau der Anfrage ....................................................................................... 42<br />
2.2.2 Suchstrategie ................................................................................................. 44<br />
2.2.3 Notationen....................................................................................................... 44<br />
2.2.4 Vektorraum-Modell ........................................................................................ 45<br />
2.2.4.1 Indexterme.................................................................................................. 45<br />
2.2.4.2 Rankingfunktion ......................................................................................... 46<br />
2.2.5 Fuzzy-Retrieval .............................................................................................. 47<br />
2.2.5.1 Zugehörigkeitsfunktionen ......................................................................... 47<br />
2.2.5.2 Rankingfunktion ......................................................................................... 51<br />
2.3 Ergebnisse.............................................................................................................. 52<br />
3 Branchenspezifische Suchverfahren und Klassifikationssysteme............... 53<br />
4 Prototypische Implementierung der Handelsplattform..................................... 54<br />
4.1 Datenbestand......................................................................................................... 54<br />
4.2 Qualität des Datenbestandes .............................................................................. 55<br />
4.3 Technische Architektur der Handelsplattform................................................... 56<br />
4.4 Datenhaltung .......................................................................................................... 58<br />
4.5 Import/ Export-Schnittstelle.................................................................................. 58<br />
4.6 Web-Frontend ........................................................................................................ 60<br />
4.7 Fuzzy-Modul........................................................................................................... 62<br />
4.7.1 Indexprozessor............................................................................................... 62<br />
4.7.2 Queryprozessor ............................................................................................. 63<br />
4.7.3 Präprozessor .................................................................................................. 64<br />
4.7.4 Fuzzyprozessor.............................................................................................. 64<br />
4.7.5 Rankingprozessor.......................................................................................... 65<br />
4.8 Betreiber-Frontend ................................................................................................ 66
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
4.8.1 Navigation im Klassifikationssystem........................................................... 67<br />
4.8.2 Auswahlmenü „Module“................................................................................ 68<br />
4.8.3 Modularbeitsfläche ........................................................................................ 68<br />
4.8.4 Statusleiste ..................................................................................................... 68<br />
4.8.5 Menüleiste....................................................................................................... 68<br />
4.8.6 Menübar .......................................................................................................... 68<br />
4.8.7 Dataverifiermodul........................................................................................... 68<br />
4.8.8 Statistikmodul................................................................................................. 69<br />
4.8.9 Statistik-Export............................................................................................... 70<br />
5 Integration von Komponenten in den omeco ® webshop.................................. 72<br />
6 Voraussichtlicher Nutzen und Verwertbarkeit..................................................... 74<br />
7 Verwendete aktuelle Forschungsergebnisse ...................................................... 76<br />
8 Veröffentlichungen ..................................................................................................... 77<br />
8.1 Veröffentlichungen der Projektergebnisse......................................................... 77<br />
8.2 Studentische Arbeiten im Rahmen des Forschungsprojektes ....................... 77<br />
9 Ausblick auf zukünftige Forschungsvorhaben................................................... 79<br />
III LITERATURVERZEICHNIS .............................................................................. 80<br />
7
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
TABELLENVERZEICHNIS<br />
Tabelle 1: Merkmal „Zustand“ mit ausgewählten Attributen und Ausprägungen ........ 24<br />
Tabelle 2: Auszug aus einem Produktindex, ergänzt durch die ipf ............................... 46<br />
Tabelle 3: Suchergebnisse mit vektoriellem Ranking...................................................... 47<br />
Tabelle 4: Ranking-Ergebnisse mit Fuzzy-Retrieval........................................................ 52<br />
Tabelle 5: Beispiele von Merkmalen und Merkmalswerten einer Feindrehbank......... 54<br />
Tabelle 6: Merkmale mit den dazugehörenden Merkmalswerten.................................. 56<br />
Tabelle 7: Auszug aus der Tabelle der hinterlegten Datenformate für die Werte....... 69<br />
8
ABBILDUNGSVERZEICHNIS<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Abbildung 1: Tatsächlicher Projektverlauf ......................................................................... 15<br />
Abbildung 2: Beispiel eines hierarchischen Produktkataloges....................................... 22<br />
Abbildung 3: Allgemeine Strukturierung eines Produktkatalogdokumentes ................ 34<br />
Abbildung 4: Erweiterungen des BMEcat-Produktkatalogs ............................................ 36<br />
Abbildung 5: Schematische Darstellung der Datenstruktur ............................................ 40<br />
Abbildung 6: Beispielanfrage einer gebrauchten Maschine ........................................... 42<br />
Abbildung 7: XML-Schema für eine Produktanfrage ....................................................... 43<br />
Abbildung 8: XML-kodierte Anfrage nach einer Maschine (Auszug) ............................ 44<br />
Abbildung 9: Zugehörigkeitsfunktion des Merkmals „Preis“ ........................................... 49<br />
Abbildung 10: Ähnlichkeit bei Erfüllung des Anfragebereiches...................................... 49<br />
Abbildung 11: Ähnlichkeit bei Enthaltung des Produktes im Anfragebereich .............. 50<br />
Abbildung 12: Ähnlichkeit bei exakter Übereinstimmung................................................ 50<br />
Abbildung 13: Mehrschicht-Architektur des Prototyps..................................................... 57<br />
Abbildung 14: Komponentenansicht der 3-Schicht-Architektur...................................... 58<br />
Abbildung 15: Schematische Darstellung der Import- und Exportschnittstelle............ 59<br />
Abbildung 16: GUI des fertigen Import-Tools.................................................................... 60<br />
Abbildung 17: Benutzerschnittstelle „stöbern“-Funktion.................................................. 61<br />
Abbildung 18: Eingabemaske zu unscharfen Suche ....................................................... 62<br />
Abbildung 19: Arbeitsweise der Hauptkomponenten des Fuzzy-Moduls ..................... 63<br />
Abbildung 20: Von der XML-Datei des Frontends zur einer Rangliste der Produkte . 64<br />
Abbildung 21: Funktionszerlegung am Beispiel der geglätteten Trapez-Funktion...... 65<br />
Abbildung 22: Modul „Funktionen definieren und bearbeiten“ ....................................... 65<br />
Abbildung 23: Die vom Rankingprozessor sortierten Werte........................................... 66<br />
Abbildung 24: Die grafische Benutzerschnittstelle des Mainframes ............................. 67<br />
Abbildung 25: Anzeige der vom Statistikmodul ermittelten Werte................................. 70<br />
Abbildung 26: Grafische Visualisierung der exportierten Statistikdaten....................... 71<br />
Abbildung 27: Integration der Export-Schnittstelle in omeco ® webshop....................... 73<br />
9
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
I Projektplanung<br />
1 Einleitung<br />
Mit elektronischen Marktplätzen im Internet bietet sich vielen Händlern die Chance, ergän-<br />
zend zu den bestehenden traditionellen Absatzmarktstrukturen neue Märkte zu erschließen.<br />
Neben dem Ansprechen neuer Zielgruppen können bestehende Geschäftsbeziehungen intensi-<br />
viert, vereinfacht und damit die Kosten für Geschäftsprozesse sowohl auf Seiten des Händlers<br />
als auch des Kunden reduziert werden. Für den Handel mit gebrauchten Waren bieten Markt-<br />
plätze im Internet einen weltweit erreichbare Informations- und Kommunikationsplattform.<br />
Traditionelle Kommunikationsmittel sind hauptsächlich Zeitschriften, Messen oder Makler.<br />
Insbesondere für den Handel mit gebrauchten Industriemaschinen, mit einem Angebot von<br />
Werkzeugmaschinen bis zu vollständigen Fertigungsstraßen, haben sich einige Marktplätze<br />
im Internet schon etabliert (beispielsweise www.surplex.com [Surplex AG 2002],<br />
www.machinestock.com [Machinestock 2003]).<br />
10<br />
Sie unterstützen Unternehmen von der Beschaffung bis zur Verwertung von gebrauchten<br />
Industriemaschinen. Entscheidend für eine effektive Abwicklung betrieblicher Abläufe sind<br />
eine einheitliche inhaltliche Beschreibung und standardisierte Austauschformate für Produkt-<br />
daten [Otto, B. und Beckmann, H. 2001, PricewaterhouseCoopers 2002]. Die inhaltliche Be-<br />
schreibung von Investitionsgütern basiert dabei auf komplexen Klassifikationssystemen, die<br />
Klassifikationsgruppen und Merkmalsleisten festlegen. Für einen einfachen Datenaustausch<br />
zwischen Anbietern und Interessenten über den Marktplatz ist es notwendig, dass zum einen<br />
das Klassifikationssystem möglichst weit verbreitet und akzeptiert ist und zum anderen der<br />
Datenaustausch über ein standardisiertes Format erfolgen kann.<br />
Ziel des Projektes „Intelligente elektronische Handelsbörsen für Gebrauchtwaren im Inter-<br />
net“ waren die Analyse, die Entwicklung und die Erprobung von Komponenten für den Auf-<br />
bau elektronischer Handelsbörsen von Gebrauchtmaschinen und -teilen im Internet. Dabei<br />
reichten die einzelnen Arbeiten von der Definition geeigneter Klassifikationen unter Verwen-<br />
dung der Datenbeschreibungssprache XML (Extensible Markup Language) bis hin zur Ent-<br />
wicklung und Analyse von Algorithmen zur Suche nach passenden Angebots- und Nachfra-<br />
gepaaren auf der Grundlage heuristischer Korrelationsmaße.<br />
Die einzelnen Arbeitsziele werden im Folgenden genauer spezifiziert und beschrieben.<br />
1.1 Fachliche Spezifikation und Klassifikation von gebrauchten Maschinen<br />
Um den Handel mit gebrauchten Maschinen zu unterstützen, ist es notwendig, die Maschinen<br />
zu klassifizieren und in geeignete Katalogstrukturen einzuordnen. In einem ersten Schritt wa-<br />
ren typische Merkmale, die für die Entscheidungsfindung bei einem Kauf von Bedeutung<br />
sind, zu bestimmen und zu formalisieren. Dabei sollte es möglich sein, die beschreibenden
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Merkmale einer Maschine um Attribute zur Steuerung und Optimierung des Suchprozesses zu<br />
ergänzen. Die Zusammenfassung sämtlicher Merkmale führt zu einem Klassifikationssystem.<br />
Um die zukünftige Weiterentwicklung dieses Klassifikationssystems zu vereinfachen, wurden<br />
spezielle anwendungsspezifische Werkzeuge zur komfortablen Pflege unter Berücksichtigung<br />
der Suchalgorithmen erstellt.<br />
1.2 Matching Service für Angebot und Nachfrage<br />
Unter einem Matching Service wird in diesem Projekt die automatische Zuordnung von An-<br />
geboten und Nachfragen verstanden. Dabei muss berücksichtigt werden, dass Angebote meis-<br />
tens sehr detailliert, Nachfragen eher unscharf beschrieben sind. Um nun bestehende Angebo-<br />
te einer Anfrage oder umgekehrt zuzuordnen, müssen Korrelationsmaße für bestimmte<br />
Merkmale von gebrauchten Maschinen definiert werden.<br />
Ein einfaches Beispiel mag dies verdeutlichen: Sucht ein Kaufinteressent eine Maschine vom<br />
Typ A mit einer maximalen Betriebszeit von 24 Monaten, dann ist für ihn mit hoher Wahr-<br />
scheinlichkeit auch eine Maschine von diesem Typ mit einer Betriebszeit von 20 oder 25 Mo-<br />
naten interessant. Diese Unschärfe muss von den Korrelationsmaßen unter Einbeziehung von<br />
heuristischen Strategien berücksichtigt werden. Die Entwicklung und Evaluierung geeigneter<br />
Maße bilden somit einen Schwerpunkt, ebenso die Integration dieser Maße in generische<br />
Suchstrategien. Die Entwicklung sollte objekt- und komponentenorientiert erfolgen, so dass<br />
eine Anwendung der Maße und des Matching-Service auch in anderen Szenarien ohne großen<br />
technischen Aufwand möglich ist.<br />
1.3 Branchenspezifische Suchverfahren (Suchspider/-crawler)<br />
Neben der Möglichkeit, Angebote über eine Benutzerschnittstelle manuell einzugeben, sollten<br />
Verfahren (Suchspider) zum Auffinden von Angeboten zu gebrauchten Maschinen im Internet<br />
entwickelt werden. Diese Angebote können von anderen Marktplätzen oder von assoziierten<br />
Händlern stammen, die eine automatisierte Übernahme ihrer Angebote wünschen. Hierbei<br />
war zu untersuchen, wie die händlerspezifischen Klassifikationen der Maschinen in das unter<br />
1.1 entwickelte Klassifikationsschema abgebildet werden können. D. h. die gefundenen An-<br />
gebote müssen indexiert werden, um dem eigenen Matching–Service zur Verfügung zu ste-<br />
hen. Unterstützung können hier die Suchverfahren bieten. Ein außerhalb des Marktplatzes<br />
gefundenes Maschinenangebot kann über das Suchverfahren gemäß dem Klassifikationssys-<br />
tem einer der Produktgruppen zugeordnet werden. Die entwickelte Suchmaschine kann dann<br />
anhand der Merkmale zu diesen Maschinen die geeigneten Produktgruppen ermitteln.<br />
1.4 Prototypische Integration von Komponenten<br />
Das entwickelte Klassifikationssystem mit dem Matching-Service und den branchenspezifi-<br />
schen Suchstrategien sollte, wenn möglich, in eine bereits bestehende Handelsplattform integ-<br />
riert werden. Die u. U. erforderliche Anpassung und Erweiterung des zugrunde liegenden Da-<br />
tenmodells sollte dabei untersucht und bewertet werden. Begleitend sollten dabei auch be-<br />
11
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
triebswirtschaftliche Fragestellungen an ein Betreibermodell näher untersucht werden. Ausgangspunkt<br />
dazu bot der schon bestehende Marktplatz machinerytrade.net, der von omeco ®<br />
GmbH, dem industriellen Partner in diesem Projekt, zur Analyse und möglichen Integration<br />
zur Verfügung stand.<br />
2 Grundlagen und Ablauf des Vorhabens<br />
E-Commerce findet sowohl zwischen Anbieter und Konsument (Business-to-Consumer,<br />
B2C), vor allem aber zwischen Unternehmen (Business-to-Business, B2B) statt. Viele kleine-<br />
re und mittelständische Unternehmen haben erkannt, dass gerade für sie in diesem Bereich<br />
neue Geschäftschancen entstehen können. Das Interesse liegt neben der Erschließung neuer<br />
Märkte auch in der Reduzierung der Kosten durch Optimierung in Betrieb und Beschaffung.<br />
Prognosen von Forrester Research [Forrester Research 2002] sagen einen Umsatz von über<br />
1,7 Billionen Dollar im Jahr 2004 im Bereich B2B voraus. So erwarten auch in Europa 50%<br />
der befragten Firmen, die im Bereich B2B tätig sind, in den kommenden Jahren ein jährliches<br />
Wachstum von mindestens 5%.<br />
12<br />
Der Handel von Gebrauchtwaren, insbesondere im Bereich für gebrauchte Maschinen, bie-<br />
tet für die Zukunft weltweit ein großes Einsatzfeld. Bei der Analyse bestehender Marktplätze<br />
bzw. Handelsbörsen von gebrauchten Maschinen fiel die Vielzahl der unterschiedlichen Be-<br />
schreibungsformen der gebrauchten Maschinen auf. Es gab keine einheitliche Klassifizierung,<br />
eine standardisierte Klassifikation von gebrauchten Maschinen war nicht zu erkennen. Klassi-<br />
fikationssysteme, die mit ihren Merkmals-/ Wertepaaren die Produkte detailliert beschreiben,<br />
sind eine wesentliche Voraussetzung für die Entwicklung intelligenter Suchverfahren.<br />
Die im Vorfeld durchgeführte Evaluation der angebotenen Suchverfahren in den existie-<br />
renden elektronischen Handelsbörsen ergab, dass die meisten Marktplätze und Anbieter ledig-<br />
lich eine vereinfachte Suche entlang der Produktgruppenhierarchie anbieten oder sich auf we-<br />
nige, allgemeingültige Merkmale beschränken.<br />
Um jedoch eine unscharfe Suchanfrage möglichst automatisiert beantworten zu können,<br />
bedarf es Techniken, die in hohem Maße die Struktur des Klassifikationssystems und das<br />
durch die Produktmerkmale und -werte in den Produktkatalogen gegebene Anwendungswis-<br />
sen berücksichtigen. Dazu können semantische Ansätze mit Algorithmen und Konzepten des<br />
auf unstrukturierten Daten basierenden Information Retrieval kombiniert werden.<br />
Dieses Anwendungswissen entsprechend zu evaluieren, aufzuarbeiten und als Basis für die<br />
zu entwickelnden informationstechnischen Methoden zu verwenden war die Grundlage für<br />
die Durchführung dieses Projektes. Die Analyse und die Evaluierung umfasste folgende Be-<br />
reiche:<br />
• Beschreibung und Einteilung der Produkte (Klassifikationssystem),<br />
• Suchverfahren für eine unscharfe Produktsuche nach Vorgaben des Anwenders,
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
• Allgemeingültige Austauschformate, die unabhängig von der verwendeten Klassifikation<br />
und der Ablage der Daten für den Import und Export von Produktdaten verwendet werden<br />
können.<br />
Ein Marktplatz erfordert den Informationsaustausch mit vielen Partnern, der über geeignete<br />
Schnittstellen unterstützt werden muss. Die Schnittstellen sind sehr komplex und ihre Ent-<br />
wicklung entsprechend teuer. Eine solche Schnittstelle müsste idealerweise die verschiedenen<br />
Klassifikationssysteme (Semantik: inhaltliche Bedeutung) und die unterschiedlichen Aus-<br />
tauschformate (Syntax: äußere Struktur) verarbeiten können, um die datentechnische Kom-<br />
munikation zwischen den einzelnen Partnern des Marktplatzes zu ermöglichen. Für dieses<br />
Projekt ergab sich somit die Forderung nach einer anpassbaren generischen Schnittstelle, die<br />
diese Anforderungen realisiert.<br />
Mit der omeco ® GmbH stand ein kompetenter industrieller Partner zur Verfügung, der<br />
schon langjährige Erfahrungen mit der Abwicklung von Geschäftsprozessen im Internet auf-<br />
weist. Mit der Plattform www.machinerytrade.net stellte die omeco ® GmbH einen Marktplatz<br />
für gebrauchte Industriemaschinen und ihre bisherigen Erfahrungen zur Verfügung.<br />
2.1 Arbeitspakete<br />
Die Durchführung des Projektes gliederte sich in folgende Schwerpunkte:<br />
AP1: Fachliche Spezifikation und Klassifikation von gebrauchten Maschinen<br />
T1.1: Erfassung der Beschreibungsmerkmale für gebrauchte Maschinen<br />
T1.2: Entwicklung eines Klassifikationsschemas für gebrauchte Maschinen<br />
T1.3: Spezifikation der Werkzeuge zur Pflege der XML-Dokumente<br />
T1.4: Schnittstellen zu Standardsystemen<br />
T1.5: Implementierung der Werkzeuge zur Pflege der Klassifikation<br />
AP2: Matching-Service für Angebot und Nachfrage/Anfrage<br />
T2.1: Definition von Korrelationsmaßen<br />
T2.2: Empirische Evaluierung der verschiedenen Maße<br />
T2.3: Generische Suchverfahren unter Berücksichtigung der<br />
definierten Ähnlichkeitsmaße<br />
13
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
AP3. Branchenspezifische Suchverfahren (Suchspider / -crawler)<br />
T3.1: Verfahren zum Auffinden von Informationen über gebrauchte Maschinen<br />
14<br />
im Internet<br />
T3.2: Verfahren zur Abbildung von Maschineninformationen in Fremdformaten in das<br />
entwickelte Klassifikationsschema für gebrauchte Maschinen<br />
AP 4: Prototypische Integration von Komponenten in die<br />
bestehende Handelsplattform<br />
T4.1: Erweiterung und Anpassung des Datenmodells<br />
T4.2: Integration des Matching- und Suchverfahrens<br />
T4.3: Evaluierung / Erprobung der Handelsplattform<br />
T4.4: Entwicklung und Evaluierung von Betreibermodellen und Anwendungsfällen<br />
2.2 Projektverlauf<br />
Die Analyse und die Entwicklung eines Klassifikationssystems nahmen mehr Zeit in An-<br />
spruch als ursprünglich geplant. Der Umfang und die Anzahl der potenziell geeigneten Klas-<br />
sifikationssysteme der bestehenden Marktplätze, die zu betrachten waren, verursachten diesen<br />
Mehraufwand.<br />
Zum Arbeitspaket 3 besteht seit der CeBIT 2003 eine Zusammenarbeit mit dem Institut für<br />
Innovative Informatik-Anwendungen der Fachhochschule Trier. Im Projekt INFOX-1 werden<br />
dort Verfahren entwickelt, die es ermöglichen, relevante Informationen zu einem speziellen<br />
Thema automatisch aus dem WWW zu selektieren. Im Rahmen der Zusammenarbeit wird<br />
untersucht, wie diese Verfahren in unserem Anwendungsbereich verwendet werden können.<br />
Hierfür stellen wir Informationen bereit (siehe 5.1), die zum Suchen im Word-Wide Web<br />
(WWW) und zum Aufbau der dafür notwendigen Wissensbasis verwendet werden.<br />
Für die prototypische Integration von Komponenten in eine bestehende Handelsplattform<br />
(Arbeitspakte 4) stellte uns unser Partner omeco ® GmbH mit machinerytrade.net eine Han-<br />
delsplattform für gebrauchte Maschinen zur Verfügung. Nach intensiver Analyse dieser Platt-<br />
form stellte sich im Verlauf des Projektes heraus, dass eine Integration der entwickelten<br />
Komponenten in diese php-basierte Plattform nicht optimal durchführbar ist. Zudem fehlten<br />
gewisse Strukturen, wie z. B. das Einlesen und Auslesen von Produktkatalogen oder die Hal-<br />
tung der Daten der Maschinen in einfachen Datenstrukturen, so dass eine Integration eine<br />
weitgehende Neu- bzw. Umstrukturierung bedeuten würde. Deshalb wurde beschlossen, mit
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Hilfe der gewonnenen Erfahrungen eine eigene prototypische Plattform zu realisieren (mtra-<br />
de).<br />
Als Beispiel der Verwertbarkeit der in diesem Projekt entwickelten Komponenten wurde<br />
die Export-Schnittstelle in den webshop von omeco ® integriert.<br />
2.3 Klassifikationen<br />
Abbildung 1: Tatsächlicher Projektverlauf<br />
Als Grundlage für die Analyse bestehender Klassifikationssysteme wurden standardisierte<br />
elektronische und nicht in elektronischer Form vorliegende Klassifikationssysteme herange-<br />
zogen, die schon heute in verschiedenen Industriezweigen ihren Einsatz finden.<br />
• eClass: Standard für Materialklassifikation und Warengruppen [Institut der deutschen<br />
Wirtschaft Köln 2002]<br />
• ETIM: Klassifikationssystem des Elektro-Großhandels [ETIM 2002]<br />
• UNSPSC: United Nations Standard Products and Services Code System [UNSPSC 2002]<br />
• Klassifikation AWF 310 und AWF-Karten [AWF-Ausschuss für Wirtschaftliche Ferti-<br />
gung e.V. 1990]<br />
• DIN-Normen als Basis für die Analyse geeigneter Klassifikationen [DIN 8580 1974, DIN<br />
EN 61360-1 1996]<br />
• DIN-Normen zu Klassifikationssystemen und Merkmalen [DIN 1998, DIN 2002]<br />
15
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
2.4 Produktkataloge<br />
Bei der Vielzahl der existierenden Katalogsprachen haben wir uns im Projekt auf die Unter-<br />
suchung XML-basierter Katalogdokumente beschränkt, und zwar auf solche, die weltweit zu<br />
den am meisten verbreiteten Katalogformaten gehören. Dazu gehört der XML-basierte Pro-<br />
duktkatalogstandard BMEcat, der auf Initiative des Bundesverbandes Materialwirtschaft, Ein-<br />
kauf und Logistik e.V. (BME) in Zusammenarbeit des Fraunhofer Instituts für Arbeitswissen-<br />
schaft und Organisation (IAO) und der Universität Essen mit führenden deutschen Unterneh-<br />
men entwickelt wurde. BMEcat wird nach erfolgreicher Pilotphase von immer mehr Unter-<br />
nehmen in Deutschland eingesetzt und auch von den Unternehmen im Ausland immer stärker<br />
zur Kenntnis genommen.<br />
16<br />
Daneben wurde noch xCBL, das durch die Produkte von CommerceOne ([Commerce One<br />
2002]) weit verbreitet wurde, näher untersucht, da auch xCBL die Möglichkeit bietet, reine<br />
Produktkataloge zu definieren. Als wesentliche Quellen für Informationen zu standardisierten<br />
Produktkatalogen wären zu nennen:<br />
• Allgemeine Informationen zu Klassifikationssystemen und Produktkatalogen:<br />
www.katalogmanager.de [XLcontent GmbH 2003]<br />
• BMEcat ist der vom Bundesverband Materialwirtschaft, Einkauf und Logistik e.V. als<br />
XML-basierter Standard zum Austausch von multimedialen elektronischen Produkt- und<br />
Katalogdaten zwischen Lieferanten und beschaffenden Organisationen entwickelte Pro-<br />
duktkatalog [BME 2002]<br />
• XML Common Business Library (xCBL)-Produktkataloge [Commerce One 2002]<br />
• Commerce eXtensible Markup Language Version 1.1 (cXML), proprietäres Format<br />
[cXML 2002].<br />
2.5 Information Retrieval-Verfahren<br />
Verfahren des Information Retrieval haben mit der zunehmenden Nutzung des Internets stark<br />
an Bedeutung gewonnen. Ohne Suchmaschinen wie google, altavista, yahoo oder fireball lie-<br />
ße sich häufig die im Internet verstreute Information kaum finden. Dabei handelt es sich um<br />
Verfahren zum Text-Retrieval. Kennzeichen dieser Suchverfahren ist - neben dem gelieferten<br />
Ergebnis in Form von kompletten Dokumenten oder Textteilen - die weitgehend unstruktu-<br />
rierte Repräsentation der Dokumentbasis. Dieses Problem ändert sich, wenn der Suchraum<br />
nicht mehr das Internet, sondern eine (oder auch mehrere) bekannte Datenbank(en) umfasst.<br />
Die Suche hierin wird als Data Retrieval (oder auch Faktenretrieval) bezeichnet und bildet<br />
ebenso wie die Verfahren zum Text Retrieval die Grundlage der in diesem Projekt entwickel-<br />
ten Suchverfahren. Folgende Quellen wurden verwendet:<br />
• Grundlagen des Information Retrieval: [Ribeiro-Neto/Baeza-Yates 1999, Rijsbergen<br />
1979]
• Text-Retrieval: [Fuhr 2000].<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
• Fuzzy-Verfahren und erweiterte Retrieval-Methoden: [Salton et al. 1983, Ogawa et al.<br />
1991, Grauel 1995, Salton 1971, Salton/McGill 1983].<br />
3 Zusammenarbeit mit anderen Stellen<br />
Dieses Projekt wurde in Zusammenarbeit mit der Firma omeco ® GmbH durchgeführt. Die<br />
omeco ® GmbH beschäftigt sich mit ganzheitlichen e-Business-Lösungen für mittelständische<br />
Kunden. Die Dienstleistungen des Unternehmens erstrecken sich von der Planung der E-<br />
Commerce-Anwendungen bis hin zur technischen Umsetzung im Internet, Intranet oder Ex-<br />
tranet. Die Firmenadresse lautet:<br />
omeco ® GmbH<br />
Auf dem Immel 8<br />
D-67685 Weilerbach<br />
Für die Produktsuche im Internet – über die Durchmusterung eines datenbankbasierten Pro-<br />
duktdatenbestandes hinaus – wurde mit dem Institut für Innovative Informatik-Anwendungen<br />
der Fachhochschule Trier zusammengearbeitet.<br />
Institut für Innovative Informatik-Anwendungen<br />
Prof. Dr. K.-H. Bläsius<br />
Fachhochschule Trier<br />
Postfach 1826<br />
D-54208 Trier<br />
17
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
II Projektergebnisse<br />
Die Darstellung der in diesem Projekt erzielten Ergebnisse gliedert sich in die Darstellung der<br />
theoretischen und der praktischen Ergebnisse. Bei den theoretischen Ergebnissen wird auf<br />
folgende Unterpunkte näher eingegangen:<br />
1. Klassifikationssysteme und Katalogformate<br />
2. Such- und Klassifizierungsstrategien in elektronischen Produktkatalogen<br />
Bei den praktischen Ergebnissen werden die verschiedenen Tools und Softwarekomponenten,<br />
die zu einer ersten prototypischen Realisierung einer Handelbörse für gebrauchte Maschinen<br />
führten, vorgestellt.<br />
1 Klassifikationssysteme und Katalogformate<br />
1.1 Analyse bestehender Anbieter/ Handelsbörsen<br />
Ausgangspunkt für das Projekt war eine Analyse existierender Anbieter bzw. Handelsbörsen<br />
für gebrauchte Maschinen im Internet. Bei dieser Analyse wurden die Internet-Auftritte ver-<br />
schiedener Anbieter nach folgenden Kriterien untersucht:<br />
• Anbietertyp<br />
• Anzahl der Angebote<br />
• Klassifizierung der Angebote<br />
18<br />
- Verwendung einer standardisierten oder proprietären Klassifikation<br />
- Klassifizierung nach Materialien / Verarbeitungsverfahren oder anderen Kriterien<br />
- Existenz einer mehrstufigen Hierarchie<br />
- Verwendete Merkmale/Merkmalsausprägungen<br />
• Qualität des Datenbestandes<br />
- Anzahl der Merkmale<br />
- Pflegegrad der ausgefüllten Merkmale<br />
• Suchverfahren<br />
- Freie Suche<br />
- Hierarchie-abhängige Suche<br />
- Merkmalsbasierte Suche<br />
- Möglichkeit der Erfassung von Suchanzeigen<br />
• Darstellungsformat der Ergebnisse<br />
- Browserbasierte Listendarstellung<br />
- Exportdatei (in Standard-Katalogformate)
• Zustandsbeschreibung der Maschinen<br />
- Objektive Beschreibung durch Gutachter<br />
- Vergabe eines geprüften und anerkanntes Gütesiegels<br />
- Garantieangaben<br />
• Angaben zur Transaktionsabwicklung<br />
- Vermittlung zwischen Anbieter und Suchendem<br />
- Direkter Kontakt zum Anbieter<br />
- Kostenlose / provisionsbasierte Vermittlung<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Diese Kriterien wurden in einer Bewertungstabelle zusammengefasst, die für einen repräsen-<br />
tativen Querschnitt von Anbietern im Rahmen eines studentischen Projektes ausgefüllt wurde.<br />
Eine Auswahl der untersuchten Anbieter zeigt nachfolgende Liste:<br />
• www.teedoubleyou.de<br />
Auktionsplattform für gebrauchte Werkzeugmaschinen<br />
• www.gebraucht-maschinen-markt.de<br />
Handelsbörse<br />
• www.wohlgeschaft.de/Ravensburg/html/gebraucht.html<br />
Händler für landwirtschaftliche Maschinen<br />
• www.cpic.de<br />
Handelsbörse mit einer großen Auswahl an gebrauchten Maschinen aus dem Baubereich<br />
• www.maschinenboerse.de<br />
Handelsbörse für gebrauchte Maschinen aller Art mit einer großen Auswahl<br />
• www.surplex.com<br />
Auktionsplattform und Handelsbörse für gebrauchte Maschinen aller Art<br />
• www.stiens.de<br />
Händler für neue und gebrauchte Werkzeugmaschinen<br />
• www.tomatec.de<br />
Handelsbörse für gebrauchte Maschinen<br />
• www.machinestock.de<br />
Handelsbörse für gebrauchte Maschinen aller Art mit einer großen Auswahl<br />
• www.fleckenstein-machine-tools.de<br />
Händler für gebrauchte Werkzeugmaschinen<br />
• www.machinarytrade.net<br />
Handelsbörse für gebrauchte Maschinen aller Art<br />
19
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Bei dieser Untersuchung wurden die verschiedenen Anbieter auch im Hinblick auf die ver-<br />
wendeten Klassifikationssysteme und Katalogformate zur Übertragung von Produktinforma-<br />
tionen betrachtet.<br />
20<br />
Zusätzlich zu dieser Analyse der Internet-Auftritte von Anbietern gebrauchter Maschinen<br />
wurde ein Teil der Händler über ihre verwendeten internen Datenstrukturen und Klassifikati-<br />
onssysteme befragt, um zu prüfen, ob sich daraus ein Ansatzpunkt für eine gemeinsame Klas-<br />
sifizierung ergeben könnte.<br />
Wesentliche Ergebnisse dieser Untersuchung sind:<br />
• Die meisten Anbieter verwenden ihre eigene Klassifizierung, d. h. in der Regel war keine<br />
Übereinstimmung der Klassifikationssysteme der einzelnen Anbieter festzustellen.<br />
• Standardisierte Klassifizierungen, und damit die Möglichkeit bereits existierende Soft-<br />
waretools zur Katalogübertragung einsetzen zu können, finden in der Branche wenig An-<br />
wendung. Als Grund gaben einige Betreiber an, dass die Struktur von standardisierten<br />
Klassifikationen (wie z. B. eClass) für den internen Gebrauch nicht ausreiche, sondern<br />
firmenspezifisch erweitert werden müsste. Eine erweiterte Klassifikation zählt jedoch<br />
nicht mehr zum Standard und erfordert ggf. die Entwicklung eigener Software zur Verar-<br />
beitung und zum Datenaustausch.<br />
• Der Umfang der Beschreibung der einzelnen Maschinen war ebenfalls sehr unterschied-<br />
lich. Von der Minimalbeschreibung (Name und Hersteller der Maschine) bis hin zur aus-<br />
führlichen Detailbeschreibung der Maschine mit Bildern über den aktuellen Zustand der<br />
Maschine war alles vertreten.<br />
• Die Bezeichnung der Merkmale stimmt bei den Anbietern nur zu einem gewissen Grad<br />
überein. Gleiche Merkmale wurden bei den verschiedenen Händlern unterschiedlich be-<br />
nannt, zum Teil auch mit verschiedenen Maßeinheiten. So sind beispielsweise für das<br />
Merkmal Baujahr verschiedene Bezeichnungen und Schreibweisen wie Herstellungsjahr,<br />
Jahrgang und Baujahr zu finden. Bei einigen Anbietern unterschied sich die Beschreibung<br />
einzelner Maschinen sogar schon in der gleichen Produktgruppe.<br />
Ein Interessent kann einen direkten Vergleich der Maschinenangebote verschiedener Anbieter<br />
nur unter großem Aufwand betreiben:<br />
• Die gesuchte Maschine findet man aufgrund der verschiedenen Klassifizierungen nicht<br />
immer in der gleichen Produktgruppe.<br />
• Die unterschiedlichen Merkmalsbezeichnungen und Einheiten der verschiedenen Händler<br />
erschweren einen direkten Merkmalsvergleich einzelner Maschinen.
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
• Ein Datenaustausch zwischen den Händlern wird nicht nur wegen der unterschiedlichen<br />
Einteilung der Maschinen (Klassifikationssysteme), sondern auch durch die dahinter ste-<br />
henden, im Regelfall unterschiedlichen Datenstrukturen erschwert<br />
• Zur Zeit ist kein gemeinsamer Datenpool mit einheitlichen Produktkatalogen möglich, da<br />
es nicht möglich ist, die verschiedenen Klassifikationen und Produktdaten automatisiert in<br />
einem Marktplatz zu sammeln und darzustellen.<br />
Eine automatisierte bzw. parametrisierte Suche über verschiedene Angebote ist unter diesen<br />
Voraussetzungen nicht möglich.<br />
1.2 Anforderungen an Klassifikationssysteme und Produktkataloge<br />
1.2.1 Strukturelle Anforderungen<br />
1.2.1.1 Referenzhierarchie<br />
Ein Klassifikationssystem dient der Beschreibung von Produkten und Produktgruppen. Mit<br />
Hilfe der Klassifizierung werden die Gebrauchtwaren in hierarchische Produktgruppen<br />
(Klassen) eingeteilt, wobei jede Klasse eine für sich abgeschlossene Beschreibung der darin<br />
enthaltenen Produkte bildet. Somit können die Produkte eindeutig den Klassen zugeordnet<br />
werden. Die Klassifikation ordnet die einzelnen Produktgruppen in einer mehrstufigen<br />
Baumstruktur an, wobei jede hinzukommende Ebene einer Verfeinerung bzw. einer<br />
genaueren Beschreibung der vorherigen Ebene entspricht. Um die verschiedenen Ebenen und<br />
die dazugehörenden Produktgruppen eindeutig identifizieren zu können, werden den Gruppen<br />
im Regelfall Klassifizierungsnummern zugeordnet. Eine Nummerierung kann nach dem<br />
Prinzip der hierarchischen Strukturierung (Baumstruktur) erfolgen. Ein Beispiel für eine<br />
solche Nummerierung wird in Abschnitt 1.3.1 gegeben. Mit der Zuweisung eines international<br />
eindeutigen und hierarchisch strukturierten Nummerncodes erhält man eine eindeutige und<br />
einheitliche Klassifizierung.<br />
21
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
22<br />
Abbildung 2: Beispiel eines hierarchischen Produktkataloges<br />
1.2.1.2 Merkmale und Merkmalleisten<br />
Jeder Produktgruppe werden Merkmale zugeordnet, über welche die Eigenschaften der zuge-<br />
ordneten Produkte eindeutig beschrieben werden. Diese Zuordnung der Merkmale zu den<br />
einzelnen Produktgruppen soll auf allen Ebenen möglich sein. Durch Vererbung sind dann in<br />
der Sachmerkmalleiste einer Produktgruppe neben den direkt vorhandenen Merkmalen auch<br />
alle diejenigen der Vorgänger-Produktgruppen enthalten. Eine Sachmerkmalleiste enthält<br />
dann alle Merkmale dieser Produktgruppe und beschreibt damit ausdrücklich die Produkte<br />
(einzelne Maschinen), die dieser Gruppe eindeutig zugeordnet sind. Das Hinzufügen weiterer<br />
Merkmale zu einer Sachmerkmalleiste würde u. U. eine andere Produktart beschreiben.<br />
Jedes Merkmal wird durch seine Attribute eindeutig identifiziert und beschrieben. Eine<br />
Möglichkeit der Merkmalsdefinition und Auswahl möglicher Attribute wird im DIN Fachbe-<br />
richt 69 beschrieben, der sich eng an die ISO/DIN 13584-42 hält [DIN 1998, DIN EN 61360-<br />
1 1996]). Ebenso müssen für die Merkmale Wertebereiche definiert werden (numerische, dis-<br />
krete Werte, verschiedene Wertebereiche), die den Merkmalen entsprechend ihrer Definition<br />
zugeordnet werden.
1.2.2 Inhaltliche Anforderungen<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
An eine Klassifikation, die im Bereich E-Commerce eingesetzt wird, werden weit mehr An-<br />
forderungen gestellt als hier angegeben. Neben betriebswirtschaftlichen und technischen As-<br />
pekten stehen im Rahmen dieses Forschungsprojektes auch die inhaltlichen Anforderungen an<br />
das Klassifikationssystem auf der Agenda. So sind die inhaltlichen Anforderungen an das<br />
Klassifikationssystem abhängig von der Anwendungsdomäne. Es sollen nicht nur die ver-<br />
schiedenen, speziellen Abbildungssichten von den Produkten, sondern auch die verschiedenen<br />
Typen von Klassifikationen dargestellt werden können.<br />
Das Klassifikationssystem soll eine sinnvolle Gruppierung für gebrauchte Maschinen er-<br />
lauben. Die einzelnen Maschinen können gemäß der durch das Klassifikationssystem vorge-<br />
gebenen hierarchischen Struktur der entsprechenden Gruppe zugeordnet werden.<br />
Wesentliche Anforderungen sind:<br />
• Die Klassifizierung der einzelnen Maschinen soll nach Verfahrensart und verarbeiteten<br />
Materialien ermöglichen.<br />
• Die Merkmale und die Definition der dazugehörenden Werte sollen eine differenzierte<br />
Produktbeschreibung ermöglichen, d. h. für die gebrauchten Maschinen sollen nicht nur<br />
die technischen Einzelheiten, sondern auch Informationen über den aktuellen Zustand wie<br />
z. B. Einsatzort, Zubehör, Einsatzart, Reparaturen, bauliche Veränderungen der Maschi-<br />
nen, Sonderanfertigungen usw. abgelegt werden können.<br />
• Die Klassifizierung soll Suchalgorithmen die bestmöglichste Ausgangssituation zur opti-<br />
malen und schnellsten Suche bieten (z. B. Schlagworte, Hierarchie, Klassifikationsnum-<br />
mer).<br />
1.2.3 Zusammenfassung<br />
Zusammenfassend definieren wir aufgrund der bisherigen Ergebnisse Klassifikationssysteme<br />
und Produktkataloge. Diese Definitionen sind unabhängig von der konkreten Anwendungs-<br />
domäne.<br />
Definition 1: Produkt-Klassifikationssystem<br />
Ein Klassifikationssystem K ist ein Tupel (G, M, W) mit<br />
1. G ist die Menge aller im Klassifikationssystem vorhandenen Produktgruppen. Die einzel-<br />
nen Produktgruppen sind als Baum hierarchisch aufgebaut. Den Produktgruppenbaum be-<br />
zeichnet man als Referenzhierarchie.<br />
2. M ist die Menge der im System vorhandenen Merkmale. Die Merkmale werden den Pro-<br />
duktgruppen zugeordnet und bilden gemeinsam eine Sachmerkmalleiste der Produktgrup-<br />
pe. Eine Produktgruppe erbt alle Merkmale von Vorgänger-Produktgruppen innerhalb der<br />
Referenzhierarchie.<br />
23
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
3. Die Menge W enthält für jedes Merkmal m eine Menge Wm der möglichen<br />
24<br />
Merkmalswerte. Ein Merkmalswert kann semantisch einem Einzelwert, einem Bereich<br />
oder einer Aufzählung von Einzelwerten entsprechen.<br />
Diese Definition des Produkt-Klassifikationssystems dient als Grundlage für die Definition<br />
eines merkmalsbasierten Produktkataloges. Damit wird eine Basis für die Beschreibung der<br />
Produkte in einem Produktkatalog mit Merkmalen geschaffen, mittels der die Produkte ein-<br />
deutig den verschiedenen Produktgruppen zugeordnet werden können. Je genauer und detail-<br />
lierter die Merkmalsdefinitionen und die Zuordnung der Merkmale zu den einzelnen Produkt-<br />
gruppen und damit zu den Produkten erfolgt, desto gezielter können für den Suchvorgang in<br />
Produktkatalogen geeignete Strategien und Algorithmen ausgewählt werden. Die für diese<br />
Suchstrategien relevanten und wichtigen Informationen werden in den Merkmalsdefinitionen<br />
und deren Ausprägungen hinterlegt.<br />
Definition 2: Produktkatalog<br />
Ein Produktkatalog besteht aus einem Klassifikationssystem K und einer Menge P von Pro-<br />
dukten. Die Produkte sind den Produktgruppen des Klassifikationssystems zugeordnet. Sie<br />
werden über die Merkmale beschrieben, die dieser Produktgruppe zugeordnet sind. Für ein<br />
Produkt p bezeichnen wir den Merkmalswert für ein Merkmal m mit wm(p). Wird ein Produkt<br />
angefragt, bezeichnen wir den Merkmalswert in der Anfrage q mit wm(q).<br />
Die im Projekt entwickelten Such- und Klassifizierungsstrategien nutzen das Klassifikations-<br />
system und insbesondere die Produktmerkmale mit ihren Werten als indizierende Kennzei-<br />
chen eines Produktes. Hierfür ist es erforderlich, dass die Merkmale selbst eindeutig definiert<br />
werden. Die Grundlage bietet hierfür eine Beschreibung anhand von Attributen, wie sie bei-<br />
spielsweise [DIN 1998] vorsieht.<br />
Tabelle 1: Merkmal „Zustand“ mit ausgewählten Attributen und Ausprägungen<br />
In der Statistik wird einem Merkmal zusätzlich eine Skalierung (Nominalskala, Ordinalskala,<br />
Intervallskala und Verhältnisskala [Bleymüller et al. 1996]) zugeordnet. Als weiteren Sonder-
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
fall der Skalierung betrachten wir die Merkmale, die Auflistungen von Einzelwerten oder Be-<br />
reiche als Werte annehmen können, wobei die Einzelwerte bzw. die Bereichsgrenzen ordinal-,<br />
intervall- oder verhältnisskaliert sind. Das Merkmal "Drehzahlbereich" beispielsweise hat als<br />
Ausprägungen Bereiche, deren Grenzen Ausprägungen des Merkmales "Drehzahl" sind.<br />
Die Skalierung spielt bei der Realisierung von Suchstrategien eine wesentliche Rolle und<br />
muss als zusätzliches Attribut bei der Definition eines Merkmales berücksichtigt werden. Des<br />
Weiteren wird die Attributmenge eines Merkmals um das Attribut „Zugehörigkeitsfunktion“,<br />
das für das fuzzybasierte Produkt-Retrieval benötigt wird, ergänzt. Das Attribut legt den Typ<br />
der Funktion und ihre Glättungsfaktoren fest. Tabelle 1 zeigt auszugsweise die Definition<br />
eines Merkmals, das den Zustand einer Maschine beschreibt.<br />
1.3 Analyse einschlägiger Klassifikationssysteme<br />
Die Unzufriedenheit, die sich aus den Unzulänglichkeiten bestehender Klassifikationssysteme<br />
ergab, führte in den letzten Jahren zu verschiedenen Versuchen, einheitliche und standardi-<br />
sierte Klassifizierungen zu entwickeln, die im Idealfall sogar branchenübergreifend eingesetzt<br />
werden können. Unter standardisierten Klassifizierungen versteht man Klassifizierungen, die<br />
einen gewissen Verbreitungsgrad in der Industrie erreicht haben, bei denen mehrere Unter-<br />
nehmen, wissenschaftliche Einrichtungen und Verbände an der Neu- und Weiterentwicklung<br />
beteiligt sind und die möglichst von einer unabhängigen Organisation (kostenlos) zur Verfü-<br />
gung gestellt werden. Von einem solchen Standard verspricht man sich zum einen den verbes-<br />
serten Datenaustausch zwischen Geschäftspartnern, detailliertere Angebote für die Kunden<br />
und höhere Flexibilität der Händler durch schnellere Abwicklung aller Geschäftsprozesse.<br />
Zum anderen verspricht man sich technologische Vorteile durch die mögliche Verwendung<br />
von standardisierten und flexiblen Softwarekomponenten für den Datenaustausch. Eine kost-<br />
spielige Anpassung an verschiedene Datenformate entfällt. Insgesamt erhofft man sich da-<br />
durch eine erhebliche Reduzierung der Gesamtkosten. Klassifikationssysteme spielen somit<br />
eine zentrale Rolle bei der Entwicklung von Softwarekomponenten für elektronische Han-<br />
delsbörsen.<br />
Im folgenden werden zunächst elektronisch verfügbare Klassifikationssysteme analysiert.<br />
In Abschnitt 1.3.2 werden dann weitere Systeme betrachtet, die für E-Commerce noch nicht<br />
in elektronischer Form aufbereitet sind.<br />
1.3.1 Elektronisch verfügbare Klassifikationssysteme<br />
1.3.1.1 eClass 4.0<br />
eClass 4.0 ist ein hierarchisches Klassifikationssystem vom Institut der deutschen Wirtschaft<br />
Köln (IW Köln), das gleichzeitig die unabhängige Plattform stellt und als zentraler Ansprech-<br />
partner dient, im Internet unter www.eclass.de kostenlos zur Verfügung gestellt. Als ein hie-<br />
rarchisches System zur Klassifizierung von Produkten, Materialien, Waren und Dienstleistun-<br />
25
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
gen ist eClass gekennzeichnet durch einen vierstufigen, hierarchischen Klassifikationsschlüs-<br />
sel mit einem aus über 14.000 Begriffen bestehenden Schlagwortkatalog. Mittlerweile steht<br />
eClass in deutsch, englisch, spanisch und tschechisch zur Verfügung. Die Hierarchiestufen<br />
heißen Sachgebiet, Hauptgruppe, Gruppe und Untergruppe. Für jede Ebene stehen zwei Zif-<br />
fern zur Verfügung, so dass pro Ebene eine Einteilung bis zu 99 Klassen möglich ist. Auf der<br />
untersten Ebene werden die einzelnen Produkte und ihre Beschreibungen mit Hilfe von<br />
Merkmalen und ihren Ausprägungen beschrieben (siehe auch Kapitel 1.2.3). Dabei unter-<br />
scheidet eClass zwischen Sachmerkmalleisten und Basismerkmalleisten. Bei den Basismerk-<br />
malleisten handelt es sich um Merkmalleisten nicht vollständig definierter Produktgruppen,<br />
die nur eine minimale Beschreibung der Produkte mit den Basismerkmalen Hersteller, Pro-<br />
dukttyp, Produktname, Hersteller-Artikelnummer und EAN-Code umfassen. Sachmerkmal-<br />
leisten enthalten alle Merkmale einer vollständig definierten Produktgruppe. Um möglichst<br />
allgemeingültig in der Definition der Merkmale und ihrer Attribute zu sein, werden bei deren<br />
Definition die entsprechenden Vorschriften (z. B. ISO 13584, IEC 61360 u. a.) so weit wie<br />
möglich berücksichtigt.<br />
26<br />
IW Köln bietet Unternehmen, die an einer Erweiterung von eClass 4.0 interessiert sind, die<br />
(kostenpflichtige) Teilnahme an einem Lenkungsausschuss an, in dem solche Erweiterungen<br />
diskutiert, untersucht und beschlossen werden. Änderungswünsche sollen in diesem Gremium<br />
innerhalb kürzester Zeit geprüft und gegebenenfalls in einem nächsten Release umgesetzt<br />
werden. Aussagen über eine zeitliche Realisierung der Änderungswünsche bzw. Zusagen über<br />
die tatsächliche Aufnahme der Änderungsvorschläge werden jedoch nicht getroffen. So wer-<br />
den erst Mitbewerber der gleichen Branchen über den Nutzen und Qualität der beantragten<br />
Änderung befragt, die Antworten gesammelt und ausgewertet und dann eventuell eingearbei-<br />
tet.<br />
eClass war ursprünglich eine Klassifikation für den chemischen Bereich und wurde mit der<br />
Zeit auf andere Branchen erweitert und erhebt mittlerweile den Anspruch, eine branchenüber-<br />
greifende Klassifikation zu sein. Im folgenden Beispiel soll anhand des Sachgebiets 21<br />
"Werkzeug / Werkzeugmaschine" von eClass der Aufbau der Klassifizierung für Werkzeug-<br />
maschinen gezeigt werden.<br />
Für das Sachgebiet 21 Werkzeuge, Werkzeugmaschinen sind in Version 4.0 12 Haupt-<br />
gruppen vorgesehen:<br />
21 Werkzeug, Werkzeugmaschinen<br />
21-01 Werkzeug<br />
21-02 Werkzeughalter, Werkstückhalter<br />
21-03 Messwerkzeug<br />
21-04 Handwerkzeug<br />
21-05 Elektrowerkzeug<br />
21-06 Druckluftwerkzeug
21-07 Transportgerät<br />
21-08 Löttechnik, Schweißtechnik<br />
21-09 Werkzeugmaschine<br />
21-10 Betriebseinrichtung<br />
21-11 Hydraulikwerkzeug<br />
21-12 Vorrichtung<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Diese Einteilung ist von eClass als Standard fest vorgegeben und lässt sich nicht erweitern.<br />
Wie starr diese Struktur ist und wie wenig ausreichend sie den heutigen Stand der Technik<br />
beschreibt, sei am Beispiel der Bohrmaschinen gezeigt. eClass bietet für Bohrmaschinen fol-<br />
gende Produktgruppeneinteilung an:<br />
21 Werkzeug, Werkzeugmaschinen<br />
21-09 Werkzeugmaschinen<br />
21-09-01 Bohrmaschine (Ständer- Stand-)<br />
21-09-01-01 Bohrmaschine (Ständer- Stand-)<br />
Diese Gliederung von Bohrmaschinen wird der Vielfalt der heute existierenden Bohrmaschi-<br />
nen nicht mehr gerecht. Angefangen von Standbohrmaschinen über Tischbohrmaschinen,<br />
Tischbohrwerk, Wandradialbohrmaschinen, Feinbohrmaschinen oder Flanschenbohrmaschi-<br />
nen würden laut eClass-Klassifizierung alle Bohrmaschinen nur dieser einen Produktklasse<br />
zugeordnet werden. Aber auch die identische Bezeichnung der Produktklasse auf der dritten<br />
und vierten Stufe zeigt eine für eine Handelsbörse für (gebrauchte) Maschinen unzureichende<br />
Einteilung von Produktklassen.<br />
Ebenso wie die Einteilung in die verschiedenen Produktklassen ist in eClass die Festlegung<br />
der Merkmale und die Definition der Attribute, die ein Merkmal beschreiben, fest vorgege-<br />
ben. So fehlen Merkmale zur Beschreibung des tatsächlichen Zustandes von gebrauchten In-<br />
dustriegütern, wie in Abschnitt 1.2 aufgeführt.<br />
Zum Zeitpunkt unserer Analyse zu Beginn des Projektes (Ende 2001) war eClass 4.0 Ge-<br />
genstand unserer Untersuchung. Zum heutigen Zeitpunkt (Ende 2003) gilt eClass 5.0. Der<br />
entscheidende Unterschied zwischen diesen beiden Versionen liegt in der Strukturierung der<br />
Sachgebiete. Es erfolgte in mehreren Sachgebieten Umstrukturierungen, bzw. Verschiebun-<br />
gen, Neuaufteilungen und Zusammenführungen. Auch wurden verschiedene Bereiche inner-<br />
halb der Sachgebiete, teilweise auch Sachgebiet übergreifend verschoben, um klarere Struktu-<br />
ren und exaktere Zuordnungen treffen zu können. So wurde z. B. im Sachgebiet 21 "Werk-<br />
zeug" die Hauptgruppe 21-09 "Werkzeugmaschine" entfernt und deren Inhalte in zwei neue<br />
Sachgebieten integriert. So kam als Sachgebiet 17 "Maschine, Apparat" (f. besondere An-<br />
wendungsbereiche) und Sachgebiet 18 "Bergbau-, Hütten-, Walzwerk- und Gießereimaschi-<br />
nen/-einrichtungen" hinzu. Aber auch diese neue Strukturierung mit ihrer Untergruppierung<br />
bietet für die Handelsbörse nur eine unzureichend verwendbare Klassifikationsstruktur. Da<br />
Merkmale, Merkmalswerte und Merkmalsleisten erst ab Version 5.1 geändert werden sollen,<br />
27
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
bleiben auch hier Vorbehalte, eClass als allgemeingültiges Klassifikationssystem zu verwen-<br />
den, bestehen.<br />
1.3.1.2 United Nations Standard Products and Services Code System<br />
Der United Nations Standard Products and Services Code System (UNSPSC) entstand aus der<br />
Verschmelzung des United Nations Common Coding System (UNCCS) und des Dun & Brad-<br />
street’s Standard Product and Service Code (SPSC) und ist ein offener Codestandard.<br />
UNSPSC wird von der Electronic Commerce Code Management Association (ECCMA) un-<br />
terstützt.<br />
28<br />
Zur Nutzung von UNSPSC wird von der UNDP (United Nations Development Programm)<br />
eine Lizenz vergeben. Bisheriger Lizenznehmer war bis Februar 2001 die Electronic Com-<br />
merce Code Management Association (ECCMA). Seit Oktober 2001 ist offizieller Lizenz-<br />
nehmer Dun&Bradstreet, die mit UNDP den originären Code entwickelt hatte. Zur Zeit ver-<br />
treiben und entwickeln beide Organisationen UNSPSC weiter, wobei ECCMA mit der Wei-<br />
terentwicklung von UNSPSC und der Erweiterung um Merkmalleisten bemüht ist (Global<br />
Attribut Schema, Stand 10/2002).<br />
UNSPSC ist ein Zuordnungscode, d. h. ähnliche Produkte werden in Produktgruppen zu-<br />
sammengefasst; es handelt sich nicht um einen merkmalsbasierten Produktcode, der das Pro-<br />
dukt genauer spezifiziert.<br />
UNSPCS verwendet ein fünfstufiges, hierarchisches Kodierungssystem, welches aus fol-<br />
genden Ebenen besteht: 1. Segment, 2. Familie, 3. Kategorie, 4. Gebrauchsgut, 5. Geschäfts-<br />
funktion. In der Ebene Segment werden in den ersten beiden Stellen die logische Zusammen-<br />
fassung der Familien codiert. In der Ebene Familie wird durch die 3. und 4. Stelle eine allge-<br />
meingültige Gruppe zusammenhängender Gebrauchskategorien kodiert, die wiederum in der<br />
Ebene Kategorie mit der 5. und 6. Stelle des Codes in einzelne Gruppen aufgeteilt wird, wel-<br />
che einem allgemeinen Zweck oder Funktion zuordenbar sind. In der Ebene Gebrauchsgut (7.<br />
und 8. Stelle des Codes) werden Ersatzprodukte oder -dienstleistungen (substitutable products<br />
and services) zusammengefasst. Bei der letzten Ebene (9. und 10. Stelle des Codes), handelt<br />
es sich mit den Geschäftsfunktionen, welche die Leistungen des Herstellers des Produktes<br />
näher spezifizieren, um optionale Angaben.<br />
UNSPSC wird hauptsächlich in Amerika verwendet oder von Firmen, die international<br />
handeln. Da durch UNSPSC Produkte und Dienstleistungen nur klassifiziert, aber wegen feh-<br />
lender Attribute nicht beschrieben und identifiziert werden können, konnte sich UNSPSC als<br />
branchenübergreifende Klassifizierung in Europa nur schwer durchsetzen und ist in unserem<br />
Anwendungsfeld nur eingeschränkt nutzbar. UNSPSC wird hauptsächlich als Referenzhierar-<br />
chie verwendet.
1.3.1.3 Elektro-Technisches Informations-Modell (ETIM)<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
ETIM (Elektro-Technisches Informations-Modell) ist ein Klassifikationssystem für die über<br />
den Elektro-Großhandel vertriebenen Produkte, das auf den technischen Eigenschaften der<br />
gehandelten Produkte basiert. ETIM ist das Ergebnis des Vereins ETIM Deutschland e.V., der<br />
1999 von neun Elektro-Großhändlern und Einkaufsgemeinschaften gegründet wurde und von<br />
diesen kostenlos zur Verfügung gestellt und gepflegt wird. ETIM wird nur der Vollständigkeit<br />
halber erwähnt, da in der Literatur ETIM oft als Beispiel eines branchenübergreifenden elekt-<br />
ronischen Klassifikationssystems aufgeführt wird, obwohl es sich um ein branchenabhängiges<br />
Klassifikationssystem handelt.<br />
Bei ETIM handelt es sich um eine Artikelklassifikation, bei der alle Artikel in Artikelklas-<br />
sen eingeteilt werden, und zwar hierarchiefrei, herstellerunabhängig, eindeutig benannt und<br />
über Synonyme auffindbar. Durch diese flache Hierarchie können mögliche Anforderungen<br />
für Modelländerungen, die durch die Fachausschüsse empfohlen werden, schnell beschlossen<br />
und umgesetzt werden. Dabei wird besondere Aufmerksamkeit auf die Definition der Pro-<br />
duktmerkmale gelegt. Diese Produktmerkmale können zu so genannten Merkmalleisten zu-<br />
sammengefasst und Produktklassen (Artikelklassen) zugeordnet werden. Eine Merkmalleiste,<br />
die einer Artikelklasse zugeordnet wurde, beschreibt eindeutig die charakteristischen techni-<br />
schen Merkmale dieser Artikelklasse und somit aller Artikel, die nach dieser Artikelklasse<br />
klassifiziert werden.<br />
ETIM will keinen Artikel komplett beschreiben, sondern nur die wichtigsten technischen<br />
Merkmale, um diesen Artikel einfacher zu finden, d. h. es werden keine weiterführenden In-<br />
formationen wie beispielsweise Preisinformationen oder Marketingdaten gehalten. Es handelt<br />
sich daher nicht um eine Datenaustauschnorm, sondern um eine beschreibende Datenstruktur,<br />
die sich beim Datenaustausch auf bestehende bzw. zu erweiternde Normen stützt (z. B. EDI-<br />
FACT, BMEcat, etc.).<br />
1.3.2 Weitere Klassifikationssysteme<br />
Bei den folgenden Betrachtungen ist zu bedenken, dass es sich dabei nur um mögliche Ansät-<br />
ze für eine Klassifizierung handelt, für deren elektronische Realisierung gesonderte Überle-<br />
gungen mit entsprechenden Fachleuten (z. B. Maschinenbau-Ingenieuren zur Festlegung aller<br />
geeigneter und benötigter Merkmale) notwendig wäre.<br />
1.3.2.1 DIN 8580 Fertigungsverfahren<br />
Die DIN 8580 beschreibt die verschiedenen Fertigungsverfahren zur Herstellung von geomet-<br />
risch bestimmten festen Körpern. Geometrische feste Körper sind im Sinne der DIN 8580<br />
„Halbzeuge, Bestandteile von technischen Gebilden und diese selbst. Dazu zählen Maschinen,<br />
Fahrzeuge, Apparate, Werkzeuge und sonstige einteilige oder mehrteilige Nutz- und Zierge-<br />
genstände“ [DIN 8580 1974].<br />
29
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
30<br />
Eine Möglichkeit der Klassifizierung wäre hier nach der Einteilung der Formgebung denk-<br />
bar, mit den einzelnen Unterabschnitten als Untergruppen. So wären z. B. als Hauptgruppe<br />
„Urformen“ mit der Untergruppe „Urformen aus gas- oder dampfförmigen Zustand“, „Urfor-<br />
men aus flüssigem, breiigen oder pastenförmigen Zustand“, „Urformen aus ionisiertem Zu-<br />
stand“ und „Urformen aus festen (körnigen oder pulverigen) Zustand“ entstanden.<br />
Bei diesem Ansatz wäre noch genauer zu untersuchen, wie „allgemeingültig“ die Bezeich-<br />
nungen für die Ebenen und die einzelnen Klassen sind, die sich aus der Gliederung der DIN<br />
8580 ableiten würden. Die Benennung der Klassen darf nicht so fachspezifisch sein, dass nur<br />
noch Experten mit dieser speziellen Terminologie umgehen können und die Zuordnung ein-<br />
zelner Maschinen zu bestimmten Klassen spezielles Fachwissen voraussetzen. So wüsste nur<br />
ein Fachmann, dass er in der Hauptgruppe „Fügen“, in der Untergruppe „Fügen durch Um-<br />
formen“ eine Nietmaschine vermuten kann, einen Nichtfachmann/frau, die eine Honmaschine<br />
recherchieren soll, würde diese z. B. nicht unmittelbar in der Hauptgruppe „Trennen“, Unter-<br />
gruppe „Spanen mit geometrisch unbestimmten Abschneiden“ suchen.<br />
1.3.2.2 Klassifikation AWF 310<br />
Schon früh mit dem Einsatz von Maschinen und anderen Betriebsmitteln zur industriellen<br />
Fertigung wurde erkannt, dass die sorgfältige Planung und Steuerung der Prozessabläufe eine<br />
hohe Priorität haben, denn die Wirtschaftlichkeit einer Fertigung ist sehr stark von dem Nut-<br />
zungsgrad der einzusetzenden Betriebsmittel abhängig. Deshalb wurden in den 40er Jahren<br />
die AWF Betriebsmittelkarten entwickelt, um technologische, organisatorische und ökonomi-<br />
sche Kenndaten der im Einsatz befindlichen Betriebsmittel zu sammeln, systematisch aufzu-<br />
bereiten und zu ordnen, und um jederzeit einen Überblick über den Zustand, Einsatz und Ver-<br />
fügbarkeit der Betriebsmittel zu haben. Bis heute werden diese Karten ständig ergänzt, erwei-<br />
tert und neuen Aufgabenstellungen angepasst. Für die in der Praxis am häufigsten verwende-<br />
ten Werkzeugmaschinen für die Verfahren Drehen, Fräsen, Bohren und Schleifen, die ca.<br />
80% der gesamten Fertigungskapazität ausmachen, gibt es jeweils spezielle Betriebsmittelkar-<br />
ten, auf denen die für diese Werkzeugmaschinen relevanten Merkmale extra aufgelistet sind.<br />
Für weniger häufig verwendete Maschinen gibt es allgemeingültige Betriebsmittelkarten, die<br />
vom jeweiligen Besitzer oder Hersteller ausgefüllt werden müssen. Die AWF Betriebsmittel-<br />
karten sind für alle relevanten Betriebsmittel gleich aufgebaut und aufeinander abgestimmt<br />
und bilden somit ein Organisations- und Informationssystem von betriebs- und branchenüber-<br />
greifender Gültigkeit [AWF-Ausschuss für Wirtschaftliche Fertigung e.V. 1990].<br />
Der AWF (Ausschuss für Wirtschaft und Fertigung e.V. Köln) schaffte mit der Klassifika-<br />
tion AWF 310 einen Überbau, um eine integrative Anlagenzuordnung treffen zu können. Die<br />
Klassifikation AWF 310 besteht aus einer dreistufigen Hierarchie. Die erste Ebene, der Anla-<br />
genbereich, gibt als grober Oberbegriff das jeweilige Sachgebiet innerhalb der Sachanlagen-<br />
datei an. Die zweite Ebene, die Anlagengruppe, fasst die Betriebsmittel entsprechend ihrer<br />
Hauptverrichtung zusammen. In der dritten Ebene, der Anlagenart, erfolgt die genaue An-
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
grenzung der Betriebsmittel entsprechend ihrer Bauart. Der Klassifikationsschlüssel besteht<br />
für den Anlagebereich aus einem Kennbuchstaben, die Anlagegruppe wird mit zwei Kennzif-<br />
fern und die Anlageart wird mit drei Kennziffern beschrieben. So wird zum Beispiel eine<br />
Senkrechtdrehmaschine wie folgt verschlüsselt:<br />
A Spanabhebende Fertigungseinrichtung (Anlagebereich)<br />
01 Drehmaschinen (Anlagegruppe)<br />
004 Senkrechtdrehmaschine (Anlageart)<br />
Die Klassifikation AWF 310 enthält zur Zeit acht Bereiche (A-H), in die schwerpunktmäßig<br />
maschinelle Anlagen aufgenommen wurden:<br />
• Spanabhebende Fertigungsmaschinen<br />
• Fertigungsmaschinen der spanlosen Formgebung<br />
• Oberflächenbehandlungs- und Erwärmungsanlagen<br />
• Fördermittel<br />
• Energieversorgungs- und Entsorgungsanlagen<br />
• Mess-, Prüf- und Laborgeräte<br />
• Datenverarbeitungsgeräte<br />
• Anlagenzubehör<br />
Dieses Klassifikationssystem ist laut AWF jederzeit erweiterungsfähig und kann zusätzliche<br />
Betriebsmittel aufnehmen. Die AWF-Betriebsmittelkarten werden heute noch vom AWF,<br />
Arbeitskreis „Betriebsmittelkarten“ gepflegt.<br />
1.3.2.3 Klassifizierung auf Grundlage eines Merkmallexikons<br />
Mit Hilfe eines Merkmallexikons, wie es im DIN-Fachbericht 69 [DIN 1998] vorgestellt wird,<br />
könnten unter Beachtung der ISO 13584 und IEC 61360 ein branchenübergreifendes Merk-<br />
mallexikon und eine entsprechende Referenzhierarchie aufgebaut werden.<br />
Zu dieser Umsetzung des Merkmallexikons gibt es bisher jedoch nur theoretische Ansätze,<br />
deren praktische Realisierung in naher Zukunft fraglich ist. Wie in dem DIN-Fachbericht 69<br />
selbst vorgeschlagen, müsste erst eine noch zu benennende Institution die Merkmalsdefinition<br />
firmenübergreifend und international abstimmen. Die so freigegebenen Merkmale stünden<br />
dann der Referenzhierarchie zur Verfügung.<br />
Der große Vorteil dieser Vorgehensweise läge an der korrekten Anlehnung an die ver-<br />
schiedenen international anerkannten Normen, von der DIN 4000 bis hin zu der ISO 13584.<br />
Wenn nicht nur bei der Herstellung nach solchen DIN/ISO-Vorschriften korrekt vorgegangen<br />
würde, sondern auch bei deren Beschreibung, gäbe es keine Zweifel oder Kompromisse bei<br />
den Beschreibungen, da dies alles in den Normen schon definiert wurde. Allein die Umset-<br />
31
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
zung dieser Idee, wie z. B. die internationalen Absprachen einzelner Merkmalsdefinitionen,<br />
ist sehr arbeits-, kosten- und zeitintensiv. Somit liegt deren Realisierung nicht mehr im Zeit-<br />
rahmen dieses Projektes.<br />
1.3.3 Zusammenfassung<br />
Aufgrund unserer Betrachtungen der in 1.3.1 und 1.3.2 aufgeführten Klassifikationen kristal-<br />
lisierte sich heraus, dass keines der untersuchten Klassifikationssysteme in ihrer ursprüngli-<br />
chen Definition den betriebswirtschaftlichen und technischen Anforderungen für eine Han-<br />
delsbörse von Gebrauchtwaren vollständig gerecht wird.<br />
• eClass erlaubt mit seiner inhaltlichen Ausprägung keine ausreichende Klassifizierung der<br />
32<br />
gebrauchten Maschinen. Es kann weder eine Klassifizierung nach der Verarbeitungsart<br />
der Maschinen noch nach dem zu verarbeitenden Material getroffen werden, wie es z. B.<br />
bei den DIN Normen gefordert wird. Außerdem fehlen Merkmale und Merkmalsausprä-<br />
gungen, die für gebrauchte Maschinen zutreffen. Eine benutzerspezifische Erweiterung<br />
der Merkmale und ihrer Attribute ist in eClass derzeit nicht möglich. Eigene Erweiterun-<br />
gen im Klassifikationssystem bzw. in den Merkmalen und deren Ausprägungen weichen<br />
vom Standard ab und können zu Konflikten mit den zur Verfügung stehenden Software-<br />
tools führen, die eClass als Klassifikationssystem verarbeiten können. Die Analyse beste-<br />
hender Marktplätze zeigte zudem, dass die Feingliederung für eClass den Marktführern<br />
nicht ausreichte und zu internen Erweiterungen des eClass-Standards führten.<br />
• Bei UNSPSC bleibt abzuwarten, in wie weit sich dieser Standard - besonders im Hinblick<br />
auf Erweiterung um Merkmale - in den kommenden Jahren in Europa durchsetzt. Auf-<br />
grund der fehlenden Merkmalsdefinitionen eignet sich UNSPSC zwar als Referenzhierar-<br />
chie, aber weniger zur merkmalsbasierten Beschreibung komplexer Güter.<br />
• ETIM ist als eine Klassifizierung der elektrotechnischen Branche schon von der Ausle-<br />
gung der Merkmale auf diese Branche festgelegt und hier nur der Vollständigkeit halber<br />
erwähnt. Es eignet sich nicht, Maschinen, weder neue noch gebrauchte, zu beschreiben<br />
und zu erfassen. Auch die flache, zweistufige Hierarchie (Einteilung in Klassen und<br />
Gruppen) eignet sich kaum für unsere Anwendung. Als eine speziell für den Elektrohan-<br />
del entwickelte Klassifizierung sind die entsprechenden verantwortlichen Gremien auch<br />
nicht daran interessiert, ETIM branchenübergreifend zu erweitern.<br />
• Alternative branchenspezifische Klassifizierungen, wie in Punkt 1.3.2 vorgestellt, würden<br />
sich u. U. zu einer Erweiterung anbieten. Da es sich jeweils um Klassifikationssysteme für<br />
spezielle Bereiche handelt, ist eine übergreifende Standardisierung sehr aufwendig.<br />
Ergebnis der Analyse vorhandener Klassifikationssysteme und der in Abschnitt 1.1 beschrie-<br />
benen Evaluation elektronischer Handelsplattformen ist, dass von den Betreibern verschiede-<br />
ner Plattformen keine einheitlichen Klassifikationssysteme verwendet werden bzw. vorhan-
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
dene nicht ausreichen. Für den Einsatz in unserem Forschungsprojekt würde dies bedeuten,<br />
dass jedes der betrachteten Klassifikationssysteme entweder strukturell oder inhaltlich erwei-<br />
tert werden müsste, was aber zu einer Abweichung vom Standard führt. Das hätte zur Folge,<br />
dass existierende, standardisierte Tools nicht eingesetzt werden könnten.<br />
Für die Realisierung und zum Testen der Handelsbörse für gebrauchte Maschinen ent-<br />
schieden wir uns daher aufgrund der genannten Probleme, eine Klassifizierung zu verwenden,<br />
die strukturell an eClass angelehnt ist, aber inhaltliche Erweiterungen zur Beschreibung ge-<br />
brauchter Güter enthält.<br />
Um die vielen in der Praxis verwendeten Klassifikationssysteme zu unterstützen, wurde im<br />
Rahmen des Projekts eine generische Schnittstelle entwickelt. Die generische Schnittstelle<br />
soll die verschiedenen Klassifikationssysteme verarbeiten und mit Erweiterungen für die Be-<br />
schreibung gebrauchter Güter umgehen können (zur Umsetzung siehe Abschnitt 4.5).<br />
1.4 Betrachtung verschiedener XML-Austauschformate für Produktkataloge<br />
1.4.1 Allgemeine Anforderungen<br />
Eine zentrale technische Anforderung im E-Commerce ist der einfache Austausch von Pro-<br />
dukt- und Geschäftsdaten zwischen den Geschäftspartnern. Zum Austausch von Produktdaten<br />
in elektronischer Form existiert eine Vielzahl verschiedener Katalogformate, die auf unter-<br />
schiedlichen Datenstrukturen beruhen. Auch hier wird seit einigen Jahren versucht, einen<br />
Standard einzuführen, der nicht nur den Austausch von Produktkatalogen erleichtert, sondern<br />
auch weiterführende Geschäftsprozesse unterstützt.<br />
Dabei kristallisiert sich für die Beschreibung elektronischer Produkt- und Dienstleistungs-<br />
kataloge die Sprache XML (eXtensible Markup Language) als wichtiges Basisformat heraus.<br />
Die Vorteile von XML sind u. a., dass man firmen– und systemunabhängig flexible Doku-<br />
mente erstellen und verwalten kann und der Inhalt von der Darstellung des Dokumentes ge-<br />
trennt wird. Diese Vorteile ließen XML als ein vom Ausgabemedium unabhängiges Format<br />
bekannt werden.<br />
Für unsere Handelsbörse benötigen wir ein Produktdatenaustauschformat, mit dem wir<br />
nicht nur das Klassifizierungssystem unserer Handelsbörse übertragen können, sondern auch<br />
die Beschreibung und Einordnung von Produkten (siehe Definition 2). Auch dafür bietet<br />
XML mit der Trennung von Inhalt und Darstellung den besten Ausgangspunkt. Mittels der<br />
Dokumentdefinition DTD (Dokument Text Definition) oder dem XML-Schema werden die<br />
Inhaltsstrukturen der zu übertragenden Dokumente festgelegt und beschrieben bzw. bietet<br />
sich die Möglichkeit, eigene komplexe Datentypen (mit Element- und Attributzuweisung) zu<br />
definieren.<br />
Mit einem solchen einheitlichen Datenformat ist die Basis für eine Kostenreduzierung im<br />
Beschaffungsprozess gegeben: Einheitliche Kataloge sorgen u. a. für Aufwandsreduzierung,<br />
33
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Prozessbeschleunigung, automatische Bestellbearbeitung und exakte Auswertungsmöglich-<br />
keiten. So können Angebote leichter ausgetauscht und verglichen werden, es entstehen nur<br />
geringe Kosten bei der Pflege der Produktdaten und Kataloge, neue Kataloge können schnell<br />
implementiert werden, weitere standardkonforme Kataloge können problemlos in die Systeme<br />
eingespielt werden. Eine einfache Migration zu anderen Online-Beschaffungssystemen kann<br />
erreicht werden. Eine breite Akzeptanz führt zu einer engen Verbindung zwischen Händler<br />
und Interessenten sowie Händler und Handelsbörse. Allerdings gibt es auch hier – wie bei den<br />
Klassifikationssystemen – keinen einzelnen Standard, sondern verschiedene Formate bemü-<br />
hen sich um Verbreitung. Im Rahmen des Projektes waren folgende Anforderungen an das<br />
Austauschformat wesentlich:<br />
• Mit den Produktdaten der gebrauchten Maschinen sollen auch die verschiedenen Anbieter<br />
34<br />
dieser Maschinen als Lieferant übertragen werden können, d. h. der Katalog soll Multilie-<br />
ferantenfähigkeit unterstützen.<br />
• Durch die Festlegung einer eigenen Klassifikation für gebrauchte Maschinen soll diese<br />
Klassifikation unter Berücksichtigung der in Kapitel 1.2 aufgestellten Anforderungen mit<br />
übertragen werden können, d. h. von der Definition der einzelnen Merkmale bis hin zur<br />
Referenzhierarchie der einzelnen Produktgruppen.<br />
Abbildung 3: Allgemeine Strukturierung eines Produktkatalogdokumentes<br />
Im Folgenden Abschnitt werden nun einschlägige Katalogformate analysiert.
1.4.2 Analyse einschlägiger Produktkatalogformate<br />
1.4.2.1 BMEcat<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
BMEcat [BME 2002] entstand auf Initiative des Bundesverbandes Materialwirtschaft, Ein-<br />
kauf und Logistik e.V. (BME) in Zusammenarbeit des Fraunhofer Instituts für Arbeitswissen-<br />
schaft und Organisation mit führenden deutschen Unternehmen wie Audi, Bayer, BMW,<br />
DaimlerChrysler und Deutschen Telekom. BMEcat ist ein XML-basierter Standard zum Aus-<br />
tausch von multimedialen elektronischen Produkt- und Katalogdaten zwischen Lieferanten<br />
und beschaffenden Organisationen.<br />
• Die Produktdaten sind in mehrere Bereiche strukturiert, z. B. Grunddaten, Verpackungs-<br />
daten, Preisdaten, multimediale Zusatzdaten, Artikel-Strukturdaten und Katalog-<br />
Strukturdaten.<br />
• Es gibt Empfehlungen für standardisierte Produktklassifikationen (Katalogstrukturen) und<br />
Definition von Muss- und Kann-Feldern, Datentypen, Feldlängen und Zusatzregeln (zu-<br />
sätzliche anwenderspezifische Felder sind möglich).<br />
• Verschiedene Katalogtransaktionen (Einstellen neuer Produktkataloge, Aktualisierung<br />
einzelner Produktdaten, Aktualisierung von Preisen) können definiert werden.<br />
• Die separate Übertragung von Kerndaten und multimedialen Zusatzdaten ist möglich über<br />
Internet oder Offline-Medien wie CD-ROM, Diskette, DAT etc.<br />
• Der Standard kann einfach erweitert werden zur Erfüllung zukünftiger Anforderungen.<br />
Da mit BMEcat jedoch nur Produktdaten (Produktkataloge und Klassifikationen) übertragen<br />
werden können, entstand in einer Initiative der Fraunhofer IAO unter Beteiligung führender<br />
nationaler und internationaler Unternehmen ein Transaktionsansatz mit Namen openTRANS<br />
[openTRANS-Expertenkreis 2002]. openTRANS soll aufbauend auf dem Standard BMEcat<br />
der Standard für den Austausch von Geschäftsprozessdaten werden, d. h. standardisierte Ge-<br />
schäftsdokumente wie Auftrag, Rechnung, Lieferschein können zwischen den Geschäftspart-<br />
nern und elektronischen Handelsbörsen ausgetauscht werden und sind kompatibel zu BME-<br />
cat, d. h. es werden die identischen Felder und Strukturen mit identischen Bedeutungen und<br />
Regeln verwendet.<br />
BMEcat 1.2 sieht die Übertragung der standardisierten Klassifikationen eClass und<br />
UNSPSC und die Übertragung eigener Klassifikationen vor. Dabei ist die Möglichkeit gege-<br />
ben, eine eigene Klassifikationshierarchie zubilden, eigene Merkmale festzulegen und sie den<br />
einzelnen Klassifikationsgruppen zuzuweisen. Allerdings kann man bei der Definition eigener<br />
Merkmale nur die Attribute verwenden, die von BMEcat für die Beschreibung von Merkma-<br />
len festgelegt sind. Bei der Definition eines Merkmales sieht BMEcat die Attribute FNAME,<br />
VARIANTS oder FVALUE, FUNIT, FORDER, FDESCR UND FVALUE_DETAILS vor.<br />
Die Definition eigener Attribute, die zur Beschreibung erweiterter Merkmalseigenschaften<br />
35
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
notwendig wären, um wie in dem Beispiel des Merkmales „Zustand“ (vgl. Tabelle 1) den<br />
Wertebereich und die Wertekodierung abzubilden, sind nicht vorgesehen. FVALUE_ DE-<br />
TAILS dient nur zur näheren Detaillierung des konkreten Merkmalwertes, aber nicht zur<br />
Wertkodierung eines Merkmales. Ein weiterer Nachteil bei der Erstellung von Produktkatalo-<br />
gen liegt in der Annahme, dass der Erzeuger des Kataloges identisch mit dem Verkäufer ist, d.<br />
h. die Multilieferantenfähigkeit, wie wir sie für die Handelsbörse benötigen, ist in BMEcat<br />
nur mit Erweiterungen darstellbar.<br />
36<br />
Der BMEcat Standard sieht zusätzliche benutzerdefinierte Erweiterungen<br />
(USER_DEFINED_EXTENTIONS) der DTD vor. Mittels dieser Erweiterungen (kurz UDX)<br />
besteht die Möglichkeit Strukturen zu definieren, in denen vom Standard nicht vorgesehene<br />
Daten abgelegt werden können. Im Katalogdokument kann man UDX in HEADER, ARTIC-<br />
LE und CATALOG_STRUCTURE einsetzen. Im HEADER haben wir die Möglichkeit unter<br />
Verwendung von UDX eigene Merkmale mit zusätzlichen Attributen zu definieren und die<br />
Multilieferantenfähigkeit zu modellieren (siehe auch Abbildung 5). In CATA-<br />
LOG_STRUCTURE können mit Hilfe von UDX eigene Klassifikationsstrukturen modelliert<br />
und somit mit den Produktdaten übertragen werden. In ARTICLE kann mit UDX auf die ent-<br />
sprechend vorgenommenen Erweiterungen im HEADER und CATALOG_STRUCTURE<br />
verwiesen werden.<br />
Abbildung 4: Erweiterungen des BMEcat-Produktkatalogs
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Der Einsatz von UDX bedeutet allerdings, dass spezielle Software-Tools für das Erzeugen<br />
und Einlesen von Produktkatalogen notwendig sind, die diese benutzerdefinierten Erweite-<br />
rungen interpretieren können.<br />
Mit dem nächsten Release BMEcat 2.0 sollen beide Linien, BMEcat (Produktkatalog) und<br />
openTRANS (Abbildung aller Geschäftprozesse) gemeinsam vertrieben werden. Für BMEcat<br />
bedeutet das nächste Release eine Erweiterung der Funktionalität um die Kritikpunkte, die wir<br />
zum Teil in diesem Abschnitt aufgeführt haben. BMEcat 2.0 wird als Produktkatalog dann<br />
sowohl mehrsprachige als auch Multi-Lieferanten-Kataloge unterstützen. Die weiteren Erwei-<br />
terungen betreffen das Produktmodell (zur Darstellung komplexerer Produkte, Beschreibung<br />
von Dienstleistungen), die Produktbeschreibung um logistische Informationen und die Unter-<br />
stützung externer Kataloganwendungen.<br />
1.4.2.2 XML Common Business Library 3.5 (xCBL)<br />
XML Common Business Library 3.5 [Commerce One 2002] wurde von Commerce One in<br />
Kooperation mit Firmen wie Andersen Consulting, PriceWaterhouseCoopers, Compaq, Mi-<br />
crosoft und Oracle entwickelt. xCBL ist kein einzelner Standard, sondern eine Sammlung von<br />
gemeinsamen Business-Elementen, die dem Austausch von Geschäftsdokumenten dienen. Mit<br />
xCBL können strukturierte Geschäftsdaten, wie z. B. Produktdaten, Bestellaufträge und<br />
Rechnungen ausgetauscht werden, die auch über klassische EDI-Anwendungen (Electronic<br />
Data Interchange) ausgetauscht werden können. Es wird streng zwischen dem Inhalt des Do-<br />
kumentes und der Transaktionslogik zwischen den Teilnehmern der Geschäftstransaktionen<br />
getrennt. Es erfolgt aber keine Spezifikation des Protokolls, wie die Transaktion zu erfolgen<br />
hat. Vielmehr stellt xCBL für die verschiedenen Geschäftstransaktionen einen definierten<br />
Dokumentenrahmen bereit, der je nach Erfordernissen durch Standardelemente, so genannte<br />
XML Building Blocks, ergänzt werden kann. Damit kann man eigene Geschäftsnachrichten<br />
definieren. Jedoch fehlen dem Produktkatalog von xCBL die umfangreichen Funktionalitäten<br />
wie bei BMEcat. xCBL nutzt die Vorteile von DTDs und steht in zwei verschiedenen Sche-<br />
ma-Sprachen zur Verfügung, nämlich SOX (Commerce One Schema for Object-Oriented<br />
XML) und XDR (Microsoft XML Data Reduced).<br />
Im ProductCatalog sieht xCBL standardmäßig vor, mehrere Verkäufer im Header an-<br />
zugeben. Mit ListOfPartners kann man die verschiedenen Partner, die an der Börse betei-<br />
ligt sind, aufführen. Über Manufacturer in Product kann man die Zuordnung zwischen den<br />
Partner und den Artikeln treffen, was für die Modellierung der Multilieferantenfähigkeit not-<br />
wendig ist.<br />
In xCBL kann man in CatalogSchema unter SchemaCategory die eigene Klassifizierung<br />
definieren, nach der die Produktdaten strukturiert übertragen werden sollen. Dabei werden in<br />
CategoryAttribute die benutzerdefinierten Merkmale unter Verwendung der von xCBL<br />
vorgegeben Attributen definiert. Leider beschränkt xCBL die Definition der eigenen Merkma-<br />
37
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
le durch die Vorgabe der zu verwendenden Attribute ein. Es können nur folgende Attribute<br />
eingesetzt werden: die Attribut-ID (AttributID), der Attributname (AttributName), der Typ<br />
(AttributeType), die Einheit (DefaultUOM) und ob das Merkmal verlangt wird<br />
(IsRequested). Zur Verwendung der Merkmale kann man in Product über<br />
ObjectAttribute auf diese Merkmale referenzieren und Werte zuweisen. Damit zeigt auch<br />
das Katalogformat xCBL 3.5 die Schwäche, Merkmale und Klassifizierungen nur unzurei-<br />
chend abbilden zu können.<br />
1.4.2.3 commerce eXtensible Markup Language Version 1.1 (cXML)<br />
commerce eXtensible Markup Language Version 1.1 [cXML 2002] ist ein proprietäres XML-<br />
Format und wurde von dem Softwarehersteller Ariba in Kooperation mit über 50 Firmen ent-<br />
wickelt (z. B. AMD, Cisco Systems, HP). cXML wird auf den Marktplätzen und Beschaf-<br />
fungssystemen eingesetzt, die von Ariba zur Verfügung gestellt werden. Spezifiziert durch<br />
Standard DTDs können 12 Handelstransaktionen wie z. B. Order (Bestellung) oder Catalog<br />
(Produktkatalog) ausgeführt werden. Mit cXML können so Daten aus elektronischen Pro-<br />
duktkatalogen über das Internet abgefragt, ausgetauscht und aktualisiert werden. Darüber hin-<br />
aus können auch Bestellvorgänge unterstützt werden. Durch die feste Vorgabe der DTD (Do-<br />
cument Type Definition), das heißt durch die Definition, wie ein XML-Dokument auszusehen<br />
hat, ist cXML relativ einfach zu handhaben. Durch die Beschränkung auf den Beschaffungs-<br />
markt bleibt abzuwarten, ob sich cXML so durchsetzt, da der Beschaffungsprozess nur einen<br />
kleinen Teilbereich des unternehmerischen Handels darstellt.<br />
38<br />
Eine cXML-Nachricht besteht immer aus einem Header, in der die Adresse und die Infor-<br />
mationen zur Authentifizierung stehen, und dem Request-Response-Body, in dem die Infor-<br />
mationen über die auszutauschenden Daten stehen. Beide Bestandteile werden in einem<br />
„cXML Envelope“ verschickt.<br />
1.4.3 Bewertung<br />
Bei den hier vorgestellten Produktkatalogformaten handelt es sich um XML-basierte<br />
Dokumenttypen, die heute in E-Commerce ihren Einsatz finden. Es ist nicht abzusehen,<br />
welches dieser Formate sich als das bevorzugte Austauschformat entwickeln wird. Aber<br />
Katalogformate, die nicht auf XML basieren, dürften es schwer haben sich in Zukunft<br />
durchzusetzen. Denn durch die Hersteller- und Plattformunabhängigkeit stellt XML eine<br />
zukunftssichere Technologie dar, zumal es zunehmend von vielen großen Unternehmen<br />
unterstützt wird. Es können nicht nur die Katalogformate, sondern auch alle<br />
Geschäftstransaktionen in entsprechenden XML-Formate dargestellt werden.<br />
BMEcat sieht die Übertragung von standardisierten Klassifikationssystemen vor und unter-<br />
stützt sogar die Übertragung benutzerdefinierter Klassifikationssysteme, die in der DTD ge-<br />
mäß der USER_DEFINED_EXTENSIONS definiert werden können ( siehe1.4.2.1).
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
XCBL und cXML eignen sich durch die eingeschränkten Möglichkeiten, eigene Klassifi-<br />
kationssysteme zu übertragen nur sehr bedingt zur Übertragung komplexer Beschreibungen<br />
von Gütern.<br />
Da es aber nicht absehbar ist, welche Standards sich in Zukunft durchsetzen, haben wir uns<br />
bei der Realisierung der Schnittstelle für den Import und Export von Daten der Handelsbörse<br />
entschieden, uns nicht auf ein bestimmtes Format festzulegen, sondern die Schnittstelle ent-<br />
sprechend der für Klassifikationssysteme generisch zu gestalten. Entsprechend wurde eine<br />
allgemeine Datenstruktur entwickelt.<br />
1.5 Datenstruktur eines generischen Klassifikationssystems<br />
Im Rahmen des Projektes wurde neben diesen allgemeinen Anforderungen an ein Klassifika-<br />
tionssystem bei der technischen Realisierung der Handelsbörse eine Datenstruktur entwickelt,<br />
die - unabhängig von verwendeter Klassifizierung und eingesetztem Produktkatalog - geeig-<br />
net ist, die Beschreibung von gebrauchten Maschinen mit den dafür notwendigen Merkmalen<br />
abzubilden. Dazu gehören nicht nur die Merkmale, welche die technischen Details der Ma-<br />
schinen beschreiben, sondern auch Merkmale, die für die Beurteilung von gebrauchten Ma-<br />
schinen wichtig sind. Informationen über den Zustand der Maschine, Einsatzart, Zubehör,<br />
Betriebsstunden gehören ebenso dazu wie Angaben über durchgeführte Reparaturen, Erweite-<br />
rungen, Aufrüstungsarbeiten an der Maschine oder Einsatzort, Besichtigungsmöglichkeiten,<br />
Demontage und Transportmöglichkeiten. Außerdem sollen in der Datenstruktur Informatio-<br />
nen, die zur Auswertung der späteren Suchanfrage benötigt werden, abgelegt werden können.<br />
39
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
40<br />
Abbildung 5: Schematische Darstellung der Datenstruktur<br />
Die Struktur enthält Entitätstypen und Beziehungen, die ein redundanzfreies Ablegen und<br />
effizientes Abrufen der folgenden Daten ermöglichen:<br />
• Speichern verschiedener Klassifikationssysteme, ergänzt durch entsprechende Meta-<br />
Informationen<br />
• Speichern aller Produktgruppen der Klassifikationssysteme<br />
• Zusammenfassung von Merkmalen einer Produktgruppe zu Merkmalleisten<br />
• Zuordnung von Merkmalleisten zu Produktgruppen<br />
• Mehrsprachigkeit bei den Klassifikationssystemen und Produkten<br />
• Sprachabhängige Synonymspeicherung für Produktgruppen, Merkmalsnamen etc.<br />
• Detaillierte Beschreibung jedes einzelnen Merkmals durch entsprechende Attribute<br />
• Hinterlegung von Wertebereichen für Merkmale<br />
• Einordnung von Produkten in das Klassifikationssystem<br />
• Ablage der Parameter für die unscharfe Suche in Form von weiteren Merkmals-Attributen
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
2 Such- und Klassifizierungsstrategien in Klassifikationssystemen und<br />
elektronischen Produktkatalogen<br />
2.1 Verfahren des Information Retrieval<br />
Kennzeichen von Textretrieval-Verfahren (vgl. I2.5) ist - neben dem gelieferten Ergebnis in<br />
Form von kompletten Dokumenten oder Textteilen - die weitgehend unstrukturierte Repräsen-<br />
tation der Dokumentbasis. Hier findet sich in der Regel ein Index, d. h. ein Stichwortver-<br />
zeichnis bestehend aus Indextermen, die wesentliche Inhalte der Dokumente in komprimierter<br />
Form darstellen sollen. Dokumente werden als Liste von Indextermen beschrieben, wobei die<br />
Relation zwischen einem Indexterm und einem Dokument häufig zusätzlich gewichtet wird,<br />
um ein Maß der Wichtigkeit auszudrücken [Salton 1971; Salton/McGill 1983].<br />
Ein Problem der Verfahren des Text-Retrieval ist die weitgehend unbekannte, weil beliebi-<br />
ge Struktur der zu suchenden Dokumente. Dies ändert sich, wenn der Suchraum nicht mehr<br />
das Internet, sondern eine (oder auch mehrere) bekannte Datenbanken umfasst. Die Anfrage<br />
ist gegeben als eine Menge von Attribut-/Wertpaaren, welche die Objekte in der angefragten<br />
Datenbank möglichst gut erfüllen sollen.<br />
Im Rahmen dieses Projektes wird davon ausgegangen, dass Benutzer Produkte suchen, die<br />
in der Datenbank einer Handelsbörse oder eines Marktplatzes abgelegt sind. Insofern handelt<br />
es sich bei diesem Ansatz zum Produkt Retrieval um eine Realisierung eines Data Retrieval<br />
Verfahrens, wobei jedoch auch Komponenten des klassischen Information Retrievals verwen-<br />
det werden.<br />
Auch das Case-based Reasoning (CBR) hat Verfahren entwickelt, die einen Produktver-<br />
gleich auf Ähnlichkeitsbasis ermöglichen [Bergmann et al. 2002]. Hier wird der zu suchende<br />
Artikel als Referenz aufgefasst, zum dem möglichst ähnliche „Fälle“ gesucht werden. Aller-<br />
dings geht die CBR-Technik nicht auf Fragen der automatisierbaren Parametrisierung sein.<br />
Das hier vorgestellte Retrievalmodell setzt sich mit den drei Teilaufgaben auseinander, die<br />
generell in jedem Modell behandelt werden müssen. Dies sind die Konstruktion einer Reprä-<br />
sentation der Anfrage, die Konstruktion einer Repräsentation der Produktmenge sowie die<br />
Bereitstellung einer Funktion zur Berechnung der Übereinstimmung (Ähnlichkeitsmaß) zwi-<br />
schen einer Anfrage und einzelnen Produkten. Die Ähnlichkeitsmaße, die vorgestellt werden,<br />
verwenden Zugehörigkeitsfunktionen, wie sie aus der Theorie der Fuzzymengen bekannt sind<br />
[Grauel 1995, Zadeh 1965].<br />
2.2 Suchstrategien in Produktkatalogen<br />
Ausgehend von einer einheitlichen Darstellung der Anfrage - zur allgemeineren Nutzung ko-<br />
diert in ein XML-Schema - werden in diesem Abschnitt die realisierten Suchstrategien vorge-<br />
stellt. Die Strategien können auch verwendet werden, um vorhandene Maschinen in das Klas-<br />
sifikationssystem einzuordnen.<br />
41
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
42<br />
Es werden zwei Ansätze vorgestellt: Der erste Ansatz basiert auf dem Vektorraum-Modell,<br />
wobei Merkmals-/Wertpaare als Indexterme aufgefasst werden. Der zweite Ansatz nutzt das<br />
erweiterte boolesche Modell als Rankingverfahren, wobei die Ähnlichkeit für einzelne<br />
Merkmale über Fuzzy-Zugehörigkeitsfunktionen bestimmt wird. Abschließend werden die<br />
beiden Ansätze vergleichend betrachtet.<br />
2.2.1 Aufbau der Anfrage<br />
Die Beschreibung einer Produktanfrage stützt sich auf eine Liste von Merkmalen mit entspre-<br />
chenden Wertausprägungen. Für eine genaue Beschreibung komplexer Produkte und eine<br />
Einschränkung des Suchraumes muss es möglich sein, die Merkmale mit ihren Werten über<br />
logische Operatoren zu verknüpfen. Eine Gewichtung einzelner angefragter Merkmale muss<br />
ebenfalls möglich sein. Als Beispiel kann die folgende Suchanfrage dienen.<br />
„Drehmaschine“<br />
and {“Drehzahlbereich (U/min)“ = “[1000 .. 5000]“}erfüllt;1.0<br />
and {“Drehlänge(mm)“ = “800“}1.0<br />
and {“Gesamtantriebsleistung (kW)“ = “[20 .. 25“}1.0<br />
and {“Hersteller“ = “Okuma“}1.0<br />
and {“Herstellungsjahr“ = “1985“}0.7<br />
and {“Preis (EUR)“ = “40000“}1.0<br />
Abbildung 6: Beispielanfrage einer gebrauchten Maschine<br />
Diese Suchanfrage beschreibt eine Drehmaschine mit folgenden Eigenschaften:<br />
• Der Drehzahlbereich soll 1000 bis 5000 U/min betragen. „Erfüllt“ bedeutet, dass mindes-<br />
tens dieser Bereich abgedeckt werden muss.<br />
• Die Drehlänge soll 800 mm betragen.<br />
• Die Gesamtantriebsleistung soll zwischen 20 kW und 25 kW liegen.<br />
• Der Hersteller der Maschine soll die Fa. Okuma sein.<br />
• Das Herstellungsjahr der Maschine soll 1985 sein.<br />
• Der Preis soll bei 40.000 EUR liegen.<br />
Der logische Operator and drückt aus, dass alle Merkmals-/Wertpaare erfüllt sein sollen. Bis<br />
auf das Herstellungsjahr, das mit 0.7 gewichtet ist, sollen sie bei der Suche als gleichgewich-<br />
tet betrachtet werden.<br />
Für die maschinelle Verarbeitung in E-Business–Szenarien ist es vorteilhaft, eine Suchan-<br />
frage als XML–Dokument zu kodieren. Hierzu wurde ein XML–Schema erstellt, das<br />
Abbildung 7 beschreibt. Das XML-Dokument für eine Suchanfrage beinhaltet folgende In-<br />
formationen:
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
• Auflistung der Bezeichnungen der Produktgruppen, denen das gesuchte Produkt angehö-<br />
ren könnte (-Element).<br />
• Angabe von Merkmalen mit Einzelwerten oder Wertebereichen. Ein Merkmal mit dem<br />
entsprechenden Wert ist dem -Element zugeordnet und wird im Folgenden<br />
als Literal bezeichnet. Ein Merkmal muss eindeutig identifizierbar sein.<br />
• Verknüpfung von Literalen zu Ausdrücken über die logischen Operatoren and, or und<br />
not.<br />
• Gewichtung von Literalen und Ausdrücken. Über die Gewichtung kann die Bedeutung<br />
einzelner Literale oder Ausdrücke bei der Suche beeinflusst werden.<br />
• Angabe, wie Bereichsanfragen semantisch zu handhaben sind: FULFILLED (der Anfra-<br />
gebereich muss mindestens ausgefüllt sein), COMPRISED (der Produktbereich soll im<br />
Anfragebereich liegen) oder EXACT (der Anfragebereich soll weder unter- noch über-<br />
schritten, sondern genau getroffen werden).<br />
Abbildung 7: XML-Schema für eine Produktanfrage<br />
Zusätzlich können neben den Merkmals- und Gruppennamen auch Synonyme angegeben<br />
werden, da es keine einheitliche Normung für Produktmerkmalsnamen und ihre Eigenschaf-<br />
ten gibt. Allerdings sind hier neben bestehenden Klassifikationssystemen wie eClass Normie-<br />
rungsbemühungen zu erkennen [DIN 2002]. Bei bekannten Klassifikationssystemen können<br />
auch eindeutige Bezeichner für die Produktgruppen und Merkmale angegeben werden.<br />
Abbildung 8 zeigt auszugsweise die Suchanfrage aus Abbildung 6 als XML–Dokument<br />
gemäß dem beschriebenen Schema.<br />
43
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
2.2.2 Suchstrategie<br />
44<br />
Abbildung 8: XML-kodierte Anfrage nach einer Maschine (Auszug)<br />
Der entwickelte Ansatz zur Optimierung der Produktsuche berücksichtigt Klassifikationssys-<br />
teme und Wissen über die Anwendungsdomäne und kann wie folgt beschrieben werden:<br />
1. Erstellung einer Suchanfrage, beispielsweise über ein Web-Formular oder einen Anfrage-<br />
generator, wobei das Klassifikationssystem dem Fragenden vorliegt.<br />
2. Überführung der Suchanfrage in ein XML-Anfragedokument.<br />
3. Vorauswahl der Produktgruppen und Produkte, für welche ein numerisches Ranking er-<br />
stellt werden soll.<br />
4. Ermittlung der Ähnlichkeiten zwischen Anfragewert und Produktwert für jedes Merkmal<br />
eines Produktes anhand hinterlegter Zugehörigkeitsfunktionen oder statistischer Werte.<br />
Dabei werden auch Informationen wie Skalierung oder Glättungsbereich berücksichtigt.<br />
5. Zusammenfassung der Ähnlichkeiten auf Merkmalsebene zu einer Gesamtrelevanz für<br />
jedes Produkt. Dabei müssen anfragespezifische Gewichte berücksichtigt werden.<br />
6. Sortierung der Produkte entsprechend ihrer Relevanz.<br />
7. Optionale Bewertung des Ergebnisses durch den Anfragenden („Relevance Feedback“).<br />
2.2.3 Notationen<br />
In Anlehnung an die Definition von Produkt-Klassifikationssystem und Produktkatalog in<br />
Abschnitt 1.2.3 wird das Produkt-Retrieval-Modell definiert.<br />
Definition 3: Produkt-Retrieval-Modell<br />
Ein Produkt-Retrieval-Modell besteht aus einem Tupel (K, P, Q, R, I) mit
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
1. K und P repräsentieren das Klassifikationssystem und dazu gehörenden Produktkatalog.<br />
2. Q ist eine Menge von Anfragen nach Produkten. Eine Anfrage besteht aus gesuchten Pro-<br />
duktgruppen, Merkmalen und Merkmalswerten, die über logische Operatoren verknüpft<br />
sind<br />
3. R repräsentiert eine Menge von Rankingfunktionen r: Q×P → [0,1], die jedem Produkt p in<br />
Abhängigkeit von einer Anfrage q eine Relevanz zwischen 0 und 1 zuweisen.<br />
4. I repräsentiert die Menge der Indexterme eines Retrieval-Systems. Jedes Produkt wird<br />
durch einen oder mehrere Indexterme charakterisiert.<br />
2.2.4 Vektorraum-Modell<br />
Eines der bekanntesten und anschaulichsten Verfahren im Information Retrieval ist das Vek-<br />
torraum-Modell. Hierbei wird versucht, eine Ähnlichkeit zu bestimmen, indem Anfrage und<br />
Dokument als Vektoren aufgefasst werden. Als Ähnlichkeitsmaß wird der Winkel zwischen<br />
Dokument- und Anfragevektor verwendet, der über die Cosinusfunktion auf einen Wert im<br />
Intervall [0,1] abgebildet wird [Ribeiro-Neto/Baeza-Yates 1999]. In den folgenden Unterab-<br />
schnitten übertragen wir dieses Modell auf die Produktsuche.<br />
2.2.4.1 Indexterme<br />
Im Information Retrieval werden Dokumente durch die in ihnen enthaltenen Worte indiziert.<br />
Jedes Dokument wird durch eine Liste von solchen Wort-Indextermen repräsentiert. Die Re-<br />
levanz bezüglich eines Terms hängt von der Gesamthäufigkeit des Indexterms bezogen auf<br />
alle Dokumente ab und wird als inverse document frequency (idf) bezeichnet. Ein Dokument<br />
hat bezüglich eines Anfrageterms (Wortes) dann eine hohe Relevanz, wenn der Anfrageterm<br />
über alle Dokumente selten, aber in dem Dokument selbst besonders häufig im Verhältnis zu<br />
anderen Indextermen vorkommt.<br />
Die Analyse von Produktkatalogen hat ergeben, dass das obige Konzept der Indexierung<br />
auf die Kataloge übertragbar ist. Dazu werden alle Produkte als Dokumente interpretiert. Wie<br />
in Abschnitt 1.2 erläutert, werden diese Produkte insbesondere durch ihre Zuordnung zu einer<br />
Produktgruppe, ihre Merkmale und den Ausprägungen dieser Merkmale charakterisiert. Es<br />
können daher sowohl die Merkmale als auch Merkmals-/Wertpaare der Produkte als Index-<br />
terme gewählt werden. In unserem Ansatz verwenden wir als Indexterme Merkmals-<br />
/Wertpaare.<br />
Analog zur inverse document frequency (idf) beim Text-Retrieval definieren wir die „in-<br />
verse product frequency“:<br />
45
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Definition 4: Inverse Product Frequency (ipf)<br />
Unter der ipf verstehen wir die inverse product frequency und setzen ipf i = log ( P fi<br />
) , wobei fi<br />
die Häufigkeit des Indexterms i über alle Produkte und |P| die Gesamtanzahl der Produkte im<br />
Produktkatalog angibt.<br />
46<br />
Tabelle 2 zeigt einen Auszug der Merkmalswerte aus einer Produktdatenbank mit etwa<br />
8000 Maschinen. Hier ist zu erkennen, dass verschiedene Merkmals-/Wertpaare deutlich häu-<br />
figer in Produkten vorkommen als andere und entsprechend die ipf beeinflussen.<br />
Tabelle 2: Auszug aus einem Produktindex, ergänzt durch die ipf<br />
2.2.4.2 Rankingfunktion<br />
Unter Verwendung der ipf wird an Anlehnung an [Ribeiro-Neto/Baeza-Yates 1999] mit fol-<br />
gender Funktion die Gesamtrelevanz für ein Produkt bestimmt.<br />
Definition 5: Rankingfunktion<br />
1. Das Gewicht des k-ten Indexterms für ein Produkt p wird berechnet durch<br />
weight<br />
k<br />
( p)<br />
=<br />
ipf<br />
k<br />
0<br />
falls Indexterm im Produkt<br />
sonst<br />
p enthalten<br />
und bestimmt den Gewichtsvektor des Produktes p =(weight1(p), ..., weight |I|(p))<br />
2. Eine Anfrage (Query) q besteht aus einem Gewichtsvektor q =(weight1(q), ..., weight|I|(q)),<br />
der die Gewichte der angefragten Merkmals-/Wertpaare repräsentiert. Der Anfragende<br />
kann einzelnen Merkmals-/Wertpaaren Gewichte zuordnen, wobei das Defaultgewicht 1<br />
ist.<br />
3. Die Rankingfunktion r bestimmt den Cosinus zwischen Anfragevektor und Produktmerk-<br />
malsvektor und ist definiert durch<br />
q • p<br />
r(<br />
q,<br />
p)<br />
=<br />
| q | |<br />
Ausgehend von diesen Berechnungsgrundlagen illustriert Tabelle 3 das Verfahren für die Bei-<br />
spielanfrage aus Abschnitt 2.2.1. Die Tabelle zeigt für jedes Produkt den Gewichtsvektor, der<br />
sich über die in Definition 5 angegebene Formel bestimmt. Die von 0 verschiedenen Gewich-<br />
te entsprechen der ipf (siehe Tabelle 3).<br />
· p<br />
|
Tabelle 3: Suchergebnisse mit vektoriellem Ranking<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Die Maschinen 7, 5 und 4 haben die meisten angefragten Merkmals-/Wertpaare und sind da-<br />
her am höchsten bewertet. In den Suchergebnissen ist auch deutlich zu sehen, dass viele In-<br />
dexterme mit 0 gewichtet werden (Maschine 1, 2), da der Anfragewert nicht mit dem Pro-<br />
duktwert übereinstimmt.<br />
2.2.5 Fuzzy-Retrieval<br />
In der Fuzzy-Logik wird die Ermittlung einer Mengenzugehörigkeit über eine Zugehörigkeits-<br />
funktion bestimmt. Im Gegensatz zur Mengenzugehörigkeit im rein booleschen Sinne (nur<br />
"gehört zur Menge" oder "gehört nicht zur Menge" ist möglich) kann eine Fuzzymenge auch<br />
eine Zugehörigkeit im Intervall ]0..1] annehmen. Fuzzyfizierung bietet sich daher an, um die<br />
Ähnlichkeit eines Produktes zu einer Anfrage bezüglich eines Merkmales zu bestimmen.<br />
Die Ähnlichkeiten können dann über eine Rankingfunktion zusammengefasst werden, die<br />
in unserem Fall auf dem erweiterten booleschen Modell [Salton et al. 1983] beruht.<br />
2.2.5.1 Zugehörigkeitsfunktionen<br />
Definition 6: Zugehörigkeitsfunktionen<br />
Z ist die Menge der Zugehörigkeitsfunktionen im Produkt-Retrieval-System.<br />
z: Wm×Wm → [0,1] steht dabei für die Zugehörigkeitsfunktion, welche die Ähnlichkeit zwi-<br />
schen einem Anfragewert und einem Produktwert bezüglich eines Merkmals m und seiner<br />
Produktgruppenzugehörigkeit berechnet. Der konkrete Funktionsverlauf der Basisfunktion<br />
wird bestimmt durch die Werte der Anfrage. Glättungsfaktoren geben zusätzlich an, wie stark<br />
die Funktion abfällt: Die Zugehörigkeitsfunktion wird in diesen ähnlichkeitsrelevanten Be-<br />
reich gestreckt/gestaucht. Der ähnlichkeitsrelevante Bereich ergibt sich prozentual oder abso-<br />
47
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
lut aus dem Anfragewert und wird auch als Glättungsbereich bezeichnet. Ein Merkmal Bau-<br />
jahr beispielsweise erfordert einen Glättungsbereich, der absolut angeben wird (z. B. +/- 5<br />
Jahre), eine Drehzahl kann durchaus prozentual abgewertet werden (z. B. +/- 30%). Auch der<br />
Betrag einer Bereichsanfrage kann den Glättungsbereich bestimmen.<br />
48<br />
Für einen Anfragewert wm(q) schreiben wir vereinfacht für die angepasste Zugehörigkeits-<br />
funktion: zq: Wm → [0,1]. Diese Funktion errechnet direkt für einen Produktwert die Ähn-<br />
lichkeit zum Anfragewert.<br />
Der Typ der Zugehörigkeitsfunktion wird neben der domänenabhängigen Semantik beein-<br />
flusst durch die Skalierung des Merkmals.<br />
Nominalskalierte Merkmale<br />
Nominalskalierte Merkmalswerte stehen nicht in einer Reihenfolge zueinander. Die Zugehö-<br />
rigkeitsfunktion wird durch eine Korrelationsmatrix [Ogawa et al. 1991, Ribeiro-Neto/Baeza-<br />
Yates 1999] definiert.<br />
Merkmale mit linear geordneten Werten<br />
Bei ordinal-, intervall- und verhältnisskalierten Merkmalswerten kann als Zugehörigkeits-<br />
funktion beispielsweise die Rechteck- und Trapezfunktion, die Hyperbelfunktion oder die<br />
Gauss´sche Glocke [Grauel 1995] bzw. Kombinationen davon verwendet werden.<br />
Generell unterscheiden wir folgende Fälle:<br />
1. Die Anfrage liegt als Einzelwert vor. Es soll also eine Ähnlichkeit zwischen zwei Einzel-<br />
werten bestimmt werden.<br />
2. Die Anfrage liegt bereits benutzerseitig als Bereich vor (ist also vereinfacht fuzzyfiziert).<br />
Eine maximale Ähnlichkeit liegt vor, wenn der gesuchte Produktwert innerhalb des ge-<br />
suchten Bereiches liegt.<br />
3. Der Produktwert soll oberhalb oder unterhalb des Anfragewertes liegen.<br />
In allen Fällen kann die Zugehörigkeit unmittelbar durch die Zugehörigkeitsfunktion z be-<br />
stimmt werden, wobei für den zweiten Fall innerhalb des Bereichs der Anfrage eine Ähnlich-<br />
keit von 1 angenommen wird. Im dritten Fall ist die Ähnlichkeit oberhalb (unterhalb) des An-<br />
fragewertes mit 1 zu bewerten.<br />
Beispielsweise lässt sich die Zugehörigkeitsfunktion zum Merkmal Preis, die basierend auf<br />
einer geeigneten Abwertungsfunktion z die Zugehörigkeit eines Produktes p zu einer Anfrage<br />
q berechnet, wie folgt definieren:<br />
z preis ( w preis ( p))<br />
=<br />
1<br />
z(<br />
w preis ( p))<br />
falls w preis ( p)<br />
≤ w preis ( q)<br />
sonst<br />
Unterhalb des Anfragewertes ist ein Produktpreis immer ein „Volltreffer“, oberhalb wird er<br />
gemäß der Zugehörigkeitsfunktion abgewertet.
Bereichsfähige Merkmale<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Abbildung 9: Zugehörigkeitsfunktion des Merkmals „Preis“<br />
Als ein Sonderfall der nominalskalierten Merkmale können Merkmale aufgefasst werden,<br />
deren Werte Bereiche bilden können. Das ist grundsätzlich möglich, wenn die Merkmalswerte<br />
linear geordnet werden können. Beispiel hierfür ist der Drehzahlbereich. Bereiche an sich sind<br />
nominalskaliert, da nicht gesagt werden kann, ob beispielsweise der Bereich 3.000-5.000<br />
Umdrehungen pro Minute größer ist als der Bereich 2.000-4.000 U/min.<br />
Da jedoch die Bereichsgrenzen vergleichbar sind, lassen sich die im vorigen Abschnitt be-<br />
schriebenen Zugehörigkeitsfunktionen auch zur Bestimmung einer Ähnlichkeit zwischen Be-<br />
reichen verwenden. Um dies zu verdeutlichen, betrachten wir den Bereich wm(q)=[uq, oq], der<br />
dem Merkmal m in der Anfrage zugeordnet ist, und den Bereich wm(p)=[up, op], der den<br />
Merkmalswert des Produktes repräsentiert. Den Bereichgrenzen werden die Zugehörigkeits-<br />
funktionen zu und zo zugeordnet. Folgende Fälle können unterschieden werden (angegeben<br />
wird jeweils, welche Bedingung die höchste Ähnlichkeit hat):<br />
1. wm ( q)<br />
⊆ wm<br />
( p)<br />
Der Merkmalsbereich soll die Anfrage komplett einschließen, die Anfrage soll also min-<br />
destens erfüllt werden. Wie stark die Übererfüllung ist, ist irrelevant.<br />
2. wm ( q)<br />
⊇ wm<br />
( p)<br />
Abbildung 10: Ähnlichkeit bei Erfüllung des Anfragebereiches<br />
Der Merkmalswert soll innerhalb der Anfrage liegen, die Anfrage ist also bereits verein-<br />
facht fuzzyfiziert. Wie viel kleiner der tatsächliche Produktbereich ist, ist irrelevant.<br />
49
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
3. w m ( q)<br />
= wm<br />
( p)<br />
50<br />
Abbildung 11: Ähnlichkeit bei Enthaltung des Produktes im Anfragebereich<br />
Der Produktbereich soll den Anfragebereich möglichst genau treffen, Über- und Unterer-<br />
füllung führt zu Abwertung.<br />
Abbildung 12: Ähnlichkeit bei exakter Übereinstimmung<br />
Die Ähnlichkeit zwischen Anfragebereich und Produktbereich ergibt sich in allen 3 Fällen mit<br />
z ( u p , o p ) = zu<br />
( u p ) · zo<br />
( o p )<br />
Neben der Produktbildung sind auch andere Verfahren wie Flächenverhältnisse oder Mittel-<br />
wertbildung zur Berechung der Ähnlichkeit zwischen Anfrage- und Merkmalsbereichen ein-<br />
setzbar. Welches Verfahren verwendet wird, hängt auch von der Anwendungsdomäne ab.<br />
Mehrfachwerte<br />
Einen weiteren Sonderfall der Nominalskalierung stellen Mehrfachwerte eines Produktes dar.<br />
Auch hier können Ähnlichkeiten zwischen Anfrage und Merkmalswerten bestimmt werden,<br />
indem die einzelnen Produktwerte mit der Anfrage verglichen werden. Als Ähnlichkeit wird<br />
in diesem Fall das Maximum gesetzt (ausgehend von n Einzelwerten im Produktmerkmal):<br />
z ( wm<br />
( p))<br />
=<br />
max( wm<br />
( p)<br />
1<br />
,..., wm<br />
( p)<br />
n )
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Mit den vorgestellten Verfahren lassen sich Zugehörigkeitsfunktionen für alle Skalierungs-<br />
und Anfragearten der im Klassifikationssystem vorhandenen Merkmale definieren. Im nächs-<br />
ten Schritt müssen diese errechneten Einzelgewichte mittels einer Rankingfunktion zu einer<br />
gesamten Produktrelevanz zusammengefasst werden.<br />
Entsprechend lassen sich auch Ähnlichkeiten zwischen komplexen Merkmalswerten (wie<br />
beispielsweise einem Raummaß) bestimmen.<br />
2.2.5.2 Rankingfunktion<br />
Um die merkmalsbezogenen Einzelgewichte zu einem Gesamtranking zusammenzufassen,<br />
verwenden wir das erweiterte boolesche Modell. Hier können durch Parametervariation des<br />
Faktors k mehrere Rankingverfahren abgebildet werden. Wird der Parameter beispielsweise<br />
auf 1 gesetzt, so entspricht das Ergebnis der Bewertung dem Vektorraum-Modell [Salton et<br />
al. 1983].<br />
Definition 7: Erweitertes boolesches Modell<br />
Das erweiterte boolesche Modell unterscheidet die Rankingfunktion r(q,p) in Abhängigkeit<br />
von den innerhalb der Anfrage verwendeten booleschen Operatoren and, or und not. Die<br />
Formeln lassen sich rekursiv anwenden. Wir setzen<br />
r(<br />
q<br />
, p)<br />
= 1 −<br />
k<br />
weight<br />
1<br />
( q)<br />
( 1<br />
k<br />
− z<br />
1<br />
( w<br />
1<br />
( p)))<br />
+<br />
k<br />
weight<br />
1<br />
( q)<br />
+<br />
+<br />
+<br />
weight<br />
n<br />
weight<br />
n<br />
k<br />
( q)<br />
( 1<br />
k<br />
( q)<br />
−<br />
z<br />
n<br />
k<br />
( w ( p)))<br />
n<br />
im Fall einer and-Verknüpfung der Merkmals-/Wertepaare in der Anfrage q. Dabei repräsen-<br />
tiert weighti(q) das (nutzerdefinierte) Gewicht eines Merkmals-/Wertpaares der Anfrage und<br />
zi(p) das Ergebnis der Zugehörigkeitsfunktion von Merkmalswert der Anfrage und Merk-<br />
malswert des Produktes für das Merkmal i. n bezeichnet die Anzahl der Merkmale in der An-<br />
frage q. (Die Formeln für or und not können der Literatur entnommen werden.)<br />
Tabelle 4 zeigt beispielhaft das Fuzzy-Retrieval für die Anfrage aus Abschnitt 2.2.1. Dabei<br />
wurde generell die Trapezfunktion als Zugehörigkeitsfunktion gewählt, der Glättungsbereich<br />
wurde außer bei dem Merkmal Herstellungsjahr, wo mit +/- 5 Jahren gerechnet wurde, mit +/-<br />
50% bestimmt. Alle Produktpreise unterhalb des Anfragewertes von 40.000 EUR wurden mit<br />
1 bewertet. Der Parameter k in der Rankingfunktion wurde auf 1 gesetzt.<br />
In Tabelle 4 ist zu sehen, dass sich ein differenzierteres Ranking als beim reinen Vektorraum-<br />
Modell ergibt. Jedes Merkmals-/Wertpaar wird hier nur dann mit 0 gewichtet, wenn es nach<br />
der Zugehörigkeitsfunktion keine Ähnlichkeit gibt, der Produktwert also außerhalb des Glät-<br />
tungsbereiches liegt. Die Bewertung der aus einer Produktgruppe stammenden Maschinen –<br />
vom angefragten Typ „Drehmaschine“ her sind alle potentiell geeignet – variiert zwischen<br />
79% und 34%.<br />
1/<br />
k<br />
51
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Tabelle 4: Ranking-Ergebnisse mit Fuzzy-Retrieval<br />
2.3 Ergebnisse<br />
Zur Verbesserung der Produktsuche wurden Verfahren aus dem Information Retrieval für das<br />
Produkt-Retrieval erweitert und angepasst. Aus einer exakten Anfrage wurde mit Hilfe von<br />
Fuzzy-Verfahren eine unscharfe Produktbeschreibung für die Suche generiert. Hierzu wurden<br />
die verschiedenen Skalierungen der Merkmale zur Beschreibung von Produkten klassifiziert,<br />
und für die einzelnen Klassen wurden geeignete Zugehörigkeitsfunktionen beschrieben. Die<br />
Zugehörigkeitsfunktionen legen die Relevanz einzelner Produktmerkmale bezüglich der An-<br />
frage fest. Um zu einer Gesamtbewertung zu kommen, wurden das erweiterte boolesche Mo-<br />
dell und das Vektorraum-Modell adaptiert.<br />
52<br />
Erste empirische Auswertungen haben gezeigt, dass die vorgestellten Ansätze erhebliche<br />
Vorteile bringen. Diese Ergebnisse sollen nun in weiteren Experimenten tiefergehend analy-<br />
siert werden. Ein weiteres Thema wird die Zuordnung und Anpassung der Zugehörigkeits-<br />
funktionen sein, die derzeit noch manuell erfolgen muss, was ein tiefgehendes Wissen in der<br />
Anwendungsdomäne erfordert. Insbesondere soll untersucht werden, wie eine Bestimmung<br />
und Anpassung von Zugehörigkeitsfunktionen für einzelne Merkmale über Lernmethoden in<br />
Verbindung mit Relevance Feedback automatisiert erfolgen kann.
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
3 Branchenspezifische Suchverfahren und Klassifikationssysteme<br />
Ein weiteres Ziel des Projektes war es, Verfahren zum Auffinden von Information über ge-<br />
brauchte Maschinen im Internet bzw. Verfahren zur Abbildung von Maschineninformationen<br />
in Fremdformaten in das entwickelte Klassifikationssystem für gebrauchte Maschinen zu<br />
entwickeln.<br />
Derzeit bleibt die unscharfe Produktsuche auf die in diesem Projekt entwickelte Handels-<br />
börse begrenzt, denn die Suchverfahren verarbeiten nur die Informationen und Daten, die un-<br />
mittelbar aus der Datenbank der Handelsbörse ermittelt werden können. Erstrebenswert wäre<br />
die Erweiterung der Suche auf das gesamte Internet, wodurch für den Kunden entsprechend<br />
seiner Suchangaben weitere Angebote ermittelt werden können. Dies insbesondere dann von<br />
Vorteil, wenn in der Handelsbörse selbst keine passenden Angebote vorhanden sind und/oder<br />
das bestehende Angebot erweitert werden soll.<br />
So entstand seit der CeBIT 2003 eine Zusammenarbeit mit dem Institut für Innovative In-<br />
formatik-Anwendungen der Fachhochschule Trier für die Ausweitung der Suche nach be-<br />
stimmten Maschinen auf das WWW. Im Projekt INFOX-1 [Arens et al. 2002] werden Verfah-<br />
ren entwickelt, die es ermöglichen, relevante Informationen zu einem speziellen Thema auto-<br />
matisch aus dem WWW zu selektieren. Die mit dem Einsatz öffentlicher Suchmaschinen ge-<br />
fundenen Seiten werden inhaltlich analysiert, um eine Bewertung der Relevanz für den Be-<br />
nutzer bezogen auf seine Angaben zu erreichen. Durch die Verwendung von fachspezifischem<br />
Wissen (Aufbau einer Wissensbasis mit den für dieses Thema relevanten Informationen an-<br />
hand des Klassifikationssystems) soll eine ähnliche qualifizierte Interpretation der gefundenen<br />
Internetseite erreicht werden, als wenn ein entsprechend fachlich ausgebildeter Mitarbeiter<br />
diese Seite untersuchen und auswerten würde.<br />
Im einem ersten Schritt der Zusammenarbeit zur Erweiterung der Suche wurden dem Pro-<br />
jekt INFOX-1 die Ergebnisse aus dem Bereich der XML-basierten Produktkataloge als Trai-<br />
ningsmenge zur Verfügung gestellt. Diese wird zum Füllen einer Wissensbasis verwendet, die<br />
damit alle relevanten Informationen (Merkmale und Merkmalswerte) zu gesuchten Maschinen<br />
enthält. Es wird nun untersucht, inwieweit durch eine aus diesen Angaben aufgebaute Wis-<br />
sensbasis geeignete Seiten im WWW gefunden werden können. In einem weiteren Schritt ist<br />
dann ein Verfahren zu entwickeln, das die gefundenen Produktangebote anhand der in der<br />
Suchanfrage geforderten Eigenschaften bewertet. Anschließend werden die gesuchten Ma-<br />
schinen entsprechend ihrer Beschreibung in die dazugehörigen Produktklassen einsortiert.<br />
53
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
4 Prototypische Implementierung der Handelsplattform<br />
Die in den vorherigen Kapiteln beschriebenen theoretischen Ansätze wurden im Rahmen des<br />
Projektes prototypisch in Software umgesetzt. Es sollte dabei keine fertige Handelsbörse ent-<br />
wickelt werden. Vielmehr war es Ziel, verschiedene Teilmodule zu entwickeln, die von belie-<br />
bigen Handelsbörsen eingesetzt werden können. Hierbei wurde eine hohe Flexibilität der<br />
Teilmodule angestrebt. Die Flexibilität spiegelt sich in der Beschaffenheit der Datenbank-<br />
struktur, sowie in den Schnittstellen der Module wider. Im Folgenden soll auf die realisierten<br />
Module, deren Funktionalität sowie auf die gegenseitige Interaktion über die Schnittstellen<br />
eingegangen werden.<br />
4.1 Datenbestand<br />
Für die Analyse und Evaluierung der von uns entwickelten Suchverfahren und zum Testen<br />
der Softwarekomponenten wurden Produktdaten und Klassifikationssysteme zu gebrauchten<br />
Industriemaschinen aus verschiedenen Handelsbörsen ermittelt und in die Testplattform ein-<br />
gepflegt.<br />
54<br />
Das verwendete Klassifikationssystem besteht aus 442 hierarchisch angeordneten Produkt-<br />
gruppen sowie 542 Merkmalen, wobei zwischen 8 und 41 Merkmale einer Produktgruppe<br />
zugeordnet sind. Insgesamt gibt es 9004 Zuordnungen von Merkmalen zu Produktgruppen.<br />
Beispielsweise besteht die Produktgruppe Drehmaschinen aus mehreren Unterprodukt-<br />
gruppen wie z. B. CNC Dreh und Fräszentrum, CNC Drehmaschine, CNC Drehmaschine<br />
Schrägbett, Einstechdrehbank-automatisch, Feindrehbank etc. Eine spezielle Feindrehbank<br />
wird unter anderem durch folgende Merkmale beschrieben:<br />
Tabelle 5: Beispiele von Merkmalen und Merkmalswerten einer Feindrehbank<br />
Artikelbezeichnung Drehbank<br />
Artikelnummer 101053346<br />
Gesamtantriebsleistung(kW)<br />
Hersteller WEWAG<br />
Herstellungsjahr 1978<br />
Raumbedarf L x B x H(m) 250 x 2000 mm<br />
Sonstige Informationen keine<br />
Die Merkmale sind entsprechend der in Abschnitt 1.2 vorgestellten Struktur für Klassifikati-<br />
onssysteme nicht fest an eine bestimmte Produktgruppe gebunden. Zu ersehen ist dies z. B. an<br />
dem Merkmal „Raumbedarf L x B x H(m)“, welches von verschiedenen Produktgruppen be-<br />
nötigt wird.<br />
Der eigentliche Produktkatalog im untersuchten Datenbestand besteht aus 7937 Produkten<br />
mit insgesamt 88151 Merkmalswerten. Der Pflegegrad der Produktgruppen liegt dabei zwi-<br />
schen 24% und 92%.
4.2 Qualität des Datenbestandes<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Je besser die Daten im Datenbestand gepflegt sind, desto genauer können die Anfragen der<br />
unscharfen Suche ausgewertet werden und die Daten für den automatisierten Import und Ex-<br />
port zur Verfügung gestellt werden. Dabei wird die Datenqualität durch folgende Punkte be-<br />
einflusst:<br />
Pflegegrad einzelner Produkte<br />
Der Pflegegrad einer Maschine entspricht der Anzahl der tatsächlich gefüllten Merkmale der<br />
Maschinen, d. h. bei geringem Pflegegrad wurden viele Merkmale beim Einstellen der Ma-<br />
schinen nicht gefüllt. Dies kann darauf hindeuten, dass diese Merkmale für den Käufer oder<br />
Verkäufer nicht relevant sind.<br />
Anzahl der Merkmale<br />
In den verschiedenen Handelsbörsen lassen sich Produktgruppen finden, die nur mit wenigen<br />
Merkmalen beschrieben sind. Ein Produkt lässt sich aber besser finden, wenn es durch eine<br />
bestimmte Anzahl von Merkmalen ausreichend beschrieben werden kann und diese Merkmale<br />
auch korrekt gepflegt sind. Deshalb sollen diese Produktgruppen mit zu wenigen Merkmalen<br />
um Merkmale erweitert werden können, um eine bessere Beschreibung zu gewährleisten.<br />
Unstrukturierte Produktbeschreibung<br />
In einigen Fällen fassen Anwender – aus Zeitgründen oder mangels geeigneter Merkmale – in<br />
einem Merkmal „Sonstige Informationen“ die wesentlichen Teile der Produktbeschreibung<br />
zusammen. Diese unstrukturierte Information, die oftmals viele (ggf. neue) Merkmale um-<br />
fasst, kann derzeit durch unsere Suchverfahren nicht erfasst werden. Hier ist eine natürlich-<br />
sprachliche Verarbeitung erforderlich sowie ggf. die Erweiterung des Klassifikationssystems<br />
um neue Merkmale.<br />
Die Tabelle 6 zeigt unter dem Merkmal "Sonstige Informationen" Einträge, die als einzel-<br />
ne Merkmale aufgeschlüsselt werden müssten.<br />
Unzulässige Merkmalswerte<br />
Die Qualität des Datenbestandes wird ebenfalls durch unzulässige Merkmalswerte verfälscht,<br />
wenn z. B. als Merkmalswerte Ausprägungen verschiedener Merkmale in ein Feld eingetra-<br />
gen werden. So ist ein häufiger Fehler die Preisangabe einer Maschine. Als Merkmale werden<br />
Preis und Währung angegeben, d. h. im Merkmal Preis soll der Betrag und in Währung die<br />
gültige Währung eingetragen werden. In der Regel wird der Betrag mit dem Währungszeichen<br />
eingetragen (z. B. Preis: 20.000 , Währung: ) und das Merkmal Währung bleibt unausgefüllt<br />
(richtig wäre: Preis: 20.000 , Währung: ). Bei der Suche würden beide Merkmale unbe-<br />
55
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
rücksichtigt bleiben, da das Merkmal Preis falsch, und das Merkmal Währung gar<br />
nicht ausgefüllt wurden.<br />
Tabelle 6: Merkmale mit den dazugehörenden Merkmalswerten<br />
4.3 Technische Architektur der Handelsplattform<br />
Beim Design der Architektur der Handelsplattform wurde eine Mehrschicht-Architektur ge-<br />
wählt, da bei einer Handelsplattform mit mehreren Clients parallel über das Internet auf einen<br />
Server zugegriffen werden kann. Eine Mehrschicht-Architektur besteht in der Regel aus fol-<br />
genden Teilschichten (siehe Abbildung 13).<br />
• Präsentationsschicht<br />
• Applikationsschicht<br />
• Datenhaltungsschicht mit Datenbankmanagement System (DBMS)<br />
56
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Abbildung 13: Mehrschicht-Architektur des Prototyps<br />
Die Präsentationsschicht gliedert sich in das Web-Frontend und das Betreiber-Frontend (Ad-<br />
ministrations-Frontend).<br />
Das Web-Frontend steht dem Kunden über TCP / IP mittels eines Browsers zur Verfügung.<br />
Das Betreiber-Frontend wird als eigenständige Anwendung zu Administrationszwecken auf-<br />
gerufen und kann ebenfalls mittels TCP / IP auf den Server zugreifen.<br />
Die Applikationsschicht besteht aus mehreren JAVA-Teilmodulen. Die Teilmodule aus der<br />
Applikationsschicht greifen auf spezielle Module der Datenhaltungsschicht zu, wo der Pro-<br />
dukt-Datenbestand hinterlegt ist.<br />
Die Abbildung 14 skizziert die Zuordnung der Module zu den einzelnen Schichten des Ar-<br />
chitekturmodells. Funktionsumfang und Realisierung der einzelnen Module werden im Fol-<br />
genden näher beschrieben.<br />
57
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
4.4 Datenhaltung<br />
58<br />
Abbildung 14: Komponentenansicht der 3-Schicht-Architektur<br />
Für die Speicherung (Haltung) der Daten (Klassifikationssysteme und Produktdaten) wurde<br />
die in 1.5 vorgestellte Datenstruktur als Datenmodell realisiert. Die Menge aller Maschinen<br />
und deren Klassifikationssysteme, die in einem XML-basierten Katalogdokument abgelegt<br />
werden, können in der Datenbank abgebildet werden. Dabei enthält das Datenmodell Entitäts-<br />
typen und Beziehungen, die ein redundanzfreies Ablegen und effizientes Abrufen der not-<br />
wendigen Daten ermöglichen. Zudem wurde das Datenmodell um Strukturen erweitert, die<br />
bei der Fuzzy-Suche benötigt werden.<br />
4.5 Import/ Export-Schnittstelle<br />
Die Vielzahl der verschiedenen Katalogformate (wie in 1.4 aufgezeigt), die in den verschie-<br />
denen Bereichen der Industrie ihren Einsatz finden, verlangt ein hohes Maß an Flexibilität bei<br />
den Import- und Exportschnittstellen von elektronischen Handelsbörsen.<br />
Als ein Ergebnis aus 1.4 wurde eine Schnittstelle zur Verarbeitung von XML-basierten Ka-<br />
talogdokumenten realisiert. Zur Zeit wird eine Vielzahl von XML-Dokumenten zur Übertra-<br />
gung von Daten zwischen den Handelsbörsen verwendet. Um diesen verschiedenen Formaten<br />
gerecht zu werden, sollte die Handelsbörse in der Lage sein, die verschiedenen Formate zu<br />
verarbeiten. Diese Flexibilität erfordert für die Verarbeitung von jedem Dokument einen ho-
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
hen Programmieraufwand. Um diese Anwendung zu realisieren wurde eine XML-Mapping-<br />
Struktur entwickelt, die genau die Abbildung der Daten aus dem Katalog in die Datenbank<br />
definiert. So können die verschiedenen XML-Katalogformate zum Einlesen der Daten in die<br />
Handelsbörse verwendet werden. Umgekehrt soll das Export-Tool aus der Handelsbörse ein<br />
durch den Betreiber definiertes und festgelegtes XML-Dokument erstellen können. Analog<br />
zum Import wurde auch hier eine Mapping-Struktur entwickelt, die zu jedem beliebigen<br />
XML-Katalogformat die Abbildung der Daten aus der Datenbank in die Struktur des ausge-<br />
wählten Katalogdokumentes definiert. Sowohl beim Export als auch beim Import wird die<br />
Erzeugung bzw. die Verarbeitung des XML-Katalogdokumentes durch das Mapping-<br />
Dokument gesteuert.<br />
Im Mapping-Dokument sind alle relevanten Informationen, die den Aufbau des verwende-<br />
ten XML-Formates als auch die Informationen der zugrunde liegenden Datenbank betreffen,<br />
hinterlegt. Damit können Import und Exportschnittstelle katalogformat- und datenbankunab-<br />
hängig Dateien verarbeiten. Die Abbildung 15 zeigt die schematische Darstellung der Import-<br />
/ Export-Schnittstelle mit dem Mapping-Dokument.<br />
Abbildung 15: Schematische Darstellung der Import- und Exportschnittstelle<br />
Beim Import der Daten in die Datenbank enthält das Mapping-Dokument für jede mit Daten<br />
zu füllende Tabelle einen Mappingabschnitt. Er ordnet einem Katalogelement die entspre-<br />
chende Zieltabelle zu. Die Reihenfolge, mit der Datenbanktabellen gefüllt werden sollen,<br />
muss zur Sicherstellung der referenziellen Integrität ebenfalls in diesem Dokument abgelegt<br />
werden.<br />
Die Realisierung der Import-Schnittstelle ist in [Mees 2001] genauer beschrieben. Derzeit<br />
stehen Mapping-Dokumente für die Verarbeitung von BMEcat- und xCBL-Produktkatalogen<br />
zur Verfügung.<br />
59
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
60<br />
Abbildung 16 zeigt eine Maske des Betreiber-Frontends, womit Parameter wie z. B. der<br />
Pfad zur Katalogdatei, der Pfad zum Mapping-Dokument, Passwörter und Benutzer der Da-<br />
tenbank usw. eingestellt werden.<br />
Abbildung 16: GUI des fertigen Import-Tools<br />
Die Export-Schnittstelle dient zur Erzeugung XML-basierter Produktkataloge mit den ent-<br />
sprechenden Klassifikations- und Produktdaten aus der Datenbank. Er wurde analog zu der<br />
Import-Schnittstelle realisiert. Auch hier entscheidet ein Mapping-Dokument über das Format<br />
des zu erzeugenden XML-basierten Produktkataloges. In Abhängigkeit von der Beschaffen-<br />
heit des Datenbestandes der Handelsbörse, des zu erzeugenden XML-Katalogformates und<br />
der Produktdaten, die in dem entsprechenden Katalogdokument dargestellt werden sollen,<br />
werden die Daten anhand der Regeln im Mapping-Dokument ausgelesen und in das ge-<br />
wünschte XML-Katalogformat gebracht (vgl. [Schürmann 2003]).<br />
4.6 Web-Frontend<br />
Das Web-Frontend wird in einem HTML-Browser dargestellt. Somit ist gewährleistet, dass<br />
die Kundenschnittstelle der elektronischen Handelsbörse für den Kunden, den Händler sowie
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
den Betreiber weltweit über das Internet abrufbar ist. Über das Web-Frontend werden die<br />
Standardfunktionen „stöbern“ oder „gezielt Suchen“, wie sie in den meisten Internet-<br />
Marktplätzen vorhanden sind, zur Verfügung gestellt. Auch wird dem Benutzer angeboten,<br />
die ausgewählten Produkte in ein Katalogformat seiner Wahl - wie z. B. BMEcat oder xCBL -<br />
zu exportieren.<br />
Das „Stöbern“ wird ermöglicht, indem dem Benutzer die gesamten Produkte der Börse in<br />
Kategorien angezeigt werden. Hierzu hat er die Möglichkeit, durch die Referenzhierarchie zu<br />
navigieren. Anschießend wird dem Benutzer eine Auswahlliste der in der Datenbank enthal-<br />
tenen Produkte angezeigt. Abbildung 17 zeigt mehrere Dropdown-Elemente, mithilfe derer<br />
„gestöbert“ werden kann.<br />
Abbildung 17: Benutzerschnittstelle „stöbern“-Funktion<br />
Eine weitere Möglichkeit ein Produkt zu finden ist die unscharfe oder auch fuzzyfizierte Su-<br />
che. Bei dieser Suchmöglichkeit gibt der Benutzer eine Menge von gesuchten Merkmalsaus-<br />
prägungen an. Mit Hilfe dieses entwickelten Suchverfahrens werden aus dem Angebot der<br />
elektronischen Handelsbörse die für den Kunden relevanten Produkte gefunden. Das Verfah-<br />
ren implementiert die in Kapitel 2 dargestellten Such- und Klassifizierungsstrategien. Jede<br />
vom Kunden formulierte Anfrage wird als XML-Datei serverseitig gespeichert und anschlie-<br />
ßend vom Queryprozessor der Fuzzy-Suchkomponenten für die Suche ausgewertet.<br />
Abbildung 18 zeigt einen Teil des Interfaces für das gezielte Suchen. Es können die für den<br />
Kunden relevanten Merkmale hinzugefügt werden. Anschließend können die gesuchten<br />
61
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Merkmalswerte eingegeben werden. In der Abbildung wurde als Drehzahlbereich(U/min) 100<br />
bis 1000 mit einer Gewichtung von 0,5 eingeben. Mittels der Radiobuttons fulfiled,<br />
comprised und exact kann nochmals bestimmt werden, in wie weit ein Anfragebereich<br />
mit dem Wertebereich des gesuchten Produktes übereinstimmen soll.<br />
62<br />
Bei Merkmalswerten, die keinen Bereich bilden, muss nur das erste Feld ausgefüllt wer-<br />
den, eine Ausfüllung der oberen Schranke bewirkt schon eine Fuzzyfizierung der Anfrage.<br />
4.7 Fuzzy-Modul<br />
Abbildung 18: Eingabemaske zu unscharfen Suche<br />
Die Fuzzy-Suchkomponente ist aus mehreren Teilmodulen aufgebaut. Alle Module zusam-<br />
mengefasst ergeben das Fuzzy-Modul.<br />
Im Folgenden wird jedes Teilmodul des Fuzzy-Moduls allgemein beschrieben werden.<br />
Abbildung 19 zeigt die funktionalen Abhängigkeiten der Teilmodule und ihre Abarbeitungs-<br />
reihenfolge.<br />
4.7.1 Indexprozessor<br />
Der Indexprozessor erstellt anhand der in der Datenbank enthaltenen Daten entsprechende<br />
Javaklassen und Objekte. Die Objekte sind mit den in der Datenbank enthaltenen Daten ge-<br />
füllt. Die Gesamtmenge dieser Objekte wird als Index bezeichnet. Somit werden die relevan-<br />
ten Daten (Produktgruppen, Produkte und deren Merkmale) im Hauptspeicher gehalten. An-<br />
schließend wird der Index mit Fuzzy-Objekten (die mit Fuzzy-Zugehörigkeitsfunktionen ge-<br />
füllt sind) erweitert, die später vom Fuzzyprozessor zur Fuzzyfizierung benutzt werden.
4.7.2 Queryprozessor<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Abbildung 19: Arbeitsweise der Hauptkomponenten des Fuzzy-Moduls<br />
Der Queryprozessor öffnet die von dem Web-Frontend erzeugte XML-Datei und liest sie kno-<br />
tenweise aus. Jeder Knoten entspricht dabei einem Element in der XML-Datei. Dabei werden<br />
alle Gruppen ausgelesen, sowie alle Merkmale mit den Merkmalswerten und die booleschen<br />
Ausdrücke, welche die Merkmale verknüpfen. Dann wird eine Anfrage-Datenstruktur erzeugt.<br />
Die Datenstruktur wird vom Queryprozessor folgendermaßen zur Verfügung gestellt:<br />
• Auflistung aller Maschinengruppen<br />
• Auflistung aller angefragten Merkmale<br />
• Rekursive Auflistung der eigentlichen Anfrage in Abhängigkeit der booleschen Operato-<br />
ren (vgl. Abbildung 8)<br />
Für die Merkmale werden in der Datenstruktur folgende Werte gespeichert:<br />
• Gewichtung des Merkmals<br />
• Alle zugehörigen Merkmalswerte<br />
In den booleschen Ausdrücken wird einer der booleschen Operatoren AND, OR, NOT, ID (ID<br />
für Identität) gespeichert, das Anfragegewicht des Ausdrucks und eine Liste seiner Operan-<br />
den. Die Operanden können Merkmale oder wiederum boolesche Ausdrücke sein. Außerdem<br />
werden verschiedene Parameter wie beispielsweise der Wert k (vgl. Abschnitt 2.2.5.2) ge-<br />
speichert. In Abbildung 20 ist der Ablauf einer Anfrage dargestellt. Die nicht zum Querypro-<br />
zessor gehörenden Komponenten sind schwarz eingefärbt.<br />
63
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
64<br />
Abbildung 20: Von der XML-Datei des Frontends zur einer Rangliste der Produkte<br />
4.7.3 Präprozessor<br />
Um den Suchraum einzuschränken, liefert der Präprozessor anhand der Suchanfrage die Pro-<br />
duktgruppen und Produkte an den Fuzzyprozessor, die für die eigentliche Suche relevant sind.<br />
Kriterium ist hier beispielsweise, ob die angefragten Merkmale in der Produktgruppe über-<br />
haupt vorkommen.<br />
4.7.4 Fuzzyprozessor<br />
Der Fuzzyprozessor bildet neben dem Rankingprozessor das Kernstück der Suche und be-<br />
rechnet für jeden angefragten Merkmalswert die Ähnlichkeit zu den hinterlegten Produktwer-<br />
ten. Der Fuzzyprozessor nutzt dabei die vom Indexprozessor im Index bereitgestellten Fuzzy-<br />
Zugehörigkeitsfunktionen in den Fuzzy-Objekten, um die Anfrage zu fuzzyfizieren. Jede Fuz-<br />
zy-Zugehörigkeitsfunktionen wiederum ist hierbei in Sektoren eingeteilt, welche aus primiti-<br />
ven Funktionen bestehen. Diese sind in der Datenhaltungsschicht hinterlegt und als Java-<br />
Methoden implementiert. Abbildung 21 zeigt eine Fuzzy-Zugehörigkeitsfunktion, die in vier<br />
Sektoren zerlegt ist. Jeder Sektor wird von einer primitiven Funktion dargestellt (ausgewählt<br />
aus 16 implementierten Funktionen).
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Abbildung 21: Funktionszerlegung am Beispiel der geglätteten Trapez-Funktion<br />
In Abbildung 22 ist zu sehen, wie die geglättete Senkenfunktion momentan in der Datenbank<br />
hinterlegt ist. Die Funktion setzt sich aus den vier Sektoren „Gerade“, „Exponential steigend<br />
II“, „Exponential fallend II“ und „Gerade“ zusammen.<br />
Abbildung 22: Modul „Funktionen definieren und bearbeiten“<br />
Jedem Merkmal im Index wird eine bestimmte Ausprägung einer Fuzzy-<br />
Zugehörigkeitsfunktionen zugeordnet.<br />
4.7.5 Rankingprozessor<br />
Das Modul „Rankingprozessor“ berechnet die Gesamtrelevanz der vom Fuzzyprozessor er-<br />
mittelten Merkmalsähnlichkeiten für ein Produkt und ordnet die Ergebnisse entsprechend die-<br />
ser Relevanz an. Hier können auch nachträglich vom Kunden die gefundenen Ergebnisse aus<br />
seiner Sicht bewertet werden. Anschließend wird der Suchvorgang anhand dieser Kriterien<br />
neu gestartet. Die Kriterien werden direkt an den Präprozessor übergeben. Dieser Vorgang<br />
wird als Relevance-Feedback bezeichnet.<br />
65
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
4.8 Betreiber-Frontend<br />
66<br />
Abbildung 23: Die vom Rankingprozessor sortierten Werte.<br />
Das Betreiber-Frontend dient zur Administration der verschiedenen Teilmodule sowie der<br />
Datenbank. Hierfür wurde ein modularer Aufbau der Software angestrebt, so dass die Soft-<br />
ware grob in zwei Bereiche unterteilt werden kann:<br />
1. Das Mainframe (Hauptfenster): Es stellt Grundfunktionalität zur Verfügung, wie<br />
Datenbankverbindung, Netzverbindung zum Webserver mit Servlet-Engine, die<br />
Darstellung des Klassifikationssystemss, sowie ein Auswahlmenü um weitere<br />
Funktionalitäten zu starten, die wiederum jeweils durch ein Teilmodul beschrieben werden<br />
können.<br />
2. Die Teilmodule: Sie enthalten die Funktionalität wie das Aus- und Abschalten des<br />
Webservers, die Pflege der Datenbank usw.<br />
Durch die Modularisierung in Teilmodule wird eine einfache und schnelle Erweiterung der<br />
Software erreicht. Die Module werden mit dem Auswahlmenü verknüpft und können zur<br />
Laufzeit dynamisch ausgetauscht werden.<br />
Der Betreiber kann die Komponenten des Systems nach seinen Wünschen steuern und Ein-<br />
stellungen vornehmen. Damit das Angebot der Handelsbörse erweitert werden kann, stehen<br />
Schnittstellen zur Verfügung (siehe Abschnitt 4.5), die Maschinen und ihre Merkmalsausprä-<br />
gungen in die Datenbank aufzunehmen können. Darüber hinaus können das bestehende An-<br />
gebot korrigiert oder einzelne Produkte gelöscht werden (Überprüfung / Verbesserung Daten-
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
qualität). Auch statistische Auswertungen sind möglich. Abbildung 24 zeigt das Hauptfenster<br />
des Betreiber-Frontends und die Untergliederung in sechs Bereiche:<br />
1. Navigation im Klassifikationssystem (4.8.1)<br />
2. Auswahlmenü Module (4.8.2)<br />
3. Modularbeitsfläche (4.8.3)<br />
4. Statusleiste (4.8.4)<br />
5. Menüleiste (4.8.5)<br />
6. Menübar (4.8.6)<br />
Abbildung 24: Die grafische Benutzerschnittstelle des Mainframes<br />
4.8.1 Navigation im Klassifikationssystem<br />
Mit Hilfe dieser Komponente der grafischen Benutzeroberfläche kann der Benutzer durch die<br />
Klassifikation navigieren. Beim Navigieren sieht er den Aufbau der Baumstruktur mit dessen<br />
Knoten, welche die Produktgruppen darstellen, alle Produkte einer Produktgruppe, sowie die<br />
Standardmerkmale einer Maschinenkategorie. Des Weiteren hat der Benutzer durch Selektion<br />
die Möglichkeit, die Vorgaben für Produktgruppen, Produkt und Merkmal festzulegen.<br />
Daneben befindet sich die Zwischenablage. Die Zwischenablage wird durch eine Contai-<br />
nerklasse realisiert. Diese ist in der Lage, Objekte, die mit der Maus dorthinein gezogen wer-<br />
den, aufzunehmen. Objekte können Produktgruppen, Produkte, Merkmale, Merkmalszuord-<br />
nungen und Merkmalsausprägungen sein. Die Daten sind durch die Zwischenablage innerhalb<br />
67
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
des Klassifikationssystems schnell kopier- und verschiebbar. Ziel und Quelle können die Na-<br />
vigationsleiste oder das aktuell ausgeführte Modul sein.<br />
4.8.2 Auswahlmenü „Module“<br />
Das Auswahlmenü gliedert und strukturiert die einzelnen Module zu Themenblöcken. Beim<br />
Doppelklick auf einen Moduleintrag im Auswahlmenü wird das entsprechende Modul aufge-<br />
rufen. Das Auswahlmenü wird aus der Datei "menu.ini" gelesen und ordnet die Module im<br />
Hauptspeicher dynamisch den Menüeinträgen zu. Dadurch ist es möglich, während der Lauf-<br />
zeit die Menüdatei zu ändern. Abhängig von der Menüdatei wird das Menü angezeigt.<br />
4.8.3 Modularbeitsfläche<br />
In diesem Bereich werden die Steuerelemente der jeweils ausgewählten Module angezeigt.<br />
4.8.4 Statusleiste<br />
Die Datenbankverbindung wird beim Start der Software aufgebaut. In der Statusleiste ist die<br />
Information über den Zustand der Datenbankverbindung durch einen grünen Haken (verbun-<br />
den) bzw. ein rotes Kreuz (getrennt) visualisiert. Weiterhin zeigt die Statusleiste Informatio-<br />
nen zur aktuellen SSH-Verbindung zwischen der Schnittstelle und dem Server an.<br />
4.8.5 Menüleiste<br />
Mit den Funktionen der Menüleiste lassen sich die Operationen innerhalb des Hauptfensters<br />
steuern. In der Menüleiste befinden sich Standardfunktionen wie Programmabbruch und Hil-<br />
fe. Zu finden ist hier auch eine Funktion, die es ermöglicht, die Zwischenablage zu leeren.<br />
4.8.6 Menübar<br />
Die wichtigsten Programmfunktionen sind hier für den Benutzer mit einem Mausklick abruf-<br />
bar. Dies sind im Einzelnen:<br />
1. Programmabbruch<br />
2. Gesicherte Verbindung zum Server herstellen (SSH)<br />
3. Datenbank-Verbindung herstellen<br />
4. Datenbank-Verbindung unterbrechen<br />
4.8.7 Dataverifiermodul<br />
Dieses Modul soll einen festgelegten Standard für verschiedene Datenformate überprüfen, um<br />
eine korrekte Verarbeitung zu gewährleisten. Dies ist beispielsweise beim Import von Daten,<br />
aber auch zur Unterstützung der allgemeinen Datenpflege relevant. Die Datenformate werden<br />
entsprechend dem Merkmalsleistenaufbau von eClass und der ISO 6093 bestimmt und in der<br />
Datenbank gespeichert. Das Dataverfiermodul wird vom Web-Frontend und vom Betreiber-<br />
Frontend immer dann genutzt, wenn Daten in die Datenbank geschrieben werden.<br />
68
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Tabelle 7 zeigt die aus ISO 6093 hinterlegten Datenformate für die zu überprüfenden Werte.<br />
Dabei müssen die Feldlängen der Datenwerte durch eine Nummer (z. B. 17) gekennzeichnet<br />
sein. Eine variable Feldlänge muss mit zwei Punkten, eine feste mit einem Leerzeichen be-<br />
ginnen (z. B. N 8-N 17 oder N..4 usw.)<br />
Tabelle 7: Auszug aus der Tabelle der hinterlegten Datenformate für die Werte<br />
Syntax Beschreibung ISO-Format Beispiel Datentyp<br />
N.. Wert darf nur aus Ziffern bestehen; N..4 1234 Int<br />
max. Ziffern; 123<br />
muss ganze Zahl sein; 12<br />
N Wert darf nur aus Ziffern bestehen; N 4 1234 Int<br />
genau Ziffern;<br />
muss ganze Zahl sein;<br />
N -N Wert darf nur aus Ziffern bestehen; N 4-N 8 1234 Int<br />
X.1<br />
X..<br />
4.8.8 Statistikmodul<br />
min. Ziffern , max. Ziffern; 12345<br />
und müssen ganze Zahlen sein; 12345678<br />
Wert darf nur aus einem j (für JA) oder n (für<br />
X.1 j,J boolean<br />
Nein) bestehen.<br />
Wert ist ein boolescher Wert. n,N<br />
Wert darf aus Ziffern und Buchstaben beste-<br />
X..4 AB12 String<br />
hen:<br />
max. Zeichen; ab<br />
muss ganze Zahl sein; abc<br />
Das Statistikmodul wertet die im Betreiber- oder Web-Frontend ausgewählten Teile des Da-<br />
tenbestandes statistisch aus. Ausgehend vom Wurzelknoten (root) der Datenbank werden zu<br />
jeder weiteren Produktgruppe die folgenden Daten ermittelt.<br />
• Produktgruppennummer<br />
• Produktgruppenbezeichnung<br />
• Ebene<br />
• Anzahl der nachfolgenden Produktgruppen<br />
• Anzahl der nachfolgenden Produktgruppen auf Blattebene<br />
• Anzahl der darunter liegenden Produkte<br />
• Ist diese Produktgruppe ein Blatt oder nicht?<br />
• Die durchschnittliche Anzahl von Produkten in den darunter liegenden Produktgruppen<br />
69
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
Handelt es sich bei einer Produktgruppe um ein Blatt, sind noch folgende Informationen von<br />
Interesse:<br />
• Anzahl der Merkmale des Blattes<br />
• Anzahl der an dem Blatt hängenden Produkte<br />
• Die durchschnittliche Anzahl von gepflegten Merkmalen der anhängenden Produkte<br />
Für jedes Merkmal des Blattes wird die Häufigkeit ermittelt, wie oft die Ausprägung in den<br />
anhängenden Produkte gepflegt ist.<br />
4.8.9 Statistik-Export<br />
70<br />
Abbildung 25: Anzeige der vom Statistikmodul ermittelten Werte<br />
Darüber hinaus wurde für den Export der statistisch ausgewerteten Daten eine Lösung reali-<br />
siert, welche die Daten in Excel grafisch aufbereitet. Dazu wurde ein Tool entwickelt, das die<br />
vom Statistikmodul ermittelten Werte in eine csv-Datei schreibt. Abbildung 26 zeigt ein auf<br />
diesen Daten basierendes Diagramm.
Anzahl der Produkte<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
0<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Die 10 Produktgruppen mit den meisten Produkten<br />
255 246<br />
228<br />
206<br />
185 179 167 165 163 161<br />
Abbildung 26: Grafische Visualisierung der exportierten Statistikdaten<br />
71
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
5 Integration von Komponenten in den omeco ® webshop<br />
Mit machinerytrade.net stellte der Partner omeco ® GmbH dem Projekt die Technologie einer<br />
Handelsplattform für gebrauchte Maschinen zur Verfügung. In der ursprünglichen Planung<br />
war vorgesehen, diese Handelsbörse als Ausgangspunkt für die Realisierung der Handelsbör-<br />
se für gebrauchte Maschinen zu nutzen und darin die in diesem Projekt entwickelten Kompo-<br />
nenten zu integrieren. Nach intensiver Analyse dieser Plattform stellte sich jedoch im Verlauf<br />
des Projektes heraus, dass eine Integration der entwickelten Komponenten in diese php-<br />
basierte Plattform nicht gut durchführbar ist. Die Plattform von omeco ® GmbH genügt bei-<br />
spielsweise nicht den im Abschnitt 1.2 formulierten zentralen Anforderungen an Klassifikati-<br />
onssysteme. Eine Integration hätte so eine weitgehende Neu- bzw. Umstrukturierung von ma-<br />
chinarytrade.net bedeutet. Deshalb wurde beschlossen mit den gewonnenen Erfahrungen eine<br />
eigene prototypische Plattform zu realisieren (<strong>mtrade</strong>).<br />
72<br />
Es wurde jedoch im Rahmen der Kooperation mit der omeco ® GmbH die Wiederverwend-<br />
barkeit und Flexibilität der in diesem Projekt entwickelten Softwarekomponenten analysiert<br />
und bewertet. Hierzu wurde die in Abschnitt 4.5 beschriebene Export-Schnittstelle, die als<br />
eigenständige Komponente realisiert wurde, in das Produkt webshop, ein Online-Shopsystem<br />
der omeco ® GmbH, integriert. Durch die objektorientierte Realisierung der Export-<br />
Schnittstelle konnte die Integration problemlos in die serverseitigen Komponenten des web-<br />
shops erfolgen. Vorteile für den omeco ® webshop sind:<br />
• Da die Export-Schnittstelle bei der Verwendung des entsprechenden Mapping-<br />
Dokumentes jedes beliebige XML-basierte Katalogformat erstellen kann, ist die Erzeu-<br />
gung des Produktkataloges im webshop nicht mehr nur auf die Darstellung des BMEcat-<br />
Kataloges beschränkt. Mit dem entsprechenden Mapping-Dokument ist aus dem webshop<br />
heraus jedes beliebige XML-basierte Katalogdokument erzeugbar.<br />
• Umfang und Struktur des Katalogdokumentes (d. h. die Erzeugung der gewünschten Kata-<br />
log-Tags) und ist nicht implementierungsabhängig, sondern wird im wesentlichen durch<br />
das Mapping-Dokument definiert. Auch können Daten aus verschiedenen Datenbank-<br />
schemata verarbeitet werden.<br />
• Spezielle Anforderungen des Shops können durch die Verwendung und Verarbeitung von<br />
benutzerdefinierten Funktionen realisiert werden.<br />
Weitere Einsatz- bzw. Erweiterungsmöglichkeiten sind angedacht und werden von der ome-<br />
co ® GmbH selbst vorgenommen. Abbildung 27 zeigt schematisch die Erzeugung von Kata-<br />
logdokumenten aus dem Firmenprodukt heraus.<br />
Die Integration der Export-Schnittstelle hat gezeigt, dass die bei Entwurf und Entwicklung<br />
der Software-Komponenten zugrunde gelegten Ziele wie Anpassbarkeit und Wiederverwend-<br />
barkeit erreicht wurden und somit eine weitergehender Verwertbarkeit unterstützen.
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Abbildung 27: Integration der Export-Schnittstelle in omeco ® webshop<br />
73
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
6 Voraussichtlicher Nutzen und Verwertbarkeit<br />
Die entwickelten Komponenten dienen als technologische Basis zur Realisierung von elektro-<br />
nischen Marktplätzen. Die theoretischen und praktischen Ergebnisse wurden auf einschlägi-<br />
gen Konferenzen veröffentlicht.<br />
74<br />
Wie in Kapitel 5 aufgezeigt, konnte eine direkte Verwertbarkeit unserer Ergebnisse bei<br />
dem Projektpartner omeco ® GmbH realisiert werden. Die Export-Schnittstelle wurde erfolg-<br />
reich in den webshop integriert und mit Hilfe des Mapping-Dokumentes können BMEcat-<br />
konforme Katalogdokumente erzeugt werden. Je nach Kundenanforderung können weitere<br />
XML-basierte Katalogformate ohne Programmieraufwand durch Erstellung eines Mapping-<br />
Dokumentes erzeugt werden.<br />
Die Ergebnisse des Projektes wurden u.a. im Rahmen der Messen CeBIT 2002 und CeBIT<br />
2003 und bei internen Fachtagungen präsentiert. Dabei ergaben sich verschiedene Kontakte<br />
zu Firmen, die Lösungen zu Fragestellungen in anderen Problembereichen suchten und die<br />
mit den Techniken, die im Projekt entwickelt wurden, angegangen werden können. Dies be-<br />
trifft vor allem die Verfahren und Tools zur heuristischen Suche. Drei Fragestellungen wer-<br />
den im folgenden kurz erläutert:<br />
1. Automatisierte Klassifikation von Produkten, z. B. beim Eintrag in die Datenbasis des<br />
Marktplatzes oder bei der Suche nach komplexen Produkten: Hier können die<br />
heuristischen Suchverfahren mit den fuzzybasierten Ähnlichkeitsmaßen den Benutzer<br />
durch Klassifikationsvorschläge unterstützen. Für diese Aufgabe suchen wir derzeit einen<br />
geeigneten Anwender im Bereich der Maschinenbaufertigung oder einen Großhändler, der<br />
Produkte mit einer großen Anzahl von Varianten anbietet (z. B. im Bereich elektronischer<br />
Bauteile).<br />
2. Konfiguration von Produkten oder Prozessen: Einige Firmen verfügen über immense<br />
Datenbestände, die Informationen über eine Vielzahl von Parametern zu bereits gefertigten<br />
Produkten enthalten, und die Qualität und Effizienz des Herstellungsprozesses<br />
entscheidend beeinflussen. Die Parameter sind teils von außen vorgegeben, teils direkt<br />
beeinflussbar, wie z. B. Maschineneinstellungen. Bei einem neuen Auftrag sollen die<br />
besten Parametereinstellungen für einen Auftrag aus der Datenbasis bestimmt werden.<br />
Dieser Auswahlprozess kann vermutlich durch den Einsatz der heuristischen<br />
Suchverfahren mit den fuzzybasierten Ähnlichkeitsmaßen unterstützt werden. In diesem<br />
Zusammenhang stehen wir momentan in einer Diskussion mit einer Firma zur Produktion<br />
von Wurstwaren.<br />
3. Automatische Parametrisierung des heuristischen Suchverfahrens: Der Einsatz der<br />
Suchverfahren verlangt derzeit eine manuelle Festlegung einer Vielzahl von Parametern.<br />
Diese Parametrisierung ist aufwändig und nur mit Expertenwissen aus dem<br />
Anwendungsbereich durchzuführen. Eine Festlegung der Parameter über automatische
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Lernverfahren würde den Aufwand erheblich reduzieren. Die Entwicklung solcher<br />
Lernverfahren wird sowohl mit der Firma omeco ® GmbH als auch mit anderen<br />
Unternehmen angegangen.<br />
Für die entwickelten Verfahren und Komponenten werden den Partnern die notwendigen An-<br />
passungsarbeiten über die entstehenden Personentage berechnet. Die Nutzung der Komponen-<br />
ten an sich wird über Lizenzen geregelt. Neben einer Basislizenz, die den Im- und Export von<br />
Produkten ermöglicht, bieten wir den Partnern die Komponente zur Produktsuche in verschie-<br />
denen Stufen an. Die Kosten der Lizenzen richten sich nach dem Umfang der Parametrisie-<br />
rungsmöglichkeiten und nach der Größe des Marktplatzes gemessen in der Anzahl der ange-<br />
botenen Produkte.<br />
75
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
7 Verwendete aktuelle Forschungsergebnisse<br />
Die wachsende Bedeutung der elektronischen Beschaffungssysteme im B2B E-Business führ-<br />
te zur Entwicklung von XML-Standards speziell für den Datenaustausch. Dabei liegt der Fo-<br />
kus nicht nur auf standardisierten Geschäftsdokumenten, sondern auch in der Entwicklung<br />
von Taxonomien für die in den Dokumenten beschriebenen Geschäftsobjekte. Dabei spielt die<br />
standardisierte Beschreibung von Produkten und Dienstleistungen eine immer stärkerer Rolle.<br />
Produktklassifikationssysteme, die jedes einzelne Produkt klassifizieren und zum Teil in Ab-<br />
hängigkeit von Produktklassen die produktbeschreibenden Merkmale vorgeben, übernehmen<br />
diese Aufgabe. Aber ebenso wenig, wie es einen allgemein akzeptierten XML-Standard für<br />
Geschäftsdokumente gibt, so wird sich auch bei den bereits existierenden Klassifikationssys-<br />
temen in nächster Zeit kein alleiniges Klassifikationssystem weltweit und branchenübergrei-<br />
fend durchsetzen. Vielmehr existiert, wie in Abschnitt 1.3 gezeigt, eine Vielzahl von Klassifi-<br />
kationssystemen, die sich inhaltlich und strukturell unterscheiden. Die Folge ist, dass nicht<br />
nur Geschäftsdokumente, sondern auch zunehmend die dazugehörenden Klassifikationssys-<br />
teme Gegenstand der elektronischen Übertragung werden. Die Marktteilnehmer benötigen die<br />
Informationen über die verwendeten Klassifikationssysteme, um die überlieferten Produktda-<br />
ten klassifizieren und finden zu können.<br />
76<br />
Bisher fehlte jedoch ein Modell, das Klassifikationssysteme allgemeingültig beschreibt und<br />
für deren elektronische Übertragung genutzt werden kann. An der Universität Essen wurde<br />
aus der Diskussion der Gestaltungsaspekte von Klassifikationssystemen ein Referenzmodell<br />
als XML-Schema entwickelt. Dieses Referenzmodell kann für die Systemübertragung ver-<br />
wendet werden und somit als Erweiterung in Katalogstandards aufgenommen werden. Die<br />
Entwicklung, Modellierung und Spezifikation dieses Modells und eine empirische Analyse<br />
sind in [Leukel et al. 2002] nachzulesen.
8 Veröffentlichungen<br />
8.1 Veröffentlichungen der Projektergebnisse<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
• Krieger, Rolf; Kuhn, Norbert; Mees, Michael; Naumann, Stefan; Schürmann, Cordula;<br />
Sommer, Christian: Verwendbarkeit von Klassifikationssystemen und Katalogstandards<br />
zum Aufbau von elektronischen Handelsbörsen für gebrauchte Maschinen. In: Weinhardt,<br />
Christof; Holtmann, Carsten (Hrsg.): E-Commerce: Netze, Märkte, Technologien. Physi-<br />
ca-Verlag, Heidelberg, September 2002<br />
• Krieger, Rolf; Kuhn, Norbert; Naumann, Stefan; Schürmann, Cordula; Sommer, Chris-<br />
tian: XML-based Product Catalogues, Product Classification Systems and their Suitability<br />
for Electronic Market Places. In: The 7th World Multi Conference on Systemics, Cyber-<br />
netics and Informatics (SCI), Orlando, August 2003<br />
• Naumann, Stefan: Information Systems for Virtual Communities with Ecological Focus.<br />
In: The 7th World Multi Conference on Systemics, Cybernetics and Informatics (SCI),<br />
Orlando, August 2003<br />
• Naumann, Stefan: Supporting Customer Cooperation to Promote Sustainable Develop-<br />
ment. In: Ramsower, Reagan; Windsor, John; DeGross, Janice I. (ed.): Proceedings of the<br />
Eighth Americas Conference on Information Systems. Association for Information Sys-<br />
tems, Dallas, Texas, August 2002<br />
• Naumann, Stefan; Krieger, Rolf; Kuhn, Norbert; Schürmann, Cordula; Sommer, Christi-<br />
an: Such- und Klassifizierungsstrategien in elektronischen Produktkatalogen. In: Uhr,<br />
Wolfgang; Esswein, Werner; Schoop, Eric (Hrsg.): Wirtschaftsinformatik 2003. Medien,<br />
Märkte, Mobilität. Band I. Physica-Verlag, Heidelberg, September 2003<br />
• Naumann, Stefan; Krieger, Rolf; Kuhn, Norbert; Schürmann, Cordula; Sommer, Christi-<br />
an: Adaption von Information Retrieval-Verfahren zur automatisierten Produktsuche und -<br />
klassifikation. In: Dittrich, Klaus; König, Wolfgang; Oberweis, Andreas; Rannenberg,<br />
Kai; Wahlster, Wolfgang (Hrsg.): Informatik 2003. Innovative Informatikanwendungen<br />
Band 2. Lecture Notes in Informatics (LNI), Volume P-35, Bonn, Oktober 2003<br />
• Naumann, Stefan; Krieger, Rolf; Kuhn, Norbert; Schürmann, Cordula; Klassifikationssys-<br />
teme und Katalogformate für elektronische Handelsbörsen von Gebrauchtwaren. Techni-<br />
scher Bericht, <strong>Umwelt</strong>-<strong>Campus</strong> <strong>Birkenfeld</strong>, September 2003<br />
8.2 Studentische Arbeiten im Rahmen des Forschungsprojektes<br />
• Michael Arm: Entwicklung, Evaluierung und Bewertung von Information Retrieval Ver-<br />
fahren für elektronische Handelsbörsen, 2003<br />
77
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
• Christian Bohn: Softwaredokumentation <strong>mtrade</strong>Statistics, 2002<br />
• Michaela Gutmann: Analyse von Problemen der Datenqualität in datenbankgestützten<br />
78<br />
elektronischen Produktkatalogen und Entwicklung von Lösungsansätzen, 2003<br />
• Frank Heylmann, Oliver Glöckner, Martin Scholtes: Fuzzy-Prozessor: Implementierung<br />
von Zugehörigkeitsfunktionen in Java, 2003<br />
• Frank Heylmann, Implementierung von Benutzerschnittstellen für eine elektronische<br />
Handelsbörse, 2003<br />
• Oliver Küssner: Softwaredokumentation Dataverifier, 2002<br />
• Michael Mees: Entwurf eines Datenmodells und einer XML- basierten Schnittstelle für<br />
eine elektronische Handelsbörse, 2002<br />
• Erik Naumann: Generierung von Java-Klassen zur Abbildung von Datenbankschemata im<br />
Hauptspeicher, 2003<br />
• Stefan Richter: Implementierung der Erweiterten Booleschen Suche für das Produkt-<br />
Retrieval, 2002<br />
• Rui Pinto Guimarães: Natural Language Interface for the <strong>mtrade</strong> Project, 2002
9 Ausblick auf zukünftige Forschungsvorhaben<br />
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
Die Projektergebnisse werden in kommenden Forschungsprojekten, die bereits laufen oder in<br />
der Startphase sind, genutzt. Insbesondere können Ergebnisse und Erkenntnisse aus folgenden<br />
Bereichen verwendet werden:<br />
1. Wissen über die Anwendungsdomäne<br />
2. Klassifikationssysteme und Produktkataloge<br />
3. Fuzzybasierte Suche und Lernverfahren<br />
Zum ersten Punkt wollen wir die Verallgemeinerung der Ergebnisse über Gebrauchtgüter hin-<br />
aus mit einem Partner aus dem Bereich des Maschinen- und Werkzeugbaus untersuchen. Ins-<br />
besondere der Bereich „Ersatzteile“ verspricht aufgrund seiner Variantenhäufigkeit mit zahl-<br />
reichen Merkmalen Anwendungsmöglichkeiten sowohl im Klassifikations- als auch im Ret-<br />
rieval-Bereich.<br />
Zum zweiten wollen wir das von uns entwickelte generische Klassifikationssystem mit<br />
seinen gekoppelten elektronischen Produktkatalogen auf andere Anwendungsdomänen über-<br />
tragen. Zur Zeit wird in Zusammenarbeit mit dem Institut für Stoffstrommanagement (IfaS)<br />
unter Auftrag des Ministeriums für <strong>Umwelt</strong> und Forsten Rheinland-Pfalz ein erstelltes Bio-<br />
massekataster systematisiert und internetfähig aufbereitet, ergänzend flankiert durch eine<br />
Handelsbörse. Die verschiedenen Stoffgruppen der einzelnen Biomassen stellen dabei die<br />
Referenzhierarchie des merkmalsbasierten Klassifikationssystems dar, die einzelnen Potenzia-<br />
le bzw. Angebote/Nachfragen entsprechen den Produkten. Auch im Bereich der Sammlung<br />
von Meta-<strong>Umwelt</strong>daten – hier führen wir im Auftrag des saarländischen <strong>Umwelt</strong>ministeriums<br />
den <strong>Umwelt</strong>datenkatalog (UDK) ein – lassen sich die Erkenntnisse merkmalsbasierter Klassi-<br />
fikationssysteme anwenden und vertiefen.<br />
Drittens planen wir die Anwendung des von uns entwickelten fuzzybasierten Suchverfah-<br />
rens für die allgemeine Produkt- und Dienstleistungssuche. Da sich das Verfahren vielseitig<br />
anwenden lässt, sofern die zu suchenden Objekte eine gewisse Struktur aufweisen und durch<br />
Merkmale beschrieben sind, möchten wir (empirisch und durch Lernverfahren gestützt) all-<br />
gemeine Methoden entwickeln, um das Wissen einer Anwendungsdomäne in Zugehörigkeits-<br />
und Rankingfunktionen zu kodieren.<br />
79
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
III Literaturverzeichnis<br />
[Arens et al. 2002] Arens, Andreas; Bläsius, Karl Hans (2002) Projekt INFOX-I,<br />
80<br />
Zwischenverwendungsnachweis, Fachhochschule Trier.<br />
[AWF-Ausschuss für Wirtschaftliche Fertigung e.V. 1990] AWF-Ausschuss für<br />
Wirtschaftliche Fertigung e.V. (1990): Schriften, Betriebsmittelkarten, Vordrucke.<br />
Eschborn/Taunus<br />
[Bergmann et al. 2002] Bergmann, R., Schmitt, S., Stahl, A. (2002). Intelligent customer<br />
support for product selection with case-based reasoning. E-Commerce and Intelligent<br />
Methods, Physica-Verlag.<br />
[Bleymüller et al. 1996] Bleymüller, Josef; Gehlert, Günther; Gülicher, Herbert (1996):<br />
Statistik für Wirtschaftswissenschaftler. Verlag Franz Vahlen, München, 10. Auflage.<br />
[BME 2002] Bundesverband Materialwirtschaft, Einkauf und Logistik (2002): BMEcat 1.2,<br />
http://www.bmecat.org/, Abruf am 12. Februar 2002<br />
[Commerce One 2002] Commerce One (2002): xCBL 3.0, http://www.xcbl.org/, Abruf am<br />
22. April 2002<br />
[cXML 2002] http://www.cxml.org/, Abruf am 22. April 2002<br />
[DIN 1998] DIN Deutsches Institut für Normung e.V. (1998): Grundlagen für den Aufbau<br />
eines Merkmal-Lexikons. Beuth Verlag, Berlin<br />
[DIN 2002] Deutsches Institut für Normung e.V. (2002): Optimierung elektronischer<br />
Geschäftsprozesse - Neuer Arbeitskreis 'Produktklassifikation und -merkmale'<br />
entwickelt umfassendes Konzept, Mitteilung vom 13. Dezember 2002 auf<br />
http://www.din.de, Abruf am 23. Januar 2003<br />
[DIN 8580 1974] Deutsches Institut für Normung (1974): DIN 8580, Ausgabe:1974-06<br />
[DIN EN 61360-1 1996] Deutsches Institut für Normung (1996): DIN EN 61360-1,<br />
Ausgabe:1996-01<br />
[DoveBid Inc. 2002] DoveBid® to conduct webcast auction for nextcard, Inc, Abruf<br />
7.12.2003, http:// www.dovebid.com<br />
[ECCMA 2002] Electronic Commerce Code Management Association (ECCMA) (2002<br />
http://www.eccma.org/unspsc/,<br />
[EMO] EMO, Messe für Metallverarbeitung, ausgerichtet von der Deutschen Messe AG,<br />
http:://www.messe.de<br />
[ETIM 2002] ETIM Deutschland e.V., Köln, http://www.etim.de, Abruf am 22. April 2002<br />
[FDM 2002] Fachverband des Deutschen Maschinen- und Werkzeug-Großhandels e.V.<br />
(FDM) (2002): Düsseldorf, http://www.machinestock.com/, Abruf am 22. April 2002<br />
[Fleckenstein 2002] Fleckenstein Werkzeugmaschinen GmbH, Wiesen,<br />
http://www.fleckenstein-machine-tools.de/, Abruf am 22. April 2002<br />
[Forrester Research 2002] Forrester Research, http://www.forrester.com, Abruf am 22. April<br />
2002
Abschlussbericht „Intelligente Handelbörsen für Gebrauchtwaren“<br />
[Fuhr 2000] Fuhr, Norbert (2000): Models in Information Retrieval, Veröffentlichung der<br />
Universität Dortmund<br />
[Grauel 1995] Grauel, Adolf (1995): Fuzzy-Logic. Einführung in die Grundlagen mit<br />
Anwendungen. BI Wissenschaftsverlag, Mannheim<br />
[Institut der deutschen Wirtschaft Köln 2002] Institut der deutschen Wirtschaft Köln (2002):<br />
eCl@ss 4.0, http://www.eclass.de/, Abruf am 22. April 2002<br />
[Internationale Normenklassifikation 1995] Internationale Normenklassifikation –<br />
International Classification for Standards (ICS), Ausgabe Juli 1995 – Berlin, Beuth<br />
[Krieger et al. 2002] Krieger, Rolf; Kuhn, Norbert; Mees, Michael; Naumann, Stefan;<br />
Schürmann, Cordula; Sommer, Christian (2002): Verwendbarkeit von<br />
Klassifikationssystemen und Katalogstandards zum Aufbau von elektronischen<br />
Handelsbörsen für gebrauchte Maschinen. In: Weinhardt, Christof; Holtmann, Carsten<br />
(Hrsg.): E-Commerce: Netze, Märkte, Technologien. Physica-Verlag, Heidelberg<br />
[Leukel et al. 2002] Leukel, Jörg; Schmitz, Volker; Dorloff, Frank-Dieter (2002):<br />
Referenzmodell für den Austausch von Produktklassifikationssystemen im E-Business.<br />
In: Loos, Peter; Gronau, Norbert (Hrsg.): E-Business - Integration industrieller ERP-<br />
Architekturen. Cuvillier Verlag, Göttingen<br />
[Machinestock 2003] http://www.machinestock.com/, Abruf am10.Oktober 2003<br />
[Mees 2001] Mees, M., (2001):Entwurf eines Datenmodells und einer XML-basierten<br />
Schnittstelle für eine elektronische Handelsbörse. Diplomarbeit an der Fachhochschule<br />
Trier, Standort <strong>Birkenfeld</strong><br />
[Naumann et al. 2003] Naumann, Stefan; Krieger, Rolf; Kuhn, Norbert; Schürmann, Cordula;<br />
Sommer, Christian: Such- und Klassifizierungsstrategien in elektronischen<br />
Produktkatalogen. Veröffentlichung im September 2003 im Rahmen der 6.<br />
Internationale Tagung Wirtschaftsinformatik 2003, Dresden<br />
[Ogawa et al. 1991] Ogawa, Yasushi; Morita, Tetsuya; Kobayashi, Kiyohiko (1991): A fuzzy<br />
document retrieval system using the keyword connection matrix and a learning method.<br />
In: Fuzzy Sets and Systems 39:163-179.<br />
[openTRANS-Expertenkreis 2002] openTRANS-Expertenkreis, http://www.opentrans.org,<br />
Abruf am 22. April 2002<br />
[Otto, B. und Beckmann, H. 2001] Otto, B. und Beckmann, H. (2001): Klassifizierung und<br />
Austausch von Produktdaten auf elektronischen Marktplätzen. In: Wirtschaftsinformatik<br />
43 Nr. 4, S.351 – 361<br />
[PricewaterhouseCoopers 2002] PricewaterhouseCoopers Unternehmensberatung GmbH<br />
(2002): Der effektive Einsatz von elektronischen Produktkatalogen / Wesentlicher<br />
Erfolgsfaktor für E-Procurement-Projekte. Düsseldorf<br />
[Resale 2003] Resale, http://www.resale-messe.de, Abruf am 20. Februar 2004<br />
[Ribeiro-Neto/Baeza-Yates 1999] Ribeiro-Neto, Berthier; Baeza-Yates, Ricardo (1999):<br />
Modern Information Retrieval. Addison-Wesley, Harlow 1999<br />
81
Institut für Softwaresysteme in Wirtschaft, <strong>Umwelt</strong> und Verwaltung<br />
[Rijsbergen 1979] van Rijsbergen, Cornelis J. (1979): Information Retrieval., Butterworths<br />
[Salton 1971] Salton, Gerald (ed.) (1971): The SMART Retrieval System - Experiments in<br />
82<br />
Automatic Document Processing. Prentice Hall, Englewood, New Jersey<br />
[Salton et al. 1983] Salton, Gerard; Fox, Edward A.; Wu, Harry (1983): Extended Boolean<br />
Information Retrieval. In: Communications of the ACM 26(11), 1022-1036, 1983<br />
[Salton/McGill 1983] Salton, Gerald; McGill, Michael J. (1983): Introduction to Modern<br />
Information Retrieval. McGraw Hill Publications<br />
[Schürmann 2003] Schürmann, C., (2003): Dokumentation Export-Tool. Fachhochschule<br />
Trier, Standort <strong>Birkenfeld</strong><br />
[Surplex AG 2002] Surplex AG, Düsseldorf, http://www.surplex.com, Abruf am 22. April<br />
2002<br />
[Trade & Contact Verlag] Trade & Contact Verlag Rheinstraße 46, 12161 Berlin<br />
[UNSPSC 2002] Universal Standard Products and Services Classification (UNSPSC),<br />
http://www.un-spsc.net, Abruf am 22. April 2002<br />
[Walter Kames GmbH 2002] Walter Kames GmbH, Düsseldorf, http://www.kames.de, Abruf<br />
am 22. April 2002<br />
[XLcontent GmbH 2003] XLcontent GmbH: http://www.katalogmanager.de, Abruf am 19.<br />
Februar 2003<br />
[Zadeh 1965] Zadeh, Lotfi (1965): Fuzzy sets. Information Control 8, 338-353