Semiautomatische Firmendatenbank

Auf einen Blick

Projektleiter/in: Prof. Dr. Alexandre de Spindler

Projektteam: Fatih Uzdili, Mark Cielieback, John Brush, Prof. Dr. Alexandre de Spindler

Projektbeginn: 01.01.2014

Kurzdarstellung

Eine Datenbank zu betreiben, welche Informationen zu Firmen, deren Dienstleistungen und Produkte bereithält birgt einige Herausforderungen. Zum Beispiel müssen als erstes genügend Firmen eingetragen werden, damit andere Firmen den Wert solch einer Datenbank erkennen können und folglich beginnen, sich selber zu erfassen. Diese Grundmenge kann vom Betreiber selber eingetragen werden, was jedoch viel Aufwand bedeutet. Eine weitere Herausforderung liegt darin, die erfassten Informationen aktuell zu halten.
In diesem Projekt wurden Konzepte ausgearbeitet und prototypisch implementiert, welche als Grundlage zur marktreifen Produktion gedient haben. Unter anderem wurde ein System entworfen, mit dem beliebige Datenquellen eingebunden und automatisch gecrawled und deren Information extrahiert werden kann. Dazu wurde ein flexibler Prozessmechanismus entworfen, mit dem solche automatisch gefundene Information geführt geprüft, korrigiert und von mehreren Parteien bestätigt werden kann. Zudem ermöglicht es dieses System dem Betreiber, die Profileigenschaften, welche beim Suchen und Anzeigen verwendet werden zu konfigurieren. Für den darunterliegenden Datenkomponente wurde ein flexibler Versionierungsmechanismus entworfen, mit dem alle Versionierungsaspekte (Versionierung über die Zeit, Versionierung über alternative Informationsquellen, Versionierung über unterschiedliche Schritte im Verarbeitungsprozess) uniform behandelt werden können.