Erstellung und semantische Annotation von Dokumenten auf Basis automatisch extrahierter Webdaten

Topic
Type: 
Master Thesis
Supervisor: 
Jürgen Dorn
Description: 
In der Arbeit sollen für das Call-Center der Österreich Werbung Dokumente für die Wissensbasis erzeugt werden. Diese Dokumente (PDF, DOC oder andere Formate) entstehen durch die Extraktion und Integration von semi-strukturierten Daten aus Internetseiten wobei die Dokumente nach unterschiedlichen Kriterien gestaltet bzw. gefiltert werden. Die Dokumente werden mit Hilfe von Begriffen aus einer oder mehreren Ontologien annotiert, um eine spätere Suche in der wissensbasis zu unterstützen.
Language: 
Deutsch
State: 
completed
Issued: 
09.10.2006
Student
First name: 
Markus
Last name: 
Bauer
Started: 
01.11.2006
Result
Abstract: 
Unternehmensinterne Wissensquellen beinhalten in der Regel nur eine begrenzte Menge an Informationen. Die Konsequenz daraus ist, dass der Bedarf an Informationen das tatsächliche Angebot an Informationen übersteigt. In diesem Fall kann nur eine zusätzliche Suche in einer umfangreicheren Informationsquelle, wie dem Internet, den notwendigen Bedarf decken. Einsparungspotential ergibt sich, wenn derartige Recherchen reduziert werden können indem zusätzliche relevante Informationen bereichts im Vorfeld in einem Dokument gebunden werden. Ziel dieser Arbeit ist die Erzeugung neuer Dokumente für die Wissensbasis der Österreich Werbung zur Unterstützung des Call Centers bei Anfragen. Das System ermöglicht die Auswahl unterschiedlicher Informationen aus verschiedenen Internetquellen, die für den Inhalt der Dokumente herangezogen werden. Diese werden generiert indem die semi-strukturierte Daten aus den einzelnen Internetseiten extrahiert und in dem Dokument zusammengefügt werden. Zusätzlich soll eine Annotation der Dokumente mit Begriffen aus einer Ontologie eine effiziente Suche in der Wissensbasis ermöglichen.
Finished: 
15.11.2007