Assoziationsregel-Algorithmen für Daten mit komplexer Struktur

Assoziationsregel-Algorithmen für Daten mit komplexer Struktur

Mit Anwendungen im Web Mining

Reihe: Informationstechnologie und Ökonomie - Band 24

Erscheinungsjahr: 2003

Autor: Lars Schmidt-Thieme

Frankfurt am Main, Berlin, Bern, Bruxelles, New York, Oxford, Wien, 2003. VII, 158 S., zahlr. Tab. und Graf.

ISBN 978-3-631-52213-4

Abstracts

Diese Arbeit beschäftigt sich mit Assoziationsregeln und dem Auffinden häufiger Muster und Strukturen in komplexen Daten, z.B. in folgenwertigen Daten oder Daten, die als Folgen von Mengen beschrieben werden können. Solche Daten fallen in einer Vielzahl von Anwendungskontexten an, unter anderem als Protokolldaten in elektronischen Transaktionssystemen, z.B. in Form von Warenkörben wiederkehrender Besucher eines Online-Shops. Als Hauptbeitrag wird ein abstraktes Verfahren für das Mining häufiger Muster in allgemeinen Musterräumen entwickelt. Klassische Verfahren wie der Apriori-Algorithmus sowie seine zahllosen Varianten können als Spezialisierungen dieses abstrakten Verfahrens aufgefaßt werden. Eine spezielle Datenstruktur, der geschachtelte Prefixbaum, ermöglicht die effiziente Implementation dieses Verfahrens. Mit Hilfe von Schachtelungsoperatoren wird schließlich ein Baukasten für Apriori-artige Mining-Algorithmen zur Verfügung gestellt.

Contents

  • Assoziationsregel-Algorithmen für Mengen (Apriori, Eclat, dEclat, FP-growth)
  • Algorithmen zum Mining häufiger Teilfolgen
  • Algorithmen zum Mining häufiger verallgemeinerter Teilfolgen
  • Algorithmen zum Mining häufiger geschachtelter Substrukturen
  • Anwendungsbeispiel: Recommender-Systeme basierend auf Pfaddaten.

Author

Lars Schmidt-Thieme erwarb 1999 sein Diplom in Mathematik an der Universität Heidelberg und arbeitete von 1999 bis 2003 als wissenschaftlicher Mitarbeiter am Institut für Entscheidungstheorie und Unternehmensforschung der Universität Karlsruhe. Seit 2003 ist er Juniorprofessor für Informatik an der Universität Freiburg im Breisgau. Seine Arbeitsgebiete umfassen Data Mining und maschinelles Lernen - insbesondere mit Bezug zu Internet-Daten (Web Mining) -, Internettechnologien sowie das Zusammenspiel von Data Mining und Internettechnologien in intelligenten E-Commerce-Anwendungen.