Vom Web Mining zu iBusiness Intelligence - Business Intelligence Umsetzung | www.iBusiness-Intelligence.org

3.3.7. Vom Web Mining zu iBusiness Intelligence

Die Entwicklung des Internets in den letzten 15 Jahren hat seinen Ursprung auch im Data Warehouse und Data Mining. 1997/1998 forschten zwei junge Studenten an der Universität Stanfort im Gebiet der Aufzeichnung von grossen Datenmengen sowie deren Zusammenhängen. Sie erforschten die Extraktion von Daten, Daten-Mustern und -Verhältnisse aus dem Internet78 und beschrieben dabei eine neue Architektur für die Datenhaltung mit hoher Dimensionalität79 (vgl. Brin, Sergey Brin's Home Page, 1998). Teil ihrer Forschung auf dem Gebiet des Web Mining war dabei auch die praktische Umsetzung ihrer Forschungen. Sie entwickelten eine Web Suchmaschine, welche Websites aufzeichnete, in einem Katalog (Datenbank) indexierte sowie diese und ihre Inhalte (Webpages) dabei analysierte und in Beziehungen zueinander stellten. Dieses Projekt, BackRub, lief auf den Servern der Universität Stanfort und wurde noch während der Forschungsarbeiten unbenannt in „Google“. Bei der Namensgebung wählten sie den mathematischen Begriff „googol“, welcher eine 1 mit 100 Nullen beschreibt (10100, vgl. Wikipedia, Googol), und wollten damit ihrer Idee Ausdruck verleihen, die dem Anschein nach unendliche Mengen an Information im Internet zu sammeln und zu organisieren (vgl. Google, Our history in depth).

Google! Search Engine, aus Brin, Page, & Silverstein, Google! Search Engine, 1997/1998
Abbildung 58:„Google! Search Engine“80

Data Mining, und insbesondere das Web Mining, hat sich durch die rasante Entwicklung des Internets in den letzten Jahren weiterentwickelt. Eine scharfe Abgrenzung zwischen Data und Web Mining kann heute nicht mehr gezogen werden, da das Internet allgegenwärtig ist (oder wird, vgl. Kapitel zur Ausgangslage). Dazu ist es im Interesse eines Unternehmens, alle verfügbaren Daten in Kombination als möglichst umfangreiche Basis für die Informationsgewinnung zu nutzen (vgl. Kapitel Data Warehouse und Big Data). Die ursprüngliche Definition und Unterteilung von Web Mining kann jedoch weiterhin verwendet werden. Web Mining kann allgemein als das Entdecken und Analysieren von Mustern in Web Daten verstanden werden, wobei Methoden des Data Mining zum Einsatz kommen.

«[..], Web mining is the means of utilizing data mining methods to induce and extract useful information form Web data information» (Xu, Zhang, & Li, 2011, S. 6)

Die drei Teilgebiete von Web Mining sind in der ursprünglichen Definition „Web-Structure-Mining“, „Web-Content-Mining“ und „Web-Usage-Mining“ (vgl. u. a. Xu, Zhang, & Li, 2011, S. 6; Kemper, Baars, & Mehanna, 2010, S. 122; Wikipedia, Web mining). Die Teilgebiete werden durch die rasante Weitentwicklung des Internet heute anders benannt oder anderen Disziplinen zugerechnet.

Web-Structure-Mining

Im Web-Structure-Mining geht es um die Analyse der Beziehungen (Verlinkungen) von Websites im Internet und findet heute insbesondere im Fachgebiet der Suchmaschinenoptimierung statt. Die Suchmaschinenoptimierung hat ihren Ursprung in der Entstehung von Google und dem Bedürfnis von Unternehmen, in den Suchmaschinenresultaten möglichst gut positioniert zu sein und somit aufgefunden zu werden. Es ging zuerst vor allem darum, eine Website möglichst gut auf die Funktionsweise der Suchmaschine Google, und somit auf die Konzepte von Brin & Page, auszurichten. Dafür wurde entsprechend auf eine möglichst grosse und gute Verlinkung geachtet, um den Anforderungen gerecht zu werden (u. a. dem „PageRank“-Konzept, vgl. Wikipedia, PageRank). Durch den zunehmenden Missbrauch von (künstlichen) Verlinkungen wurden die Suchmaschinen, insbesondere Google, verbessert und weiterentwickelt. Dabei gewann der Inhalt einer Website und dessen Relevanz für eine Suchanfrage mehr an Bedeutung und die Algorithmen für die Bestimmung der Relevanz von Websites wurden dadurch verfeinert. Mittels Web-Structure-Mining Tools werden heute inhaltich-relevante Websites (sog. Authorities) und überblicksartige Websites (sog. Hubs) für ein bestimmtes, eigenes Thema ausfindig gemacht, um danach die eigenen Inhalte und deren Verlinkungen darauf auszurichten. Dazu können auch solche Tools genutzt werden, um die Konkurrenz zu beobachten. Dabei kann ihre Aktivität im gesamten Internet beobachtet und dadurch auch ihre Sichtbarkeit in den Suchmaschinen nachvollzogen werden.

Web-Content-Mining

Die Analyse der Inhalte einer Website oder von Inhalten von Websites wird heute verschiedenen Fachgebieten zugeordnet. Zum einen, wie vorgängig angetönt, ist der Inhalt einer Website massgebend für die Auffindbarkeit in Suchmaschinen. Er definiert, ob eine Seite einer Website für eine Suchanfrage bei Google den entsprechenden Inhalt anbietet und somit relevant ist. Zum anderen ist die Analyse von Inhalten und die Definition der Inhalte einer Website heute Bestandteil des Marketings und wird unter dem Begriff „Content Marketing“ zusammengefast. Dabei geht es darum, möglichst interessante Inhalte („Webpages“) für die Zielgruppe, die vorhandene oder potenzielle Kundschaft, bereit zu stellen und diese entsprechend im Internet zu verbreiten. Dabei spielt die suchmaschinengerechte Aufbereitung der Inhalte natürlich auch eine wesentliche Rolle, aber es geht auch darum, dass die Inhalte selbstständig durch die Zielgruppe (weiter-) verbreitet werden, was zu „viralem Marketing“ (Springer Gabler, 2013) führt. Das Web-Content-Mining beschäftigt sich dabei mit der Identifikation, Auswahl und Aufbereitung der Daten und kann auch die Analyse der Inhalte anderer Websites - sei es von der Konkurrenz, von möglichen zukünftigen Partnern oder von Vorbildern - beinhalten.

In den letzten Jahren gewann Web-Content-Mining zudem im Rahmen der sozialen Portale, wie Facebook und Twitter, an Bedeutung. Durch die Analyse der Aktivitäten der Konsumenten im Internet und in diesen sozialen Portalen ist es möglich zu eruieren, worüber der Konsumenten-Markt spricht und was der Markt verlangt. Dadurch kann sich ein Unternehmen möglichst genau auf die Zielgruppen ausrichten und mögliche Trends vorhersehen.

Web-Usage-Mining

Unter „Web-Usage-Mining„ wird die Untersuchung des Nutzungsverhaltens im Web oder einer Website verstanden. Dabei werden grosse Datenbestände, welche durch die Konsumenten erzeugt werden, nach Mustern untersucht, welche Rückschlüsse auf das Verhalten der Kunden erlaubt. (vgl. ITwissen.info, 2013) Diese können für die Verbesserung des Angebotes und der Systeme genutzt werden. Beim Web-Usage-Mining werden heute Daten aus der Benutzeroberfläche (Frontend: “Web Analytics Tools“) sowie aus dem Websystem (Web-Backend: Applikation und Webserver) verwendet.

Neue Möglichkeiten

Alle drei Teilgebiete des Web Minings können sowohl im Rahmen der passiven wie auch der aktiven Analyse angewandt werden. Alle drei haben sich in den letzten 15 Jahren weiterentwickelt. Besonders das Web-Usage-Mining ist heute als „Web Analytics“ in aller Munde. Dies hat auch mit der Neuerung des Internets zu tun. Durch die vollständige Digitalisierung des Geschäfts – vom ersten Kontakt mit dem Konsumenten durch Werbung über die Bestellung bis zur Ausführung bzw. Auslieferung von materiellen und immateriellen Gütern – ist es möglich geworden, den gesamten Wertschöpfungsprozess im Detail aufzuzeichnen und auszuwerten. Dadurch kann ein Unternehmen exakter nachvollziehen, wie gut die eigenen Geschäftsprozesse sind und welche Leistung sie effektiv erbringen. Diese Daten können zusammen mit Daten über das Interesse und die Nachfrage der Konsumenten für die Optimierung des eigenen Angebotes, deren Vermarktung und Ausführung verwendet werden.

>Digitalisierter Konsumenten-Markt, aus Nivens, 2013
Abbildung 59:Digitalisierter Konsumenten-Markt81

„Web Analytics“ beinhaltet somit passive und aktive Analysesysteme im Rahmen des BI-Ansatzes, während Web-Usage-Mining eine aktive Analyse beschreibt. Sie bezeichnet den Ablauf und die dabei verwendeten Methoden für die Entdeckung von Mustern im Rahmen des KDD-Prozesses. Alle „Mining“-Ansätze bezeichnen somit im Sinne der wörtlichen Übersetzung den Vorgang und die dabei verwendeten Methoden bei der Extraktion von etwas Wertvollem aus einem Datenberg82 (vgl. Wikipedia, Data Mining). Im Gegensatz dazu bezeichnet die „Analyse“ den Vorgang des Auflösens eines Untersuchungsgegenstandes in seine Einzelbestandteile und die Untersuchung dieser Bestandteile (Analyse, vom altgriech. „analysis“: „Auflösung“) (vgl. Wikipedia, Analyse).



Publizieren auf TwitterGoogle+Facebook
 XingLinkedIn