Data Mining

Trends, Muster und Zusammenhänge erkennen

"Data Mining ist, wenn man vorher nicht so genau weiß, wonach man eigentlich sucht!"
(Verfasser unbekannt)

Data Mining ist eine neue Abfragetechnik, die es dem Anwender ermöglicht, auf Basis von großen Datenbanksystemen wie z.B. Data Warehouse, versteckte Informationen, Trends, Muster, Zusammenhänge und Vorhersagen abzuleiten.

Aus bisherigen Bestelldaten können auf diese Weise Kundenprofile gewonnen werden. Damit lässt sich das Marketing besser auf die Bedürfnisse der Kunden zuschneiden. Doch auch für die Leistungserbringung lassen sich wertvolle Rückschlüsse ziehen - sei es im Handel, in der Industrie oder bei Banken und Versicherungen.

Data Mining-Werkzeuge sind darauf spezialisiert, noch unbekannte Zusammenhänge innerhalb von Unternehmensdaten zu finden. Im Gegensatz zu den klassischen Abfragewerkzeugen muss ihr Anwender nicht von vornherein wissen, wonach er sucht. Vielmehr führen sie den Anwender von sich aus zu den oft vermeintlich interessanten Informationen.

Folien Download, PDF 23 kB »

Warenkorbanalyse

Die Warenkorbanalyse gehört zur Gruppe der Clusteranalysen. Dabei werden Gruppen von häufig gemeinsam verkauften Produkten aufgefunden. Sie kommen fast ausschließlich im Einzelhandel zur Anwendung und stellen hier die beste Möglichkeit bereit, das Kaufverhalten zu analysieren und Kundenbedürfnisse aufzuspüren.

Die Ergebnisse können dazu dienen, die einzelnen Produkte gemäss ihrer Gruppenzugehörigkeit in den Regalen aufzustellen. Ist es möglich, die Warenkorbanalyse mittels Kundendaten zu verknüpfen, können Kaufwahrscheinlichkeiten für zukünftige Einkäufe errechnet werden.

Eine weitere Anwendungsmöglichkeit besteht darin, Kunden - sofern dies im Einklang mit dem Datenschutzgesetz passiert - mit personenbezogenen bzw. gruppenbezogenen Werbeaktionen anzusprechen.

Fallbasiertes Schließen

Mit dieser Technik können zukünftige Entscheidungen aus den Erfahrungen der Vergangenheit abgeleitet werden. Hierfür werden charakteristische Eigenschaften von einzelnen Fällen in einer Datenbank gespeichert, beispielsweise alle relevanten Parameter zur Entscheidungsfindung und der daraus resultierende Geschäftsfall.

Bei neu auftretenden Entscheidungssituationen werden Parameter gesichtet und mit der Datenbank verglichen, um die größtmögliche Übereinstimmung mit den historischen Daten zu finden. Der Grad der Ähnlichkeit der Konstellationen ist der Genauigkeit der Vorhersage proportional.

Fallbasiertes Schließen entstammt dem Forschungsgebiet des maschinellen Lernens, dieses wiederum aus der Künstlichen Intelligenz (KI)-Forschung. KI ist ein Zweig der Informatik, der sich mit Methoden beschäftigt, die es einem Computer erlauben, Probleme zu lösen, die vom Menschen durch Intelligenz gelöst wurden.

Um den Anspruch des Lernens gerecht zu werden, ist es wichtig, die Parameter aller relevanten Unternehmensentscheidungen zu protokollieren, um immer genauere und bessere Vorhersagen treffen zu können.

Neuronale Netze

Neuronale Netze sind informationsverarbeitende Systeme, die aus vielen einfachen Einheiten, den Neuronen, bestehen. Sie tauschen Informationen per Stimulationen über gerichtete Verbindungen aus. Die Forschung ist zum Teil durch die Ähnlichkeit der Technik zu den Gehirnen von Säugetieren motiviert. Heute, vor allem im kommerziellen Einsatz, stehen andere Gesichtspunkte im Vordergrund.

Um ein neuronales Netzwerk sinnvoll verwenden zu können, muss zuerst die Aufgabenstellung an Hand von Beispielen trainiert werden. Das Lernen (überwacht bzw. unüberwacht) des nötigen Basiswissens wird durch die Angabe von Eingangsmengen und den zu berechnenden Ausgangsmengen erreicht.

Das größte Problem bei neuronalen Netzwerken liegt in dem Umstand, dass der Weg zur Lösung nicht einsichtig wird. Die Ergebnisse sind aber hervorragend, und die NASA verwendet neuronale Netze zur Wartung des Space Shuttles. Das Einsatzgebiet ist beinahe grenzenlos, und bedenkt man, dass es (noch) keine Richtlinien für den Entwurf eines neuronalen Netzwerks gibt, kann man in Zukunft mit vermehrtem Einsatz rechnen.

Auch in Deutschland gibt es seit kurzem einen Anbieter von intelligenten Suchmaschinen auf der Basis neuronaler Netzwerke. Insuma, wie der Name des Start-up-Unternehmens lautet, ist aus einem Forschungsprojekt an der Universität Tübingen in Zusammenarbeit mit der Universität Petersburg entstanden. Das Land Baden-Württemberg hat dieses Projekt finanziell unterstützt.

Genetische Algorithmen

Genetische Algorithmen versuchen, ähnlich den neuronalen Netzwerken, biologische Vorgänge abzubilden - hier die Evolution. Prinzip ist die Tatsache, dass die Natur durch Kreuzungen und Mutationen von Chromosomen immer lebensfähigere und an die aktuellen Umweltbedingungen angepasstere Spezies hervorbringt.

Der Grundbaustein des Genetischen Algorithmus ist das einzelne Chromosom, das durch ein Bitmuster repräsentiert wird. Eine Menge solcher Chromosomen bildet eine Population.

Zwei Chromosomen werden zufällig ausgewählt und gekreuzt, danach wird die gesamte Population verändert, ebenfalls unter Einfluss einer Zufallskomponente. Dann wird das einzelne Chromosom einer Berechnungsmethode unterzogen, die es für das vorliegende Problem bewertet. Bei diesem Schritt werden nur die stärksten Chromosomen berücksichtigt, die sich im Idealfall dem Problem respektive der Umwelt optimal angenähert haben.

Dieses Verfahren wird bei Optimierungsproblemen eingesetzt, aber auch zur Verbesserung eines neuronalen Netzwerkes.

Automatische Clusteranalyse

Das Verfahren der automatischen Clusteranalyse wird benützt, um Gruppen von Datensätzen aufzufinden, die Ähnlichkeiten aufweisen. Dabei wird von den Rohdaten aus nach noch nicht bekannten Zusammenhängen gesucht. Dies geschieht meist als erster Schritt in sehr großen Datenbeständen, um erste Daten mit ähnlichen Eigenschaften zu sichten, die darauf mittels anderer Techniken weiter untersucht werden.

Analyse von Beziehungen zwischen Datensätzen

Diese Methode versucht Beziehungen zwischen den einzelnen Datensätzen herzustellen, meistens um Marketingaktionen besser auf einzelne Kunden abstimmen zu können. Beispielsweise können Haushalte ihrem Einkommen nach spezieller angesprochen werden, obwohl diese Parameter nach einer Clusteranalyse nicht berücksichtigt worden wären.

Entscheidungsbäume

Der Datensatz wird bei dieser Technik als Baumdiagramm dargestellt. Der Datensatz wird dabei nach bestimmten Merkmalen, wie z.B. Kunde, Produkte segmentiert. Anhand der existierenden vorhandenen, historischen Daten, die in Klassen eingeteilt sind, werden weiter Untergruppen gebildet.

Es wird nun versucht, an jeder Verzweigung die bestmöglichste Frage zu stellen. Die Qualität des Datensatzes hängt sehr stark von diesen gestellten Fragen ab, deshalb ist hier mit einer richtigen Frage gemeint, wie stark die Frage den Datensatz organisiert oder anders: sie soll die Wahrscheinlichkeit einer Ausprägung innerhalb eines Segments ändern.

Das Ziel ist dabei die Blätter des Baumes so homogen wie möglich zu gestalten, d.h. die Daten sollten bezüglich des ausgewählten Merkmals relativ gleiche Werte annehmen. Aus Gründen der Wirtschaftlichkeit und Effektivität wird der Baum nicht bis ins letzte Detail modelliert, sondern solange unterteilt und weitergeführt, bis die Segmente nur noch einen Eintrag enthalten.

Der Vorteil der Entscheidungsbäume besteht darin, dass sie helfen auf einzelne Datensätze auch in größeren Datenbanken effizient zuzugreifen, d.h. die Zugriffszeiten sind unabhängig von der Größe der Datenbank konstant. Der Nachteil der Entscheidungsbäume ist, dass sie viel Speicherplatz und Verwaltungsaufwand benötigen.

Daten vorher aufbereiten

Was all diese Methoden gemeinsam haben, ist die Einschränkung, dass sie nur mit strukturierten Daten umgehen können. Das heißt, es ist im allgemeinen notwendig, die für eine Analyse verwendeten Daten erst speziell dafür aufzubereiten.

Links und Literatur

Tagcloud

Navigation Kunden Service Organisation Information Kommunikationsmodell Science of Happiness at Work Emotion Personal Wettbewerb Kommunikation Vertrieb IT Qualitätsmanagement Kundenzufriedenheit social network Projekt Führungskraft Lernen Social Media ILTIS Verhalten Trend Strategie Konflikt Mitarbeiter Weiterbildung Commitment Wissensmanagement Führungsstil Wachstum Corporate Kultur Qualität Veränderung Akzeptanz Erfolg Entscheidung Touchpoint Bürgermeister Unternehmenskultur Value Management Recruiting Messung Psychologie Coaching Instrument Prozess Methode Business-Ettikette Führung Grundsätze Marketing Kompetenz Kreativität Innovation Zukunft Beratung Potenzial Controlling Netzwerk Prioritäten Image Vision Unternehmen Mensch Planung Change-Management System Diversity Börse Unternehmenskommunikation Führungstipps Ziele Marke E- Markt Research Team Projektmanagement Werte Zielvereinbarung Wandel Krise Verhandlung Veränderungsprozess Internet Ethik Literatur Change Management Management by Mitarbeitermotivation Intuition Mitarbeiterbindung Verkäufer Konkurrenz Macht Finanzierung Produkt Kulturkompetenz Zielgruppe Leistung Organisationsentwicklung Telefonie Präsentation Manager Potenzialentwicklung Widerstand Ideen Mentoring Produktion Umwelt Visualisieren Erfahrungswissen Mitarbeiterzufriedenheit Intelligenz Nachhaltigkeit CRM Regeln Kundenloyalität Bewerberauswahl Modell Orientierung Motivation Mobile Erreichbarkeit Outsourcing HRM Community Kennzahlen Kundenrückgewinnung Kundenbindung Anforderungsprofil Risiko Loyalitätsmarketing Mitarbeiterbefragung Leadership Medien Demographie Karriere Kommune Mitarbeitergespräch Ablauf Knigge Moderation CSR Projekt Office Assessment Strategieverwirklichung High Potentials IT-Trend Netzwerksicherheit Markterfolg Kommunalberatung Kündigung Dynamic Experience Mediation Souveränität Profit Resilienz Burn-Out Altersstruktur Navigationsinstrument Empfehlungsmarketing Mobile Marketing Verwaltung Datenschutz Verbraucher Authentizität Charisma E-Mail Anwenderbetreuung Akquise Training Energie intrnational Verwaltung Gehirntraining Checkliste IT-Infrastruktur Literatur Vertrieb CMS Event Hörbuch

Neues bei ILTIS

Lean Services

Wie Sie den Change vom Kostenfaktor hin zum Qualitätsdienstleister meistern

Das erfahren Sie bei uns