Predictive Analytics ist der Motor, den ein Unternehmen zur Verbesserung seiner Entscheidungsfindung benötigt, unabhängig von seiner Funktion oder Branche. Darüber hinaus verschafft die Implementierung von Predictive Analytics einen Wettbewerbsvorteil, der anderswo nur schwer zu finden ist.
In diesem Artikel erläutern wir, was Predictive Analytics ist, untersuchen einige Anwendungsbeispiele und sehen uns an, wie es funktioniert.
Was ist Predictive Analytics?
Predictive Analytics ist ein Überbegriff, der verschiedene statistische und Datenanalysetechniken beschreibt – darunter Data Mining, prädiktive Modellierung und maschinelles Lernen. Der Hauptzweck von Predictive Analytics besteht darin, Vorhersagen über Ergebnisse, Trends oder Ereignisse basierend auf Mustern und Erkenntnissen aus historischen Daten zu treffen.
Predictive Analytics ist die zweite von vier Phasen der Analysefähigkeit in einer Organisation. Die vier Phasen der Analyse sind in der Reihenfolge:
- Deskriptive Analytik – Identifizieren, was in der Vergangenheit passiert ist
- Diagnostische Analytik – Verstehen, warum es passiert ist
- Predictive Analytics – Vorhersagen, was als nächstes passieren wird
- Präskriptive Analytik – Optimierung und Experimentieren mit der besten Umsetzung
Organisationen müssen diese Analysephasen in dieser Reihenfolge erreichen, da man die Zukunft nur dann effektiv vorhersagen kann, wenn man die Vergangenheit versteht. Auf diese Weise gelangen Organisationen vom Verständnis dessen, was passiert ist und warum es passiert ist, zur Vorhersage dessen, was als nächstes passieren wird. Eine weitere letzte Phase der Analyse umfasst vollständig optimierte, autonome Analysesysteme, die im Laufe der Zeit kontinuierlich lernen und praktisch „intelligent“ sind.
Bei der prädiktiven Modellierung kommen zwei Arten von Algorithmen für maschinelles Lernen zum Einsatz: überwachte und unüberwachte. Überwachte Algorithmen für maschinelles Lernen werden verwendet, um ein Zielergebnis vorherzusagen und sind die wichtigsten Werkzeuge für prädiktive Analysen.
Eine Schritt-für-Schritt-Anleitung zur Verwendung von maschinellem Lernen in der prädiktiven Analyse finden Sie in unserem Tutorial zur Liedtextanalyse .
Es gibt zwei Haupttypen überwachter maschineller Lernalgorithmen:
- Klassifizierungsmodelle – werden verwendet, um vorherzusagen, ob Beobachtungen in eine bestimmte Kategorie oder Klasse fallen. Beispielsweise kann vorhergesagt werden, ob ein Kunde abwandern wird oder nicht. Zu den gängigen Klassifizierungstechniken gehören Entscheidungsbäume und logistische Regressionsmodelle .
- Regressionsmodelle – werden verwendet, um einen Wert vorherzusagen. Beispielsweise die Vorhersage der Klickrate einer Anzeige. Gängige Methoden zur Vorhersage solcher Werte sind lineare Regression und polynomische Regressionsmodelle.
Unüberwachte Algorithmen des maschinellen Lernens hingegen treffen keine Vorhersagen, sondern versuchen, Muster in den Daten zu erkennen, die dann zum Kennzeichnen oder Gruppieren ähnlicher Datenpunkte verwendet werden können. Einer der beliebtesten unüberwachten Algorithmen ist beispielsweise das K-Means-Clustering, bei dem ähnliche Datenpunkte, wie etwa Kunden, zu Clustern zusammengefasst werden.
Predictive Analytics kann auch andere statistische und Data-Mining-Techniken umfassen, um aktuelle Trends zu erkennen, die Zukunft vorherzusagen und Ergebnisse vorherzusagen. Später in diesem Artikel werden wir einige konkrete Beispiele dafür besprechen, wie Organisationen Predictive Analytics nutzen können.
Präskriptive vs. prädiktive Analytik
Präskriptive Analytik ist die dritte Stufe der Analysefähigkeit einer Organisation, die auf den in der vorhergehenden Stufe erstellten Vorhersagemodellen aufbaut.
Während Predictive Analytics uns sagt, warum etwas passiert und was als nächstes passieren könnte, liegt der Schwerpunkt bei Prescriptive Analytics auf der Optimierung und dem Experimentieren mit den bereits erstellten Modellen. Es beantwortet Ihre „Was wäre wenn“-Fragen und ermöglicht es Ihnen, basierend auf den Informationen, die Sie durch das Ausführen von Experimenten und Simulationen erhalten, mit dem bestmöglichen Szenario fortzufahren.
Jeff Bezos, CEO von Amazon, hat den berühmten Satz gesagt: „Unser Erfolg bei Amazon hängt davon ab, wie viele Experimente wir pro Jahr, pro Monat, pro Woche und pro Tag durchführen.“
Die Durchführung von Experimenten zu allen Aspekten analytischer Prozesse und Projekte ist eine wesentliche Voraussetzung für eine erfolgreiche präskriptive Analytik.
Beispiele für Predictive Analytics
Mithilfe prädiktiver Analysen werden Datenpunkte in wertvolle Erkenntnisse umgewandelt, die zahlreiche Aspekte einer Organisation vorantreiben und beeinflussen können.
Hier sind nur einige Beispiele, wie Unternehmen Predictive Analytics nutzen können:
Prognose finanzieller KPIs
Durch die Prognose wichtiger Finanzkennzahlen wie Einnahmen, Ausgaben und Lagerbestände können effektivere und fundiertere Entscheidungen getroffen werden, die auf Fakten und Daten und nicht nur auf Intuition basieren.
Betrug im Bankwesen erkennen und reduzieren
Betrügerische Aktivitäten sind für Banken eine der kostspieligsten und schädlichsten Situationen. Predictive Analytics kann dabei helfen, Anomalien und Schwachstellen zu identifizieren, die auf Betrug hindeuten könnten, sodass die Institute schnell reagieren können.
Vorhersage, ob ein Kunde seinen Kredit nicht zurückzahlen wird
Die Kreditvergabe ist für Versicherungs- und Finanzinstitute von Natur aus riskant. Die Verwendung von Prognosemodellen zur Vorhersage, ob ein Kunde wahrscheinlich seinen Kredit nicht zurückzahlen wird, ist für diese Institute die beste Möglichkeit, dieses Risiko deutlich zu reduzieren.
Mitarbeiterfluktuation vorhersagen
Mithilfe prädiktiver Analysen können Sie das Personalmanagement Ihres Unternehmens verbessern, indem Sie die Fluktuation von Mitarbeitern vorhersagen. Dabei geht es darum, den zukünftigen Einstellungsbedarf vorherzusehen und den richtigen Zeitpunkt für die Mitarbeitermotivation zu finden.
Das Kaufverhalten der Kunden verstehen
Unternehmen können ihre Umsätze und Konversionsraten steigern, indem sie Muster hinter den Käufen ihrer Kunden entdecken und die Gründe für ihr Kaufverhalten erforschen. Sie können Kundenanalysen und A/B-Tests in Python verwenden , um diese Verhaltensweisen zu verstehen.
Zielgerichtete Marketingkampagnen für die richtigen Kunden
Unternehmen können die Klickraten von Werbung und die Konversionsraten von Marketingkampagnen im Allgemeinen steigern, indem sie die richtigen Kunden zur richtigen Zeit ansprechen. Wenn Sie einen tieferen Einblick in die Anwendung von Predictive Analytics im Marketing wünschen, sehen Sie sich den Kurs von DataCamp zur Vorhersage der Kundenabwanderung in Python an .
Reduzierung von Produktionsabfällen
Mithilfe prädiktiver Analysen kann Ihr Unternehmen die Faktoren verstehen, die mit Produktionsabfällen verbunden sind, sodass es an den richtigen Stellen Maßnahmen ergreifen kann. Die Verwendung prädiktiver Modelle zum Verständnis dieser Faktoren kann in Unternehmen zu erheblichen Kosteneinsparungen führen.
Wie funktioniert Predictive Analytics?
Es stehen viele verschiedene Predictive Analytics-Tools zur Verfügung. Welches Tool Sie auswählen, hängt vom Zweck Ihrer Analyse ab – von Business Intelligence- und Visualisierungstools wie Tableau und Power BI bis hin zu komplexen Programmiersprachen wie R Programming und Python.
Eine Einführung in Predictive Analytics in Python finden Sie in unserem Kurs „Einführung in Predictive Analytics in Python“ . Wenn Sie bereits mit Python oder Predictive Analytics vertraut sind, können Sie sich den Kurs „Fortgeschrittene Predictive Analytics in Python“ ansehen .
Die meisten Predictive-Analytics-Projekte folgen ähnlichen Arbeitsabläufen und Prozessen. In diesem Abschnitt gehen wir auf einige der wichtigsten Schritte ein, die in einem Projekt am häufigsten vorkommen.
Ziel
Jedes Predictive-Analytics-Projekt sollte mit dem Verständnis des Ziels, der Identifizierung des Problems und der Auswahl der besten Lösung beginnen.
Predictive Analytics-Projekte zielen darauf ab, das Unternehmen bei der Erreichung seiner strategischen Ziele zu unterstützen. Wenn das Projektziel mit einem kritischen Ziel für das Unternehmen verknüpft ist, ist es wahrscheinlicher, dass es auf allen relevanten Ebenen des Unternehmens Zustimmung findet. Dadurch wird sichergestellt, dass das Projekt nicht nur wertvoll, sondern auch erfolgreich ist.
Sobald das Projektziel festgelegt wurde, führt dies natürlich zu einem klaren Problem, das das Projekt lösen muss, und gibt somit Aufschluss über die zur Erreichung dieses Ziels erforderliche Lösung.
Daten
Daten können aus verschiedenen Quellen stammen, beispielsweise aus CSV-Dateien, Datenbanken, Lagern und Anwendungen von Drittanbietern. Falls dies noch nicht geschehen ist, sollten diese Datenquellen an einem zentralen Ort konsolidiert und verwaltet werden, bevor Sie sie für prädiktive Analysen und Modellierungen verwenden können. Dadurch wird sichergestellt, dass die Daten sicher sind und Qualität und Governance oberste Priorität haben.
Wie das alte Sprichwort der Datenanalyse sagt: „Wenn Müll reinkommt, kommt auch Müll raus.“ Vermeiden Sie es, alle Ihre Daten in Tabellenkalkulationen zu speichern. Tabellenkalkulationen sind zwar flexibel, können aber leicht bearbeitet und weitergegeben werden, ohne dass Sie dabei die Qualität und Sicherheit der darin enthaltenen Daten kontrollieren müssen.
Bedenken Sie außerdem, wie viele Daten Sie bereits haben oder in Zukunft generieren möchten. Die Erstellung von Prognosemodellen kann ohne geeignete Speichersysteme und Prozesse zur Verarbeitung größerer Datenmengen unnötig zeitaufwändig und für die zu lösenden Probleme ineffektiv werden.
Verwandeln
Der Transformationsschritt in einem Predictive-Analytics-Projekt umfasst das Bereinigen, Untersuchen und Vorbereiten der Daten für die bevorstehende Analyse oder das Modell.
Beim Bereinigen der Daten sollten Sie nach fehlenden Daten und Ausreißern oder verdächtigen Werten suchen, die im Kontext des Problems keinen Sinn ergeben. Dies geht Hand in Hand mit der Datenexploration, denn durch die Exploration lernen Sie die Daten besser zu verstehen und Anomalien werden Ihnen deutlicher auffallen.
Abschließend müssen die Daten für den nächsten Projektschritt vorbereitet werden. Der genaue Ablauf hängt dabei vom Algorithmus und der Art der durchzuführenden Analyse ab.
Angenommen, Sie passen ein lineares Regressionsmodell an, um die Klickraten einer Werbekampagne vorherzusagen. In diesem Fall müssen Sie die Annahmen der linearen Regression berücksichtigen und prüfen, ob die Daten diese erfüllen. Außerdem müssen Sie alle kategorialen Variablen in Ihren Daten in Dummyvariablen umwandeln, was als One-Hot-Encoding bezeichnet wird.
Bevor Sie mit dem Erstellen eines Vorhersagemodells fortfahren, sollten Sie Ihre Daten in Trainings-, Test- und Validierungssätze aufteilen. Sie passen das Modell an den Trainingssatz an. Auf diese Weise lernt es die Muster in den Daten, um Vorhersagen zu treffen. Sie müssen jedoch auch über einen Validierungssatz verfügen, um das Modell zu iterieren und zu verbessern und dann mithilfe des Testsatzes eine endgültige, unvoreingenommene Schätzung der Genauigkeit des Modells zu erhalten.
Analysieren
Wenn Sie ein Vorhersagemodell mit einem relativ einfachen überwachten maschinellen Lernalgorithmus wie der logistischen Regression erstellen, müssen Sie in diesem Schritt das Modell anpassen und die Ergebnisse auswerten. Einige komplexe Algorithmen wie neuronale Netzwerke erfordern jedoch sorgfältige Feinabstimmung und Anpassungen, um genaue Vorhersagen zu erstellen.
Ein wichtiger Hinweis ist, dass viele Vorhersagemodelle große Datenmengen benötigen, um sie genau auf die reale Welt übertragen zu können. Wenn Sie dennoch die für diese Modelle erforderlichen Datenmengen benötigen, können Sie andere Techniken in Betracht ziehen, mit denen Sie Ergebnisse in kleinerem Maßstab prognostizieren oder vorhersagen können. Dies hängt auch von Ihrem Ziel und dem Geschäftsproblem ab, das Sie lösen möchten, und umfasst Techniken wie Data Mining und die Anwendung verschiedener statistischer Methoden.
Einsetzen
Der letzte Schritt in einem Predictive Analytics-Projekt ist die Bereitstellung. Dies ist das endgültige Ergebnis des Projekts und dient als Medium, mit dem das Modell Ihrem Unternehmen einen Mehrwert bietet. Je nach Projekt und der Lösung, die Sie zur Lösung Ihres speziellen Problems gewählt haben, kann dieser Schritt alles von einem einfachen Bericht oder Dashboard bis hin zu komplexen Bereitstellungen in vorhandenen Plattformen umfassen mlflow.
Überlegen Sie, ob Ihr Unternehmen über genügend Talent für komplexere Bereitstellungen verfügt, um einen reibungslosen und effizienten Prozess zu gewährleisten. Die Investition in mindestens einen Dateningenieur kann beispielsweise einen großen Beitrag zu erfolgreichen Modellbereitstellungen leisten.
Fazit
Analytik, und insbesondere Predictive Analytics, ist nicht nur einigen wenigen Technologiegiganten und Großkonzernen oder sogar nur einigen wenigen innerhalb der Organisation vorbehalten. Heute nutzen Organisationen jeder Größe Analytik, und sie können in nahezu jeder Branche eingesetzt werden. Darüber hinaus ist Predictive Analytics heute eine Funktion, die in einer Organisation verteilt und von Teams verwaltet wird.
Predictive Analytics kann fast jedem Unternehmen einen unglaublichen Wettbewerbsvorteil verschaffen. Es ist jedoch wichtig, die Elemente zu berücksichtigen und zu verstehen, die zu einem erfolgreichen Predictive Analytics-Projekt gehören. Dieser Artikel bietet einen Leitfaden zu Predictive Analytics, wie es auf Geschäftsprobleme angewendet werden kann und wie es funktioniert.