Erfahren Sie, wie die inference des maschinellen Lernens funktioniert, wie sie sich vom herkömmlichen Training des maschinellen Lernens unterscheidet, und entdecken Sie die Ansätze, Vorteile, Herausforderungen und Anwendungen.
Einführung in die inference des maschinellen Lernens
Stellen Sie sich vor, Sie haben ein erstaunliches maschinelles Lernmodell trainiert , das dem Geschäftsteam durch relevante Empfehlungen dabei hilft, mehr Kunden zu gewinnen. Der logischste nächste Schritt besteht darin, das trainierte Modell in die Infrastruktur des Unternehmens zu integrieren, damit es vom Unternehmen verwendet werden kann, um Vorhersagen über die Informationen neuer Kunden zu treffen. Der Prozess der Verwendung eines solchen vorhandenen Modells wird als inference bezeichnet.
Die inference des maschinellen Lernens ist von entscheidender Bedeutung, da sie die Verwendung des Modells für reale Anwendungsfälle wie Vorhersagen, Klassifizierungen oder Empfehlungen ermöglicht.
Am Ende dieses Blogs haben Sie ein besseres Verständnis davon, wie die inference beim maschinellen Lernen funktioniert, wie sie sich vom herkömmlichen Training beim maschinellen Lernen unterscheidet und einen Überblick über die vorhandenen inferenceansätze sowie deren Vorteile, Herausforderungen und einige Anwendungen im wirklichen Leben.
Maschinelles Lernen: inference vs. Training
Zunächst einmal muss man bedenken, dass Machine-Learning-inference und Machine-Learning-Training nicht dasselbe sind und dass jedes Konzept in zwei unterschiedlichen Phasen eines Machine-Learning-Projekts angewendet wird. Dieser Abschnitt bietet eine intuitive Erklärung, um die Unterschiede anhand der Restaurant-Analogie von Cassie Kozyrkov hervorzuheben .
Sie erwähnte, dass für die Herstellung einer guten Pizza (eines wertvollen Produkts) ein Rezept (Modell oder Formel) erforderlich ist, das angibt, wie die Zutaten (Qualitätsdaten) mit welchen Geräten (Algorithmen) zubereitet werden sollen.
Es gäbe keinen Service, wenn aus der Küche kein Essen käme. Außerdem wäre die Küche (Data Science Team) wertlos, wenn die Kunden das Essen ständig nicht zu schätzen wüssten.
Für ein gutes Kundenerlebnis und einen besseren Return on Investment arbeiten beide Teams zusammen.
Schulung zum maschinellen Lernen
Das Trainieren eines Machine-Learning-Modells erfordert die Verwendung von Trainings- und Validierungsdaten. Die Trainingsdaten werden zur Entwicklung des Modells verwendet, während die Validierungsdaten dazu dienen, die Parameter des Modells zu optimieren und es so robust wie möglich zu machen. Das bedeutet, dass das Modell am Ende der Trainingsphase in der Lage sein sollte, neue Daten mit weniger Fehlern vorherzusagen. Wir können diese Phase als die Küchenseite betrachten.
In unserem umfassenden Leitfaden „ Was ist maschinelles Lernen“ erfahren Sie, was maschinelles Lernen ist, wie es sich von KI und Deep Learning unterscheidet und warum es eines der spannendsten Felder der Datenwissenschaft ist.
Maschinelles Lernen – inference
Gerichte können erst serviert werden, wenn sie zum Verzehr bereit sind. Ebenso muss das maschinelle Lernmodell trainiert und validiert werden, bevor es zur Erstellung von Vorhersagen verwendet werden kann. Die inference des maschinellen Lernens ähnelt dem Szenario eines Restaurants. Beide erfordern Aufmerksamkeit für bessere und genauere Ergebnisse und damit für die Zufriedenheit von Kunden und Unternehmen.
Bedeutung des Verständnisses der Unterschiede
Es ist wichtig, den Unterschied zwischen der inference und dem Training beim maschinellen Lernen zu kennen, da dies nach der Bereitstellung in der Produktionsumgebung zu einer besseren Zuweisung der Rechenressourcen für Training und inference beitragen kann.
Die Modellleistung nimmt in der Regel in der Produktionsumgebung ab. Ein richtiges Verständnis des Unterschieds kann dabei helfen, die richtigen Industrialisierungsstrategien für die Modelle zu übernehmen und sie im Laufe der Zeit aufrechtzuerhalten.
Wichtige Überlegungen bei der Wahl zwischen inference und Training
Die Verwendung eines inferencemodells oder das Trainieren eines brandneuen Modells hängt von der Art des Problems, dem Endziel und den vorhandenen Ressourcen ab.
Zu den wichtigsten Überlegungen zählen unter anderem die Markteinführungszeit, Ressourcenbeschränkungen oder Entwicklungskosten, die Modellleistung und die Kompetenz des Teams.
- Zeit bis zur Markteinführung . Bei der Wahl zwischen Training und Verwendung eines vorhandenen Modells ist es wichtig zu berücksichtigen, wie viel verfügbar ist. Manchmal erfordert die Verwendung eines vorab trainierten Modells weniger Zeit und kann einem Geschäftsteam einen Wettbewerbsvorteil verschaffen.
- Ressourcenbeschränkungen oder Entwicklungskosten . Je nach Anwendungsfall kann das Trainieren eines Modells eine beträchtliche Menge an Daten und Trainingsressourcen erfordern. Die Verwendung eines inferencemodells erfordert jedoch in den meisten Fällen weniger Ressourcen, wodurch es einfacher ist, in kurzer Zeit eine noch bessere Leistung zu erzielen.
- Modellleistung . Das Trainieren eines maschinellen Lernmodells ist ein iterativer Prozess und garantiert nicht immer ein robustes Modell. Die Verwendung eines inferencemodells kann im Vergleich zu einem internen Modell eine bessere Leistung bieten. Heutzutage sind die Erklärbarkeit des Modells und die Minderung von Verzerrungen von entscheidender Bedeutung, und inferencemodelle müssen möglicherweise aktualisiert werden, um diese Funktionen zu berücksichtigen.
- Fachwissen des Teams . Der Aufbau eines robusten maschinellen Lernmodells erfordert umfassendes Fachwissen sowohl für das Training als auch für die Industrialisierung des Modells. Es kann eine Herausforderung sein, dieses Fachwissen bereits zu haben. Daher kann der Rückgriff auf inferencemodelle die beste Alternative sein.
Bayesianische inference im maschinellen Lernen
Die Bayessche inference ist eine Technik des maschinellen Lernens, die es Algorithmen ermöglicht, Vorhersagen zu treffen, indem sie ihr Vorwissen anhand neuer Erkenntnisse unter Verwendung des Bayes-Theorems aktualisieren.
Aber was ist der Satz von Bayes?
Es beschreibt die Wahrscheinlichkeit des Ereignisses A , vorausgesetzt, dass ein anderes Ereignis, B , eingetreten ist. Die Formel lautet wie folgt:
P(A): a priori → die Wahrscheinlichkeit, dass Ereignis A eintritt, ohne dass andere Ereignisse bekannt sind.
P(B): die Normalisierungskonstante, die die Berechnung des posterioren Ereignisses B ermöglicht .
P(A|B): posterior → die Wahrscheinlichkeit, dass Ereignis A eintritt, vorausgesetzt, dass ein anderes Ereignis B eintritt.
P(B|A): Wahrscheinlichkeit → die Möglichkeit, dass Ereignis B eintritt, wenn A eintritt.
Lassen Sie uns anhand dieser Informationen die Vorteile der Bayesschen inference und einige Anwendungen im wirklichen Leben erkunden.
In unserem Tutorial zur Naive-Bayes-Klassifizierung mit Scikit-learn erfahren Sie, wie Sie mit dem Scikit-learn-Paket von Python einen Naive-Bayes-Klassifikator erstellen und auswerten.
Vorteile der Bayesschen inference
Die Bayessche inference bietet zahlreiche Vorteile, unter anderem:
- Flexibilität . Die Bayessche inference kann sowohl auf lineare als auch auf nichtlineare Modelle und verschiedene Probleme des maschinellen Lernens wie Regression, Klassifizierung, Clustering, Verarbeitung natürlicher Sprache und mehr angewendet werden.
- Intuitiver . Der Übergang von früherem zu späterem Wissen anhand neuer Daten ähnelt der Art und Weise, wie Menschen ihre Überzeugungen anhand neuer Informationen aktualisieren, was intuitiver ist. Wenn jemand beispielsweise im Voraus weiß, dass es morgen schneien wird, und die Wetterinformationen überprüft, wird diese Person ihre Überzeugung entsprechend ändern.
- Interpretierbar . Die über die möglichen Werte der Modellvorhersagen generierten Wahrscheinlichkeitsverteilungen können leicht interpretiert werden, was Entscheidungsträgern dabei helfen kann, Entscheidungen hinsichtlich ihrer Risikotoleranz zu treffen.
Anwendungen der Bayesschen inference im maschinellen Lernen
Nachfolgend sind einige der realen Anwendungen der Bayes-inference im maschinellen Lernen aufgeführt:
- Erkennung von Kreditkartenbetrug . Die Bayes-inference kann zur Erkennung betrügerischer Aktivitäten angewendet werden. Der Prozess beginnt mit einer Vorannahme der Wahrscheinlichkeit, dass eine Transaktion betrügerisch ist, basierend auf historischen Daten. Wenn dann neue Daten verfügbar werden, wie etwa der Transaktionsbetrag oder die Kaufhistorie des Kunden, werden die Vorannahmen mithilfe des Bayes-Theorems aktualisiert, um eine Posterior-Wahrscheinlichkeit einer Transaktion zu erhalten und festzustellen, ob es sich um eine betrügerisch handelnde Transaktion handelt oder nicht.
- Medizinische Diagnose . Bei medizinischen Diagnosen wird der Satz von Bayes verwendet, um Daten aus früheren Fällen zu analysieren und die Wahrscheinlichkeit abzuschätzen, mit der ein Patient an einer bestimmten Krankheit leidet. Der Bayes-Satz kann verschiedene Faktoren berücksichtigen, die das Ergebnis beeinflussen könnten, und Wahrscheinlichkeitsschätzungen generieren, die besser erklärbar sind als bloße binäre Ergebnisse.
- Bildverarbeitung . Die Bayessche inference hat mehrere Anwendungen in der Bildverarbeitung. Sie kann beispielsweise verwendet werden, um Rauschen aus Bildern zu entfernen, indem Techniken wie das Markov-Chain-Monte-Carlo-Verfahren und der Bayes-Satz angewendet werden.
- Sprachverarbeitung . Bayesianisches nichtparametrisches Clustering (BNC) wird im nichtparametrischen hierarchischen neuronalen Netzwerk zur Sprach- und Emotionserkennung verwendet. Dieser Prozess übertrifft andere hochmoderne Modelle bei ähnlichen Aufgaben.
Kausale inference im maschinellen Lernen
Kausale inferenceist ein statistischer Ansatz, der in der KI und im maschinellen Lernen verwendet wird, um Ursache-Wirkungs-Beziehungen zwischen Attributen zu verstehen.
Im Marketing beispielsweise möchten Entscheidungsträger wissen, welche Kampagne die höchste Konversionsrate erzielt. Mithilfe kausaler inference lässt sich der kausale Zusammenhang zwischen der Konversionsrate und der Marketingkampagne ermitteln, um die Konversionen zu maximieren.
Unser Kurs „Statistische inference mit R“ kann Ihnen dabei helfen, sich mit den grundlegenden Fähigkeiten der statistischen inference vertraut zu machen, die zum Verständnis, Interpretieren und Optimieren Ihrer Statistik- und maschinellen Lernmodelle erforderlich sind.
Bedeutung der kausalen inference im maschinellen Lernen
Kausale inference ist beim maschinellen Lernen aus mehreren Gründen wichtig, unter anderem für effiziente Vorhersagen und Fairness. Werfen wir einen kurzen Blick auf jeden einzelnen dieser Gründe.
- Effiziente Vorhersage . In vielen Anwendungsfällen des maschinellen Lernens reicht die Korrelationsanalyse nicht aus, da sie nicht unbedingt auf Kausalität schließen lässt. Durch kausale inference können Machine-Learning-Ingenieure die zugrunde liegenden kausalen Beziehungen zwischen Variablen identifizieren, was zu genaueren Vorhersagen führt.
- Fairness . Die Verwendung von maschinellem Lernen zur kausalen inference kann dabei helfen, die zugrunde liegenden Ursachen für die Verzerrung bestimmter Daten zu identifizieren. Dies kann Entscheidungsträgern dabei helfen, geeignete Maßnahmen zu ergreifen, um das Verzerrungsproblem der Daten zu mildern und so bessere Modelle für maschinelles Lernen zu entwickeln.
Herausforderungen bei der Implementierung kausaler inference im maschinellen Lernen
Wie bei anderen Techniken des maschinellen Lernens ist auch die Implementierung der kausalen inference beim maschinellen Lernen mit eigenen Herausforderungen verbunden, die sich jedoch nicht auf die im Folgenden dargestellten beschränken:
- Umfangreiche, hochwertige Daten . Um eine gültige kausale Schlussfolgerung zu ziehen, sind umfangreiche, hochwertige Daten erforderlich. Daten aus der realen Welt sind jedoch unübersichtlich, und es kann eine Herausforderung sein, den perfekten Ansatz zu finden, um die Daten fehlerfrei zu machen.
- Interpretierbarkeit . Die zur Schätzung der Kausalität verwendeten Methoden sind häufig komplex und erfordern sowohl fundierte statistische Fachkenntnisse als auch fortgeschrittene Fachkenntnisse des untersuchten Gebiets für eine bessere Interpretation der Ergebnisse.
- Störvariablen . Diese Variablen stehen sowohl mit den unabhängigen als auch den abhängigen Variablen in Zusammenhang. Dieser Faktor kann den wahren kausalen Effekt der unabhängigen Variablen verzerren und somit eine genaue Schätzung des kausalen Effekts erschweren.
Fazit
In diesem Artikel wurde erläutert, was maschinelles Lernen ist, wie es sich vom maschinellen Lernentraining unterscheidet und welche wichtigen Empfehlungen bei der Auswahl des einen oder anderen zu beachten sind. Neben der Hervorhebung bayesscher und kausaler inference wurden auch deren Bedeutung und Herausforderungen beim maschinellen Lernen erläutert gradient descent.
Es ist wichtig zu bedenken, dass inference zwingend erforderlich ist, damit jedes Machine-Learning-Modell im wirklichen Leben nützlich ist. Nur durch inference können Modelle in bestehende Anwendungen integriert und von Unternehmen und verschiedenen Interessengruppen für eine bessere Geschäftswirkung genutzt werden.
Häufig gestellte Fragen zur Machine-Learning-inference
Dabei wird ein bereits trainiertes und in der Produktionsumgebung eingesetztes Modell verwendet, um Vorhersagen auf der Grundlage neuer Echtzeitdaten zu treffen.
Für die inference des maschinellen Lernens sind die folgenden Informationen erforderlich: ein trainiertes Modell, Rechenressourcen, Bereitstellungsinfrastruktur, Überwachungstools und Echtzeitdaten.
Es gibt drei Haupttypen der Schlussfolgerung: abduktiv , deduktiv und induktiv .
Die Modelinference erfordert die folgenden Schritte: (1) Laden des trainierten Modells, (2) Vorverarbeiten der vom Modell zu verwendenden Eingabedaten, (3) Füttern des Modells mit den Eingabedaten, (4) Vorverarbeiten der Vorhersage des Modells und (5) Zurückgeben des Ergebnisses im erwarteten Format.
Für den Aufbau eines zuverlässigen und robusten inferenceframeworks für maschinelles Lernen sind die folgenden bewährten Methoden erforderlich: (1) Berücksichtigen Sie die Skalierbarkeit des Frameworks, damit es mehrere Modelle und Arbeitsabläufe unterstützen kann. (2) Es sollte sich leicht in vorhandene oder zukünftige Systeme und Komponenten integrieren lassen. (3) Stellen Sie sicher, dass der Arbeitsablauf eine hohe Durchsatzlast bewältigen kann. (4) Sorgen Sie für einen sicheren Zugriff auf die Ressourcen. (5) Integrieren Sie Überwachungs- und Protokollierungsfunktionen. (6) Erstellen Sie eine klare und aktuelle Dokumentation. (7) Integrieren Sie die Feedbackschleife.