Mithilfe der sentiment analysis gewinnen wir Einblicke in die Gefühle einer Zielgruppe zu einem bestimmten Thema. Hier finden Sie die Grundlagen der sentiment analysis typen und -techniken.
Die sentiment analysis ist eine Context-Mining-Technik, die zum Verständnis der in Texten ausgedrückten Emotionen und Meinungen verwendet wird. Sie werden häufig als positiv, neutral oder negativ klassifiziert. In fortgeschrittenen Anwendungsfällen wird versucht, die sentiment analysis anzuwenden, um Einblicke in die Absichten, Gefühle und sogar Dringlichkeit zu gewinnen, die im Inhalt zum Ausdruck kommen. Mithilfe der Verarbeitung natürlicher Sprache (NLP) und der Leistungsfähigkeit von Computeralgorithmen können Analysten in Bereichen wie Marketing , Politik und Finanzen schnell riesige Textmengen verarbeiten und durch das Verstehen der Stimmung wertvolle Erkenntnisse gewinnen.
Sentiment analysis verstehen
Um die sentiment analysis zu verstehen, verwenden wir ein einfaches Beispiel. Stellen Sie sich vor, unser Unternehmen hat gerade ein neues Produkt auf den Markt gebracht und wir möchten herausfinden, ob es den Kunden gefällt. Wir schauen online nach und sehen, dass Tausende von Kunden Produktbewertungen hinterlassen haben:
Es würde mehrere Stunden dauern, alle Bewertungen durchzulesen und sie entsprechend zu klassifizieren. Mithilfe von Data Science und NLP können wir diese Bewertungen jedoch in etwas umwandeln, das ein Computer versteht. Sobald die Bewertungen in einem computerlesbaren Format vorliegen, können wir mithilfe eines sentiment analysis modells feststellen, ob die Bewertungen positive oder negative Emotionen widerspiegeln.
Durch die Analyse der Stimmung können wir einschätzen, wie Kunden über unser neues Produkt denken, und auf der Grundlage unserer Erkenntnisse datengestützte Entscheidungen treffen. Diese Technik gibt Aufschluss darüber, ob die Verbraucher zufrieden sind oder nicht, und kann uns dabei helfen, herauszufinden, wie sie insgesamt über unsere Marke denken.
Wie funktioniert die sentiment analysis?
Es gibt drei beliebte Ansätze zur Durchführung der sentiment analysis:
- Regelbasierte Methoden
- Methoden des maschinellen Lernens
- Hybride Methoden
Abhängig von der Komplexität der Daten und der gewünschten Genauigkeit hat jeder Ansatz Vor- und Nachteile. Generell haben sich auf maschinellem Lernen basierende oder hybride Methoden zum gängigsten Ansatz für die sentiment analysis entwickelt, da sie im Vergleich zu regelbasierten Methoden besser mit der Komplexität der menschlichen Sprache umgehen können.
1. sentiment analysis: Regelbasierte Methoden
Bei einem regelbasierten Ansatz wird mithilfe einer Reihe von Regeln die Stimmung eines Textes bestimmt. Eine Regel könnte beispielsweise besagen, dass jeder Text, der das Wort „Liebe“ enthält, positiv ist, während jeder Text, der das Wort „Hass“ enthält, negativ ist. Wenn der Text sowohl „Liebe“ als auch „Hass“ enthält, gilt er als neutral oder unbekannt.
Vorteile regelbasierter sentiment analysis methoden
Regelbasierte Methoden sind normalerweise schnell und einfach zu implementieren. Sie können sehr genau sein, wenn der Text kurz und unkompliziert ist. Wir können regelbasierte Ansätze auch verwenden, um Polaritätsbereiche zu generieren, indem wir eine Liste von Wörtern erstellen und ihnen eine positive oder negative Punktzahl zuweisen. Beispielsweise würden wir ein Lexikon wie dieses erstellen:
Um dann die Polarität des Textes zu bestimmen, berechnet der Computer die Gesamtpunktzahl, die einen besseren Einblick darüber gibt, wie positiv oder negativ etwas ist, als wenn man es nur beschriftet. Wenn wir beispielsweise einen Satz mit der Punktzahl 10 erhalten, wissen wir, dass er positiver ist als ein Satz mit der Punktzahl 5.
Einschränkungen der regelbasierten sentiment analysis
Regelbasierte Methoden können gut sein, sind aber durch die Regeln, die wir festlegen, eingeschränkt. Da sich die Sprache weiterentwickelt und ständig neue Wörter hinzugefügt oder umfunktioniert werden, können regelbasierte Ansätze einen hohen Wartungsaufwand erfordern.
Darüber hinaus sind diese Methoden naiv, das heißt, sie betrachten jedes Wort einzeln und berücksichtigen nicht die Komplexität, die sich aus einer Wortfolge ergibt. Dies ist einer der Gründe, warum Ansätze des maschinellen Lernens die Oberhand gewonnen haben. Große Sprachmodelle wie Googles BERT wurden so trainiert, dass der Computer Wortfolgen und ihren Kontext besser verstehen kann.
Sentiment analysis: Methoden des maschinellen Lernens
Ein maschineller Lernansatz für die sentiment analysis beinhaltet das Trainieren eines Modells mithilfe von maschinellen Lernalgorithmen auf der Grundlage von Trainingsdaten. Die sentiment analysis kann als Klassifizierungsproblem formuliert werden, bei dem es zwei Klassen gibt:
- Positiv
- Negativ
Der Algorithmus wird anhand eines großen Korpus annotierter Textdaten trainiert, wobei die Sentimentklasse jedes Textes manuell beschriftet wurde. Diese Art des maschinellen Lernens wird als überwachtes Lernen bezeichnet .
Wir können einen Trainingsdatensatz erstellen, der wie folgt aussieht:
Mithilfe von NLP-Techniken können wir den Text in einen numerischen Vektor umwandeln, sodass ein Computer ihn verstehen und das Modell trainieren kann. Sobald das Modell mit den gekennzeichneten Daten trainiert wurde, können wir das Modell verwenden, um die Stimmung neuer oder unbekannter Textdaten automatisch zu klassifizieren.
Vorteile der sentiment analysis auf Basis maschinellen Lernens
Auf maschinellem Lernen basierende Ansätze können genauer sein als regelbasierte Methoden, da wir die Modelle anhand riesiger Textmengen trainieren können. Durch die Verwendung eines großen Trainingssatzes wird der Algorithmus für maschinelles Lernen vielen Variationen ausgesetzt und kann lernen, Stimmungen anhand subtiler Hinweise im Text genau zu klassifizieren.
Wir können Machine-Learning-Modelle auch in domänenspezifischer Sprache trainieren und so das Modell für den jeweiligen Anwendungsfall robuster machen. Wenn wir beispielsweise eine sentiment analysis zu Finanznachrichten durchführen, würden wir Finanzartikel als Trainingsdaten verwenden, um unser Modell mit dem Fachjargon der Finanzbranche vertraut zu machen.
Einschränkungen der sentiment analysis auf Basis maschinellen Lernens
Eine der größten Hürden für die sentiment analysis auf Basis von maschinellem Lernen besteht darin, dass zum Erstellen eines robusten Modells ein umfangreiches annotiertes Trainingsset erforderlich ist. Wenn das Trainingsset zudem verzerrte oder ungenaue Daten enthält, ist auch das resultierende Modell verzerrt oder ungenau. Je nach Domäne kann es mehrere Tage oder sogar Wochen dauern, bis ein Expertenteam ein Trainingsset annotiert und auf Verzerrungen und Ungenauigkeiten überprüft hat.
Über das Trainieren des Modells hinaus wird maschinelles Lernen häufig von Datenwissenschaftlern und Softwareentwicklern in die Produktion umgesetzt. Es erfordert viel Erfahrung, den geeigneten Algorithmus auszuwählen, die Genauigkeit der Ausgabe zu validieren und eine Pipeline aufzubauen, um Ergebnisse in großem Maßstab zu liefern. Aufgrund der erforderlichen Fähigkeiten kann das Erstellen von auf maschinellem Lernen basierenden sentiment analysis modellen auf Unternehmensebene ein kostspieliges Unterfangen sein.
Sentiment analysis: Hybride Methoden
Da sowohl regelbasierte als auch auf maschinellem Lernen basierende Methoden Vor- und Nachteile haben, kombinieren einige Systeme beide Ansätze, um die Nachteile der Verwendung nur eines Ansatzes zu reduzieren. Der hybride Ansatz ist nützlich, wenn bestimmte Wörter mehr Gewicht haben, und ist auch eine gute Möglichkeit, Bereiche anzugehen, in denen viel Fachjargon verwendet wird.
Nehmen wir beispielsweise an, wir haben ein maschinell gelerntes Modell, das Text als positiv, negativ und neutral klassifizieren kann. Wir könnten das Modell mit einem regelbasierten Ansatz kombinieren, der besagt, dass, wenn das Modell neutral ausgibt, der Text aber Wörter wie „schlecht“ und „schrecklich“ enthält, diese als negativ neu klassifiziert werden sollen.
Arten der sentiment analysis
Betrachten Sie die verschiedenen Arten der sentiment analysis, bevor Sie entscheiden, welcher Ansatz für Ihren Anwendungsfall am besten geeignet ist. Sie können aus drei Arten wählen.
1. Binäre sentiment analysis
Bei der binären sentiment analysis wird Text als positiv oder negativ kategorisiert. Da es nur zwei Kategorien gibt, in die der Inhalt eingeteilt werden kann, weisen diese Systeme tendenziell eine höhere Genauigkeit auf, allerdings auf Kosten der Granularität.
2. Multi-Klassen-sentiment analysis
Bei der Multi-Class-sentiment analysis wird Text in mehr als zwei Sentimentkategorien kategorisiert, z. B. sehr positiv, positiv, sehr negativ, negativ und neutral. Da Multi-Class-Modelle viele Kategorien haben, können sie schwieriger zu trainieren und weniger genau sein. Diese Systeme erfordern häufig mehr Trainingsdaten als ein binäres System, da viele Beispiele jeder Klasse benötigt werden, die idealerweise gleichmäßig verteilt sind, um die Wahrscheinlichkeit eines verzerrten Modells zu verringern.
3. Granulare sentiment analysis
Bei der granularen sentiment analysis wird Text anhand positiver oder negativer Bewertungen kategorisiert. Je höher die Bewertung, desto positiver die Polarität, während eine niedrigere Bewertung eine negativere Polarität anzeigt. Die granulare sentiment analysis wird häufiger bei regelbasierten Ansätzen eingesetzt, die zur Bewertung des Textes auf Wortlexika zurückgreifen.
Anwendungen der sentiment analysis
Heutzutage wird die sentiment analysis in vielen Bereichen angewendet, unter anderem:
- Marketing
- Politik
- Finanzen
sentiment analysis für Marketing
Die sentiment analysis ist im Marketing beliebt, weil wir damit Kundenfeedback zu einem Produkt oder einer Marke analysieren können. Durch Data Mining von Produktbewertungen und Social-Media-Inhalten liefert die sentiment analysis Einblicke in die Kundenzufriedenheit und Markentreue. Die sentiment analysis kann auch dabei helfen, die Wirksamkeit von Marketingkampagnen zu bewerten und Verbesserungsbereiche zu identifizieren.
Genauso wie wir mithilfe der sentiment analysis die öffentliche Meinung zu unserer Marke ermitteln können , können wir damit auch die öffentliche Meinung zu den Marken und Produkten unserer Konkurrenten ermitteln. Wenn wir feststellen, dass ein Konkurrent ein neues Produkt auf den Markt bringt, das von der Öffentlichkeit schlecht angenommen wird, können wir möglicherweise die Schwachstellen identifizieren und ein Konkurrenzprodukt auf den Markt bringen, das den Verbraucherstandards entspricht.
sentiment analysis für die Politik
sentiment analysis werden in der Politik eingesetzt, um Einblicke in die öffentliche Meinung zu gewinnen und politische Strategien und Entscheidungsprozesse zu unterstützen. Mithilfe von sentiment analysis können politische Entscheidungsträger im Idealfall aufkommende Trends und Probleme identifizieren, die sich negativ auf ihre Wähler auswirken, und dann Maßnahmen ergreifen, um die Situation zu entschärfen und zu verbessern.
Die Zustimmung der Öffentlichkeit zu verstehen, ist in der Politik offensichtlich wichtig. Deshalb ist die sentiment analysis ein beliebtes Instrument für politische Kampagnen. Das Team eines Politikers kann die sentiments analysis verwenden, um die Rezeption politischer Kampagnen und Debatten zu überwachen, sodass Kandidaten ihre Botschaften und Strategien anpassen können. Wir können die sentiments analysis auch verwenden, um die Medienvoreingenommenheit zu verfolgen und zu beurteilen, ob Inhalte positive oder negative Emotionen gegenüber einem bestimmten Kandidaten hervorrufen.
Sentiment analysis für Finanzen
Die Stimmung kann die Finanzmärkte bewegen. Deshalb haben große Investmentfirmen wie Goldman Sachs NLP-Experten angeheuert, um leistungsstarke Systeme zu entwickeln, mit denen aktuelle Nachrichten und Finanzberichte schnell analysiert werden können . Mithilfe der sentiments analysis können wir Finanzberichte, Sitzungen der Federal Reserve und Gewinnaufrufe untersuchen, um die zum Ausdruck gebrachte Stimmung zu ermitteln und wichtige Trends oder Probleme zu identifizieren, die den Markt beeinflussen werden. Diese Informationen können Anlageentscheidungen beeinflussen und dabei helfen, Vorhersagen über die finanzielle Gesundheit eines Unternehmens – oder sogar der Wirtschaft als Ganzes – zu treffen.
Ähnlich wie bei der Marktforschung kann die Analyse von Nachrichtenartikeln, Social-Media-Posts und anderen Online-Inhalten zu einer bestimmten Marke Investoren dabei helfen, zu verstehen, ob ein Unternehmen bei seinen Kunden einen guten Ruf genießt. Wenn ein Investor beispielsweise sieht, dass die Öffentlichkeit negatives Feedback zu einer neuen Produktlinie einer Marke hinterlässt, könnte er davon ausgehen, dass das Unternehmen die erwarteten Verkaufsziele nicht erreichen wird, und seine Aktien verkaufen binary.
Herausforderungen bei der sentiments analysis
Obwohl hybride Ansätze, die eine regelbasierte und auf maschinellem Lernen basierende sentiments analysis kombinieren, sehr genau sein können, gibt es immer noch viele Herausforderungen beim Verstehen der menschlichen Sprache:
- Kontextuelle Mehrdeutigkeit
- Ironie und Sarkasmus
- Lexikalische Mehrdeutigkeit
Kontextuelle Mehrdeutigkeit
Die sentiments analysis kann eine Herausforderung darstellen, wenn die in einem Text ausgedrückte Stimmung kontextuell mehrdeutig ist. Nehmen wir beispielsweise an, wir bewerten einen Staubsauger und hinterlassen eine Bewertung mit dem Inhalt „Der Staubsauger saugt wirklich.“ Die Bewertung könnte negativ oder neutral sein, da Staubsauger tatsächlich Dinge aufsaugen. Algorithmen für maschinelles Lernen können Schwierigkeiten haben, die Stimmung richtig zu klassifizieren, wenn sie auf kontextuelle Mehrdeutigkeit stoßen.
Ironie und Sarkasmus
Wenn wir Ironie und Sarkasmus in einem Text verwenden, kann es für jeden Ansatz schwierig sein, die Stimmung richtig einzuordnen, da diese rhetorischen Mittel das Gegenteil von dem ausdrücken, was man eigentlich meint. Wenn man beispielsweise sagt „Wir haben heute tolles Wetter“, während es draußen stürmt, könnte das sarkastisch gemeint sein und sollte als negativ eingestuft werden. Da unser Modell jedoch kein Konzept von Sarkasmus hat, geschweige denn vom heutigen Wetter, wird es es höchstwahrscheinlich fälschlicherweise als positiv einstufen.
Lexikalische Mehrdeutigkeit
Wörter können mehrere Bedeutungen haben und die mit einem Wort verbundene Stimmung kann je nach Kontext variieren. Dies ist einer der Gründe, warum regelbasierte Ansätze schwierig und ungenau sein können. Beispielsweise kann das Wort „krank“ sowohl eine positive Bedeutung (z. B. „Die Musik klingt krank!“) als auch eine negative Bedeutung (z. B. „Ich habe Grippe“) haben. Insbesondere bei der Verwendung von Slang können sentiments analysis modelle Schwierigkeiten haben, Wörter mit mehreren Bedeutungen zu verstehen.