
kontaktiere uns


In diesem Bericht werden die Kundenrezensionen des Britannia International Hotel Canary Wharf analysiert. Die Analyse wurde mit Techniken der natürlichen Sprachverarbeitung durchgeführt. Anhand der Ergebnisse wurde ermittelt, welche Aspekte des Hotelservices verbessert werden mussten.
Abgesehen vom Gastgewerbe kann diese Analyse jedem anderen Sektor zugute kommen, der Zugang zu Kundenfeedback hat, wie z. B. E-Commerce, Gastronomie oder die Unterhaltungsbranche.
Einer der wichtigsten Aspekte beim Verständnis eines Unternehmens ist das Verständnis seiner Stärken und Schwächen. Die Analyse, warum es floriert oder nicht, ist ein Schlüssel zur Langlebigkeit dieses Unternehmens. Hotels ist dieses Szenario nicht fremd.
Als Geschäftsinhaber ist es wichtig zu verstehen, warum einige Kunden möglicherweise nicht ins Hotel zurückkehren, was der Grund für eine gewisse Abneigung ist oder was ihnen positiv auffiel.
Um diese Recherche durchzuführen, haben wir einen Datensatz mit Hotelrezensionen gesammelt und unsere Aufmerksamkeit auf ein bestimmtes Hotel gerichtet: das Britannia International Hotel Canary Wharf.
Das Datensatz wurde von der Kaggle-Plattform gesammelt und enthielt über 515.000 Kundenrezensionen und Bewertungen von 1493 Luxushotels in ganz Europa.
Um Einblicke in die Hotelrezensionen zu gewinnen und die Gefühle und das Feedback der Kunden genauer zu verstehen, mussten wir die Kundenmeinungen und die Segmentierung in unserem Datensatz anhand der verfügbaren Daten verstehen.
Darüber hinaus ist es aufgrund des großen Korpus an Kundenfeedback zeitaufwändig, es manuell zu überprüfen, um die Präferenzen und Probleme der Kunden zu erfassen. Daher analysierten wir die Bewertungstexte auch mithilfe natürlicher Sprachverarbeitung, um die inneren Gefühle und Emotionen hinter den Bewertungen zu verstehen und zu erkennen, welche Aspekte des Hotels verbessert werden mussten.
Wir haben diesen Prozess zwar auf das Gastgewerbe angewendet, aber diese Art der Analyse kann problemlos für jede andere Branche implementiert werden, in der Kundenfeedback erfasst oder sogar durch das Sammeln von Kundenkommentaren aus Beiträgen in sozialen Netzwerken ermöglicht wird.
Wir haben mit der Auswertung der verfügbaren Daten begonnen, wobei wir besonders auf das Format und die Solidität der einzelnen Felder geachtet haben. Wie es beim Umgang mit Datensätzen üblich ist, insbesondere bei solchen, die benutzergenerierte Daten beinhalten, mussten einige Daten bereinigt werden. Dies ist ein wichtiger Schritt in jedem Datenanalyseprozess, um sicherzustellen, dass die Daten, mit denen wir arbeiten und die wir als Grundlage für Erkenntnisse verwenden, solide sind und daher zu vernünftigen und repräsentativen Schlussfolgerungen führen.
Im speziellen Fall dieses Datensatzes musste der eigentliche Überprüfungstext geringfügig bereinigt werden, um überflüssige Leerzeichen zu entfernen. Wir haben jedoch auch ein erhebliches Problem festgestellt: In der Bewertung fehlten alle Satzzeichen. Daher war es notwendig, einen Vorverarbeitungsschritt durchzuführen. Wir haben einen Teil der Struktur wiederhergestellt, die durch diese Interpunktion entsteht, um sicherzustellen, dass wir Techniken der natürlichen Sprachverarbeitung verwenden und relevante Ergebnisse erzielen konnten. Eine einfache, aber effektive Methode bestand darin, sich dieser Struktur anzunähern, indem vor jedem Wort, das mit einem Großbuchstaben begann, Punkte hinzugefügt wurden.
Die Effektivität dieser Methode war auch auf unsere zusätzliche Verarbeitung zurückzuführen, bei der wir bekannte Akronyme und benannte Entitäten herausfilterten, um keine unnötigen Punkte hinzuzufügen. Um dies zu erreichen, verwendeten wir die automatische Erkennung benannter Entitäten, ein Verfahren, bei dem versucht wird, benannte Entitäten in einem bestimmten Text automatisch zu identifizieren. Im NLP-Kontext sind benannte Entitäten reale Objekte, die mit einem Eigennamen identifiziert werden können, darunter Städte, Einzelpersonen, Organisationen usw.
Der nächste Schritt war die Erstellung unseres Datensatzes, den wir so gefiltert haben, dass er nur für unser spezielles Hotel gilt. Mit unserer Filterung konnten wir auf Informationen über unser spezielles Hotel zugreifen.
Der Datensatz enthält das Datum der Bewertung und die für diesen Aufenthalt vergebene Punktzahl. Er enthielt auch Informationen über die Nationalität des Rezensenten und Stichwörter, anhand derer die Merkmale des Besuchs beschrieben wurden, z. B. ob es sich um ein Doppel- oder Einzelzimmer handelte und wie lang der Aufenthalt war. Darüber hinaus gab es auch negative und positive Bewertungen zu diesem Aufenthalt.
Um die verfügbaren Daten einem realen Szenario anzunähern, haben wir die negativen und positiven Bewertungen nach dem Zufallsprinzip in nur einer Spalte zusammengefasst, um sie später zu analysieren.
Die erste Aufgabe bestand darin, die Bewertungen der Bewertungen nach Datum zu sehen. Es könnte möglich sein, Zeiträume zu identifizieren, in denen die Bewertungen nicht so gut ausfallen würden. Dies könnte auf saisonale Faktoren zurückzuführen sein, z. B. auf das Fehlen einer Klimaanlage im Sommer oder auf die Auswirkungen eines bestimmten Mitarbeiters.
Dieser Ansatz war nicht fruchtbar, aber dieselbe Logik galt für die Analyse der Stichwörter oder Nationalitäten. Anhand der Stichwörter konnten wir beispielsweise feststellen, ob Kunden, die ein Executive Doppelzimmer gebucht hatten, schlechte Bewertungen abgegeben haben oder nicht. Diese Visualisierung könnte durch Boxplots erfolgen. Wir haben all die verschiedenen Tags analysiert und festgestellt, dass die meisten von ihnen ähnliche Verteilungen widerspiegelten, was die Möglichkeit verhindert, relevante Erkenntnisse zu gewinnen.
In Bezug auf die Nationalitäten war es wichtig, die Verteilung unserer Kunden zu analysieren. Dies könnte Einblicke in die Effektivität des Marketingteams in einigen Märkten geben. Ohne die britischen Kunden, die 80% aller Kunden ausmachen, erhalten wir die folgende Übersicht über die Weltkarte, wobei dunklere Farbtöne auf eine höhere Anzahl von Rezensenten aus dieser Nationalität hinweisen:
Um das Gefühl hinter den Bewertungen besser zu verstehen, verwenden wir ein Sprachmodell, das auf der HuggingFace-Plattform gehostet wird, um festzustellen, ob die Bewertung positiv oder negativ war. Das mehrsprachige XLM-Roberta-Base-Modell wurde auf ~198 Millionen Tweets trainiert und für die Stimmungsanalyse optimiert. Die Sentiment-Feinabstimmung wurde in 8 Sprachen vorgenommen.
Da wir die Bewertungen mit einem angemessenen Konfidenzniveau (Genauigkeit von 0,76 in unserem Datensatz) in positive und negative Bewertungen aufteilen konnten, haben wir versucht, Muster innerhalb dieser Bewertungen zu analysieren. Eine einfache Möglichkeit, die Wörter zu visualisieren, sind Wortwolken. Im Folgenden finden Sie die Wortwolke für negative und positive Bewertungen.
Aus der Analyse der Dynamik zwischen positiven und negativen Kundenrezensionen lassen sich viele Informationen gewinnen. Kunden wollen sicherlich ihre Meinung äußern, wie unser Datensatz zeigt, nach dem negative Bewertungen im Durchschnitt mehr als doppelt so lang sind wie positive Bewertungen. Wenn wir uns außerdem die Entwicklung der durchschnittlichen Anzahl von Bewertungen im Laufe der Zeit ansehen, können wir einen potenziell leicht steigenden Trend bei der Anzahl negativer Bewertungen erkennen, auf den das Unternehmen achten sollte.
Neben der Identifizierung der Stimmung hinter einem Text besteht eine weitere Technik im NLP darin, die Emotionen dahinter zu identifizieren. Um dies zu erreichen, haben wir die NCRLex-Bibliothek verwendet. Die NCRLex-Bibliothek ermöglicht es uns, Emotionen in Texten wie Angst, Wut oder Überraschung zu erkennen. Diese Analyse ermöglicht es uns, genauer zu verstehen, wie Kunden über eine bestimmte Dienstleistung oder ein bestimmtes Produkt denken.
Ähnlich wie bei der Stimmungsvisualisierung können wir für jede Emotion in den positiven oder negativen Bewertungen eine Wortwolke visualisieren, indem wir die verschiedenen damit verbundenen Emotionen identifizieren. Die Wortwolke, die durch das Vertrauensgefühl in den positiven Bewertungen generiert wird, sieht beispielsweise wie folgt aus:
Dieser Prozess ermöglicht es uns, eine Vorstellung davon zu bekommen, was welche Kundenemotionen auslöst.
Um die Bewertungen weiter zu analysieren, wollten wir die Hauptobjekte der Kundenkommentare in ihren Bewertungen identifizieren. Um dies zu erreichen, haben wir mithilfe von YAKE, einer unbeaufsichtigten automatischen Methode zur Keyword-Extraktion, relevante Keywords aus den positiven und negativen Bewertungen extrahiert.
Diese Methode berechnet statistische Merkmale, die sich auf Merkmale für jede Bewertung beziehen, einschließlich Groß- und Kleinschreibung, Position, Häufigkeit, Kontext und Gewichtung jedes Begriffs entsprechend diesen Merkmalen.
Schließlich wird ein Score berechnet, der die Bedeutung jedes Begriffs als potenzielles Keyword angibt. Dies ist eine leistungsstarke und dennoch leichte Methode, die aufgrund ihrer völlig unbeaufsichtigten Natur in verschiedenen Bereichen und sogar in anderen Sprachen eingesetzt werden kann.
Darüber hinaus haben wir einen rein frequenzbasierten Ansatz verwendet, um die häufigsten in Testberichten genannten Objekte aufzudecken. Die Ergebnisse ähnelten unserer Keyword-Analyse und bestätigten deren Gültigkeit und Zuverlässigkeit.
Dies waren die Keywords, die für positive und negative Bewertungen identifiziert wurden:
Wie erwartet handelt es sich bei den identifizierten Schlüsselwörtern um allgemeine Punkte, die in den Bewertungen der Hotellerie behandelt werden. Sie sind bereits ein guter Indikator für einen angemessenen Service oder potenzielle Verbesserungsmöglichkeiten für das Hotel.
Wir wollten jedoch tiefer in die Analyse einsteigen und herausfinden, was es mit diesen Objekten auf sich hatte, die wie von den Kunden erwartet funktionierten — oder nicht — funktionierten. Warum waren Fenster beispielsweise ein so wichtiger Aspekt negativer Bewertungen?
Zu diesem Zweck haben wir eine andere Technik von Natural Language Processing verwendet: das syntaktische Abhängigkeitsanalyse. Wir verwendeten Spacy, eine schnelle, umfassende und produktionsreife NLP-Bibliothek für Python, um einen syntaktischen Abhängigkeitsbaum zu erstellen, der alle Begriffe im Eingabetext entsprechend ihrer syntaktischen Beziehung miteinander verbindet. Dann haben wir diesen Baum abgefragt, um genau zu ermitteln, was den Kunden an einem bestimmten Keyword (z. B. „Raum“ oder „Standort“) besonders gut gefallen hat oder nicht.
Das Ergebnis war eine Liste von Modifikatoren für jedes Schlüsselwort. Wir könnten zum Beispiel erfahren, dass Kunden ein „Zimmer“ für „geräumig“ oder die „Lage“ für „praktisch“ halten. Diese daraus resultierende Liste von Modifikatoren ermöglichte es uns, Wortwolken zu erstellen, um die Häufigkeit der einzelnen Modifikatoren für das angegebene Schlüsselwort, wie z. B. die Wortwolke unten, für das Schlüsselwort „Zimmer“ zu visualisieren:
Die Analyse dieser häufigen Modifikatoren für jedes Keyword, ihre Relevanz und Gewichtung und die separate Analyse nach positiven und negativen Bewertungen verschaffte uns einen tieferen Einblick in die Ergebnisse, die wir unten präsentieren, den Kunden am besten — und nicht so sehr — gefallen.
Bei der oben beschriebenen Analyse des Datensatzes konnten wir einige positive Aspekte des Geschäfts sowie wichtige Verbesserungsbereiche identifizieren.
Ein auffälliger Kommentar von Kunden, der häufig sowohl in positiven als auch in negativen Bewertungen auftaucht, ist, dass einige das Hotel für veraltet halten. Die drei wichtigsten Modifikatoren, die verwendet werden, um das Hotel in negativen Bewertungen zu beschreiben, beziehen sich auf diese Qualität. Dies deutet darauf hin, dass das Unternehmen möglicherweise eine Renovierung in Betracht ziehen möchte, um diese Probleme zu lösen.
Die Keyword-Analyse zeigt die häufigsten Punkte der Kunden bei der Veröffentlichung ihrer Bewertungen. Wie zu erwarten war, spielt das Zimmer sowohl in negativen als auch in positiven Bewertungen eine herausragende Rolle. Während des gesamten von uns analysierten Zeitraums wurde es regelmäßig in negativen Bewertungen erwähnt, aber in den letzten sechs Monaten gab es in den letzten sechs Monaten einen Anstieg der Erwähnungen von Zimmern in positiven Bewertungen, ein potenziell günstiger Trend, dessen sich das Unternehmen bewusst sein sollte. In positiven Bewertungen beziehen sich die häufigsten Kommentare darauf, dass die Zimmer sauber und geräumig sind. Es gibt auch Hinweise darauf, dass es insgesamt komfortabel und billig ist.
Die Betten wurden ebenfalls häufig erwähnt, und einige Nutzer betrachteten sie als steif und unbequem. Die Verbreitung dieses Kommentars deutet auch darauf hin, dass unmittelbar Verbesserungsbedarf besteht. In diesem Zusammenhang wiesen einige Kunden auch darauf hin, dass sie das Hotel als laut empfanden.
Darüber hinaus ist ein weiteres großes Problem, das von Kunden gemeldet wurde, die Heizungs-, Lüftungs- und Klimaanlage im Hotel — „heiß“ und „kalt“ waren die Hauptsorgen der Kunden in Bezug auf ihre Zimmer. Ein besonderes Problem war das Zimmerfenster, das so häufig genannt wurde, dass es als eines unserer Schlüsselwörter identifiziert wurde, zumal es die Unterstützung des Personals erforderte, um die Fenster einiger Zimmer zu öffnen.
In diesem Sinne wurde das Personal häufig mit positiven und negativen Bewertungen angesprochen, und einige Kunden betrachteten sie als unhöflich. In den meisten Fällen wurden sie jedoch als freundlich und hilfsbereit angesehen, obwohl ein besonderer interessanter Punkt darin besteht, dass viele Kunden das Hotel für unterbesetzt hielten. Schließlich bleibt die Erwähnung des Personals in den Bewertungen im Laufe der Zeit relativ konstant.
Die Lage des Hotels war ein weiterer wichtiger Faktor für positive Bewertungen. Es wurde überwiegend als positiver Aspekt wahrgenommen, es gab viele allgemeine Komplimente und wurde als günstig und zentral gelegen angesehen. Ein entscheidender Trend, dessen sich das Unternehmen bewusst sein sollte, ist jedoch, dass der Standort im Laufe der Zeit in positiven Bewertungen seltener und in negativen Bewertungen zunehmend erwähnt wurde. Dies mag zwar mit dem externen Standort und daher mit externen Faktoren zusammenhängen, auf die das Hotel keinen direkten Einfluss hat, aber es ist ein potenzieller Trend, nach dem man Ausschau halten sollte.
Abschließend ist zu erwähnen, dass das WLAN des Hotels in einer erheblichen Anzahl negativer Bewertungen bewertet wurde, hauptsächlich weil es kostenpflichtig und nicht kostenlos ist.
Business Intelligence- und Stimmungsanalyseprojekte wie dieses können für viele Anwendungsfälle von Nutzen sein.
Heutzutage wird ein erheblicher Teil des Einkaufs online getätigt. E-Commerce steht für einen wachsenden Trend des nahezu unbegrenzten Zugangs zu Ressourcen, Märkten und Produkten in Echtzeit von überall auf der Welt. Es ist sehr wichtig, die Reichweite des Marketings im Hinblick auf die Kundensegmentierung zu verstehen, damit ein Unternehmen seine Bemühungen anpassen kann, um die gewünschte Zielgruppe zu erreichen.
Fast jede E-Commerce-Plattform enthält einen Bewertungsbereich, in dem Kunden die von ihnen gekauften Produkte kommentieren können. Dieser Kommentarbereich stellt eine wertvolle Datenquelle dar, die dem Unternehmen einen Mehrwert bieten kann.
Durch NLP-Techniken ist es möglich, Erkenntnisse darüber zu gewinnen, was der Kunde an den Produkten mag oder nicht mag. Diese Erkenntnisse können helfen, Fehler oder weitere Verbesserungen des Produkts und/oder der Plattform zu verstehen. Wir können wichtige Aspekte identifizieren, die beim Kunden Unsicherheit oder andere Emotionen hervorrufen, sodass wir darauf reagieren können.
Es wird auch möglich, die Entwicklung der Nutzerstimmung zum Produkt im Laufe der Zeit zu verfolgen und zu messen, wie sich Änderungen auf die allgemeine Meinung der Kunden ausgewirkt haben.
Das Gastgewerbe ist ein sehr wettbewerbsintensiver Sektor, in dem sich kleine Details als wesentliche Vorteile gegenüber der Konkurrenz erweisen können.
Booking, Trivago, Google und andere Plattformen listen häufig Einrichtungen auf. Der gemeinsame Aspekt dieser Plattformen ist, dass Kunden sie häufig verwenden, um Bewertungen zu hinterlassen. Durch die Analyse der Bewertungsergebnisse und Kommentare ist es möglich, Einblicke in die Meinungen der Kunden zu wichtigen Aspekten des Unternehmens zu gewinnen.
Anhand dieser Daten können wir beurteilen, welche Aspekte des Unternehmens geändert oder beachtet werden müssen, welche Teile die Kunden schätzen, und möglicherweise einige Anpassungen vorhersehen, die wir in Betracht ziehen sollten.
Restaurants, Cafés und Bars verlassen sich zunehmend auf ihre Online-Präsenz, um Kunden anzulocken. Dazu gehört die Listung auf verschiedenen Plattformen wie Yelp, Google, Zomato und Tripadvisor, auf denen Nutzer Bewertungen und schriftliche Rezensionen hinterlassen können. Oft entscheiden Kunden allein aufgrund dieser Bewertungen, welche neuen Orte sie ausprobieren möchten, was sie zu einem wichtigen Faktor machen, um zu verstehen, wie sich das Unternehmen entwickelt.
Es liegt im besten Interesse dieser Unternehmen, all dieses Feedback zu nutzen, um Wege zu finden, sich von ihren Mitbewerbern abzuheben. Die Analyse möglicher Kundenprobleme hilft dabei, in sinnvolle Verbesserungen zu investieren. Wenn Sie die Stimmung der Verbraucher im Laufe der Zeit verfolgen, wird sichergestellt, dass sich die Investitionen auszahlen.
Jedes Unternehmen, das eine bestimmte Größe überschreitet, muss sich auf Data-Science-Techniken verlassen, um viele Bewertungen zu analysieren, die es möglicherweise auf verschiedenen Plattformen erhält. Dieser Prozess kann automatisiert werden, wodurch schnelles Feedback und eine umfassende Vorstellung davon erhalten werden, was Kunden anzieht oder desillusioniert. Dies wird Managern helfen, ihre Gastronomie auf die nächste Stufe zu heben.
Die Unterhaltungsbranche ist breit gefächert und umfasst alles, von Filmen, Fernsehsendungen und YouTube-Kanälen bis hin zu Vergnügungsparks und Zirkus-Acts. Allen diesen Unternehmen, insbesondere im digitalen Zeitalter, ist gemeinsam, dass sie Kritiken und Kommentaren sowohl von Kritikern als auch von Zuschauern ausgesetzt sind.
Wenn das Unternehmen wächst, kann die Anzahl der Bewertungen unüberschaubar werden, was es schwierig macht, die allgemeine Stimmung der Bevölkerung zu verstehen. An dieser Stelle sollten NLP-Techniken ins Spiel kommen, die es ermöglichen, viele Kommentare zu analysieren und zu analysieren, um wertvolle und umsetzbare Erkenntnisse zu gewinnen.
Zusammenfassend haben wir das Feedback unserer Kunden zu ihrem Aufenthalt in einem Hotel mithilfe von Techniken der Verarbeitung natürlicher Sprache analysiert und umsetzbare Erkenntnisse gewonnen, die sich direkt auf Geschäftsentscheidungen auswirken können. Diese Analyse und die zugrunde liegenden Prozesse können für viele andere Anwendungen verwendet werden und bieten Unternehmen in vielen Branchen einen Mehrwert.
Dieses Projekt wurde in 3 Tagen mit einem Team von 2 Imaginary Cloud Data Scientists abgeschlossen. Imaginary Cloud bietet Data Science- und KI-Entwicklungsdienstleistungen an und konzentriert sich darauf, seinen Kunden durch maßgeschneiderte Lösungen und einen agilen Prozess den höchsten Mehrwert zu bieten.
Kontaktieren Sie uns, wenn Sie eine maßgeschneiderte Data Science- oder KI-Lösung benötigen:
Inhaltsautor mit großer Neugier auf die Auswirkungen der Technologie auf die Gesellschaft. Immer umgeben von Büchern und Musik.
Datenwissenschaftler sind begeistert von Datenwissenschaft und achten auf ihre ethischen Implikationen. Neben der Arbeit liebe ich es, Musik zu hören und eine gute Geschichte zu lesen.
Datenwissenschaftler, der gerne Probleme untersucht. In meiner Freizeit bringe ich Kindern Basketball bei und gehe gerne an den Strand.
People who read this post, also found these interesting: