Zephyrnet-Logo

Verbesserung der Vielfalt durch Empfehlungssysteme in Machine Learning und KI

Datum:

Empfehlungssystem

Sie werden jeden Tag von maschinellem Lernen und KI-Empfehlungsalgorithmen beeinflusst. Was Sie in sozialen Medien über Facebook, Twitter, Instagram konsumieren, die Personalisierung, die Sie beim Suchen, Hören oder Ansehen von Google, Spotify, YouTube erleben, was Sie mit Airbnb und UberEATS entdecken, all diese Produkte werden durch maschinelles Lernen und KI unterstützt Empfehlungssysteme.

Empfehlungssysteme beeinflussen unseren Alltag

80% aller Inhalte, die auf konsumiert werden Netflix und 98 Milliarden US-Dollar des Jahresumsatzes bei Amazon werden durch Empfehlungssysteme generiert, und diese Unternehmen investieren weiterhin Millionen in die Entwicklung besserer Versionen dieser Algorithmen.

Es gibt zwei Haupttypen von Empfehlungssystemen:

  1. Kollaboratives Filtern: Finden Sie ähnliche Benutzer wie Sie und empfehlen Sie etwas basierend auf dem, was diesem ähnlichen Benutzer gefällt.
  2. Inhaltsbasierte Filterung: Nehmen Sie Ihren bisherigen Verlauf und Ihr Verhalten auf, um Empfehlungen abzugeben

Wenn dieser ausführliche Bildungsinhalt für Sie nützlich ist, Abonnieren Sie unsere AI Research Mailingliste benachrichtigt werden, wenn wir neues Material veröffentlichen.

Es gibt auch ein hybridbasiertes Empfehlungssystem, das kollaboratives und inhaltsbasiertes Filtern kombiniert. Diese Algorithmen für maschinelles Lernen und KI sind es, die die Verbraucherprodukte antreiben, die wir täglich verwenden.

So funktionieren Empfehlungssysteme. Bild von Sankt.

Das Problem ist, dass diese Algorithmen im Grunde auf dasselbe optimieren: Ähnlichkeiten

Empfehlungsalgorithmen machen Optimierungen basierend auf der Schlüsselannahme, dass nur Ähnlichkeiten gut sind. Wenn Sie Fantasy-Bücher mögen, werden Ihnen mehr Fantasy-Bücher empfohlen, wenn Sie progressive Politik mögen, werden Sie progressivere Politik empfohlen. Diesen Algorithmen zu folgen, schränkt unser Weltbild ein und wir sehen keine neuen, interessanten und einzigartigen Perspektiven.

Empfehlungssysteme führen uns zu einem eingleisigen Verstand

Wie ein Pferd, das mit Scheuklappen rennt, fallen wir in eine Echokammer und die gefährliche KI-Rückkopplungsschleife, in der die Ausgaben des Algorithmus wiederverwendet werden, um neue Versionen des Modells zu trainieren. Dies engt unser Denken ein und verstärkt Vorurteile. Aktuelle Ereignisse wie die like Facebook-Cambridge Analytica-Datenschutzverletzung den Einfluss der Technologie auf das menschliche Verhalten und ihre Auswirkungen auf den Einzelnen und die Gesellschaft aufzeigen.

Psychologie und Soziologie sind sich einig: Wir fürchten das, was wir nicht kennen. Wenn Menschen kurzsichtig werden, dann entsteht die „Wir gegen sie“-Mentalität und dort wurzeln Vorurteile. Die zivilen Unruhen in den USA und weltweit lassen sich auf diese Konzepte zurückführen. Glücklicherweise zeigt die Forschung auch, dass Perspektivenvielfalt Verständnis und Verbundenheit schafft.

Das ist auch ein geschäftliches Problem

Der typische Verbraucher hat 3 bis 5 Vorlieben:

  • 3 bis 5 Lieblingsbuch- oder Filmgenres
  • 3 bis 5 meistgehörte Musikkategorien
  • 3 bis 5 verschiedene Modestile
  • 3 bis 5 bevorzugte Küchen
Verbraucher sind vielfältig

Warum spiegelt sich dieses vielfältige Verbraucherverhalten nicht besser im Verhalten unserer Technologie wider? Wenn ein Unternehmen in der Lage ist, einen Kunden dazu zu bringen, eine neue Kategorie auszuprobieren, z. B. einen laufenden Kunden in einen neuen Rennradkunden zu verwandeln, wird dieser Kunde wahrscheinlich 5- bis 10-mal mehr für Onboarding und Käufe in dieser neuen Aktivität ausgeben. Für jede unterschiedliche Kategorie empfiehlt sich ein Unternehmen nicht, d. h. verlorene Umsätze und Engagement.

Die Chance: Wie können wir ein besseres Empfehlungssystem aufbauen, das Verbrauchervielfalt ermöglicht und den Customer Lifetime Value erhöht?

Wir können dieses Problem durch die Kundenlinse angehen. Nehmen wir Elon Musk als vorbildlichen Weltbürger, der öffentlich erklärte, dass er Fantasy-Bücher liebte, als er aufwuchs, und Herr der Ringe einen großen Einfluss auf ihn haben.

Aber wenn Elon weiterhin die Empfehlungen des heute sichtbarsten maschinellen Lernalgorithmus bei Amazon befolgen würde, würde er den Weg der Fantasie, Fantasie und noch mehr Fantasie fortsetzen. Elon hat auch erklärt, dass Geschäftsbücher sein Weltbild geprägt haben, mit Null auf Eins als seine Empfehlung. Die Technologie sollte mehr dieser Verbindungen für alle ermöglichen und nicht einschränken.

Der Status Quo führt zu mehr vom Gleichen, wie können wir die Interessen des Kunden besser abdecken? Bilder von Amazon.

Wie können wir eine Empfehlungsmaschine erstellen, die ein Eingabebuch wie Herr der Ringe nimmt und ein Ausgabebuch wie Zero to One empfiehlt?

Wenn wir dies für einen Einzelfall wie den von Elon lösen können, können wir beginnen zu sehen, wie ein besseres Empfehlungssystem vom Ähnlichkeitspfad abweichen kann, um eine sinnvollere Vielfalt zu schaffen.

Aufbau eines Diversity-Recommender-Systems

Der Data-Science-Prozess:
1. Definiere ein Ziel
2. Daten sammeln, untersuchen und bereinigen
3. Daten transformieren
4. Empfehlungs-Engine für maschinelles Lernen erstellen
5. Proof-of-Concept-Engine für Diversity-Empfehlungen erstellen
6. Designmodelle
7. Geschäftswerthypothese und Zielstart

Der Data-Science-Prozess

1. Ziel definieren

Bücher sind die ideale Branche, um sie zu erkunden, da es eine klare Unterscheidung zwischen Buchkategorien und potenziellen Einnahmen gibt, im Gegensatz zu Musik, bei der der Dollarwert für das Hören neuer Genres weniger klar ist. Das Ziel ist es, ein Empfehlungssystem aufzubauen, bei dem wir ein Buch eingeben und es ausgeben lassen:

  1. Empfehlungen basierend auf Ähnlichkeiten, der Status-Quo-Algorithmus
  2. Empfehlungen basierend auf Vielfalt, die Entwicklung des Status quo

Das langfristige Ziel besteht darin, ein Empfehlungssystem zu entwickeln, das in verschiedenen Branchen angewendet werden kann und es den Kunden ermöglicht, Türen zu verschiedenen Entdeckungen zu öffnen und den Customer Lifetime Value für das Unternehmen zu erhöhen.

2. Daten sammeln, untersuchen und bereinigen

Umgang mit Daten

Goodreads bietet eine gute Datensatz. Hier müssen wir bestimmen, was nützlich ist, was entfernt werden kann und welche Datensätze zusammengeführt werden sollen.

# Load book data from csv import pandas as pd books = pd.read_csv('../data/books.csv') books
# Explore features
books.columns

Dieser Datensatz enthält 10,000 Bücher und wir möchten "Buch-Tags" als Schlüsselfunktion verwenden, da er umfangreiche Daten zu den Büchern enthält, die uns bei Empfehlungen helfen. Diese Daten leben in verschiedenen Datensätzen, also müssen wir die Daten zerteilen und das Datenpuzzle zusammensetzen.

# Load tags book_tags data from csv
book_tags = pd.read_csv('../data/book_tags.csv')
tags = pd.read_csv('../data/tags.csv') # Merge book_tags and tags tags_join = pd.merge(book_tags, tags, left_on='tag_id', right_on='tag_id', how='inner') # Merge tags_join and books
books_with_tags = pd.merge(books, tags_join, left_on='book_id', right_on='goodreads_book_id', how='inner') # Store tags into the same book id row
temp_df = books_with_tags.groupby('book_id')['tag_name'].apply(' '.join).reset_index()
temp_df.head(5) # Merge tag_names back into books
books = pd.merge(books, temp_df, left_on='book_id', right_on='book_id', how='inner')
books

Wir haben jetzt Buch-Tags in einem Datensatz.

3. Daten transformieren

Wir haben 10,000 Bücher im Datensatz mit jeweils 100 Buch-Tags. Was enthalten diese Buch-Tags?

# Explore book tags
books['tag_name']
Beispiel-Buchetiketten für Die Tribute von Panem und Harry Potter und der Stein der Weisen

Wir wollen diese Texte in numerische Werte umwandeln, damit wir Daten haben, die der maschinelle Lernalgorithmus versteht. TfidfVectorizer wandelt Text in Merkmalsvektoren um.

# Transform text to feature vectors
from sklearn.feature_extraction.text import TfidfVectorizer
tf = TfidfVectorizer(analyzer='word',ngram_range=(1, 2),min_df=0, stop_words='english')
tfidf_matrix = tf.fit_transform(books['tag_name'])
tfidf_matrix.todense()
Dies wird eine 10000×144268-Matrix

TF-IDF (Term Frequency – Inverse Document Frequency) berechnet, wie wichtig Wörter im Verhältnis zum gesamten Dokument sind. TF fasst zusammen, wie oft ein bestimmtes Wort in einem Dokument vorkommt. IDF verkleinert Wörter, die häufig in Dokumenten vorkommen. Dies ermöglicht es TF-IDF, die Bedeutung von Wörtern innerhalb eines Dokuments basierend auf der Beziehung und dem Gewichtungsfaktor zu definieren.

4. Empfehlungsmaschine für maschinelles Lernen erstellen

Jetzt bauen wir den Empfehlungsgeber. Wir können die Kosinusähnlichkeit verwenden, um die numerischen Werte zu berechnen, die Ähnlichkeiten zwischen Büchern angeben.

# Use numeric values to find similarities
from sklearn.metrics.pairwise import linear_kernel
cosine_sim = linear_kernel(tfidf_matrix, tfidf_matrix)
cosine_sim

Die Kosinusähnlichkeit misst den Kosinus des Winkels zwischen zwei Vektoren, die in einen mehrdimensionalen Raum projiziert werden. Je kleiner der Winkel, desto höher die Kosinusähnlichkeit. Mit anderen Worten, je näher diese Buchetiketten beieinander liegen, desto ähnlicher ist das Buch.

Als nächstes schreiben wir den maschinellen Lernalgorithmus.

# Get book recommendations based on the cosine similarity score of book tags Build a 1-dimensional array with book titles
titles = books['title']
tag_name = books['tag_name']
indices = pd.Series(books.index, index=books['title']) # Function that gets similarity scores
def tags_recommendations(title): idx = indices[title] sim_scores = list(enumerate(cosine_sim[idx])) sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True) sim_scores = sim_scores[1:11] # How many results to display book_indices = [i[0] for i in sim_scores] title_df = pd.DataFrame({'title': titles.iloc[book_indices].tolist(), 'similarity': [i[1] for i in sim_scores], 'tag_name': tag_name.iloc[book_indices].tolist()}, index=book_indices) return title_df

Dies ist der grundlegende Code, den wir für eine Empfehlungsmaschine benötigen. Dies ist der Baustein für den 98 Milliarden US-Dollar Umsatz generierenden Algorithmus von Amazon und andere ähnliche. Scheint fast zu einfach. Wir können hier aufhören oder unseren Code erweitern, um mehr Dateneinblicke anzuzeigen.

# Get book tags, total tags, and percentage of common tags
def recommend_stats(target_book_title): # Get recommended books rec_df = tags_recommendations(target_book_title) # Get tags of the target book rec_book_tags = books_with_tags[books_with_tags['title'] == target_book_title]['tag_name'].to_list() # Create dictionary of tag lists by book title book_tag_dict = {} for title in rec_df['title'].tolist(): book_tag_dict[title] = books_with_tags[books_with_tags['title'] == title]['tag_name'].to_list() # Create dictionary of tag statistics by book title tags_stats = {} for book, tags in book_tag_dict.items(): tags_stats[book] = {} tags_stats[book]['total_tags'] = len(tags) same_tags = set(rec_book_tags).intersection(set(tags)) # Get tags in recommended book that are also in target book tags_stats[book]['%_common_tags'] = (len(same_tags) / len(tags)) * 100 # Convert dictionary to dataframe tags_stats_df = pd.DataFrame.from_dict(tags_stats, orient='index').reset_index().rename(columns={'index': 'title'}) # Merge tag statistics dataframe to recommended books dataframe all_stats_df = pd.merge(rec_df, tags_stats_df, on='title') return all_stats_df

Jetzt geben wir ein Herr der Ringe in die Empfehlungsmaschine und sehen Sie sich die Ergebnisse an.

# Find book recommendations
lor_recs = recommend_stats('The Fellowship of the Ring (The Lord of the Rings, #1)')
lor_recs
Top 10 der empfohlenen Bücher basierend auf der Ähnlichkeitsbewertung von Buch-Tags

Wir erhalten eine Liste der Top 10 Bücher, die Herr der Ringe am ähnlichsten sind, basierend auf Buch-Tags. Die Empfehlungen sehen fast identisch mit der Website von Amazon aus:

Amazon.com ab August 2020

Erfolg! Die Erstellung einer Ähnlichkeitsempfehlung war Teil eins. Teil zwei produziert Vielfalt.

5. Erstellen Sie den Proof of Concept für die Diversity Recommendation Engine

In diesem nächsten Teil findet die Evolution statt. Der Diversity-Empfehlungsalgorithmus existiert derzeit nicht (öffentlich), daher wird diese Wissenschaft eine gewisse Kunst haben. Wie können wir, anstatt monatelang im Forschungs- und Mathematiklabor zu verbringen, einen Proof of Concept erstellen, der die Machbarkeit der Erstellung einer Diversity-Empfehlung entweder validiert oder widerlegt? Lassen Sie uns die Daten untersuchen.

Da wir Reverse Engineering durch die Kundenlinse von Elon Musk betreiben und möchten, dass der Recommender Zero to One ausgibt, wollen wir herausfinden, wo dieses Buch in Bezug auf Herr der Ringe positioniert ist.

# Find Zero to One book
lor_recs[lor_recs.title == 'Zero to One: Notes on Startups, or How to Build the Future']

In Bezug auf Herr der Ringe liegt Zero to One auf Platz 8,592 von 10,000 Büchern, basierend auf Ähnlichkeiten. Ziemlich niedrig. Dem Algorithmus zufolge befinden sich diese beiden Bücher an entgegengesetzten Enden des Spektrums und sind sich überhaupt nicht ähnlich. Dieses Buch befindet sich statistisch im untersten Quartil, was bedeutet, dass weder Ihnen noch Elon diese Gedankenvielfalt empfohlen werden würde.

# Calculate statistical data
lor_recs.describe()

Mit einem Boxplot können wir diese Positionierung besser visualisieren:

# Boxplot of similarity score
import matplotlib.pyplot as plt
lor_recs.boxplot(column=['similarity'])
plt.show() # Boxplot of percentage of common tags
lor_recs.boxplot(column=['%_common_tags'])
plt.show()
Positionierung basierend auf Kosinusähnlichkeit und gemeinsamen Buch-Tags im Vergleich zu allen 10,000 Büchern

Würden Sie nach Ihrem eigenen Wissen sagen, dass diese beiden Bücher so extrem unterschiedlich sind?

Wir können die Daten weiter untersuchen und die gängigsten Buch-Tags mit NLTK (Natural Language Toolkit) finden. Zuerst bereinigen wir Wörter wie das Entfernen von Bindestrichen, tokenisieren die Wörter und entfernen dann alle Stoppwörter. Nachdem der Text sauber ist, können wir die 10 am häufigsten vorkommenden Wörter berechnen, die in den Herr der Ringe-Buch-Tags vorkommen.

# Store book tags into new dataframe
lor_tags = pd.DataFrame(books_with_tags[books_with_tags['title']=='The Fellowship of the Ring (The Lord of the Rings, #1)']['tag_name']) # Find most frequent word used in book tags
import matplotlib
import nltk top_N = 10
txt = lor_tags.tag_name.str.lower().str.replace(r'-', ' ').str.cat(sep=' ') # Remove hyphens
words = nltk.tokenize.word_tokenize(txt)
word_dist = nltk.FreqDist(words) stopwords = nltk.corpus.stopwords.words('english')
words_except_stop_dist = nltk.FreqDist(w for w in words if w not in stopwords) print('All frequencies, including STOPWORDS:')
print('=' * 60)
lor_rslt = pd.DataFrame(word_dist.most_common(top_N), columns=['Word', 'Frequency'])
print(lor_rslt)
print('=' * 60)
lor_rslt = pd.DataFrame(words_except_stop_dist.most_common(top_N), columns=['Word', 'Frequency']).set_index('Word')
matplotlib.style.use('ggplot') lor_rslt.plot.bar(rot=0)
plt.show()
Häufigste Wörter in den Herr der Ringe-Buch-Tags

Da wir Vielfalt und Abwechslung wollen, können wir die häufigsten Wörter „Fantasie“ und „Fiktion“ nehmen und nach ungleichen oder unterschiedlichen Wörtern im Kontext von Buchgattungen filtern. Dies können Wörter wie Sachbuch, Wirtschaft oder Unternehmertum sein.

# Filter by unlike words
lor_recs_filter = lor_recs[(lor_recs['tag_name'].str.contains('non-fiction')) & (lor_recs['tag_name'].str.contains('economics')) & (lor_recs['tag_name'].str.contains('entrepreneurial'))]
lor_recs_filter

Dies schränkt die Liste ein und enthält nur Bücher, die "Sachbücher", "Wirtschaft" oder "Unternehmerisch" in den Buch-Tags enthalten. Um sicherzustellen, dass unserem Leser ein gutes Buch empfohlen wird, fügen wir 'average_rating' wieder in den Datensatz ein und sortieren die Ergebnisse nach der höchsten durchschnittlichen Buchbewertung.

# Merge recommendations with ratings
lor_recs_filter_merge = pd.merge(books[['title', 'average_rating']], lor_recs_filter, left_on='title', right_on='title', how='inner') # Sort by highest average rating
lor_recs_filter_merge = lor_recs_filter_merge.sort_values(by=['average_rating'], ascending=False)
lor_recs_filter_merge

Was ganz oben in der Liste steht – Zero to One. Wir haben unseren Weg entwickelt, um Vielfalt zu empfehlen.

Es gab nur einen Vertrauensvorschuss, aber einen ziemlich großen, die Beziehung zwischen Herr der Ringe und Zero to One zu verknüpfen. Der nächste Schritt, um dies voranzutreiben, besteht darin, die Beziehung zwischen diesen beiden Büchern und anderen Büchern programmatisch zu identifizieren, damit sie reproduzierbar wird. Was ist die Mathematik und Logik, die dies antreiben könnte? Die meisten aktuellen Algorithmen für maschinelles Lernen und KI-Empfehlungen basieren darauf, Ähnlichkeiten zu finden. Wie können wir stattdessen Vielfalt finden?

Intuitiv können wir verstehen, dass auch jemand, der sich für Fantasy-Bücher interessiert, davon profitieren kann, etwas über Unternehmertum zu lernen. Unsere Algorithmen bieten diesen Schub derzeit jedoch nicht. Wenn wir dieses Problem lösen und einen besseren Algorithmus bauen können, hilft dies nicht nur dem Kunden erheblich, sondern steigert auch den Umsatz eines Unternehmens durch mehr Umsatz und zufriedene Kunden. Erstens schließen wir die Lücke durch Domänenwissen und Expertise für die Buchbranche. Dann gehen wir dazu über, dies auf andere Branchen anzuwenden. Wenn Sie Gedanken dazu haben, lassen Sie uns chatten. Dies kann ein Game-Changer sein.

5.1 Eine alternative Engine für Diversity-Empfehlungen

Hier ist eine alternative Lösung. Anstelle von Empfehlungen basierend auf Buch-Tags des einzelnen Buches können wir Empfehlungen basierend auf Kategorien abgeben. Die Regel: Jede Empfehlung kann immer noch Ähnlichkeiten mit dem Originalbuch aufweisen, es muss jedoch eine eindeutige Kategorie sein.

Amazon hat beispielsweise 5 Ergebnisse, um Buchempfehlungen anzuzeigen.

Amazon.com ab August 2020

Anstelle von 5 Büchern mit ähnlichen Book-Tags wie Herr der Ringe sollten das Ergebnis 5 Bücher mit ähnlichen Book-Tags sein, aber mit einer anderen Kategorie als Fantasy, wie z.B. Science Fiction. Nachfolgende Ergebnisse würden der gleichen Logik folgen. Dies würde die Kategorien von Büchern, die der Benutzer sieht, „diversifizieren“ und gleichzeitig eine Relevanzkette beibehalten. Es würde anzeigen: Fantasy → Science Fiction → Technologie → Unternehmertum → Biografien.

Innerhalb dieser Kategorien können einzelne Bücher nach Ähnlichkeiten mit dem ursprünglichen Buch oder nach Benutzerbewertungen eingestuft und sortiert werden. Jeder Slot präsentiert das Buch innerhalb dieser Kategorie mit der größten Relevanz für das Originalbuch.

Slot 1: Fantasie
Slot 2: Science-Fiction
Slot 3: Technologie
Slot 4: Unternehmertum
Slot 5: Biografien

Diese Kategorisierung wird zu einer Sortierung innerhalb einer Sortierung, um eine qualitativ hochwertige, relevante und vielfältige Lektüre zu gewährleisten. Dieses Konzept könnte Bücher wie Herr der Ringe und Zero to One systematischer miteinander verbinden und schließlich auf verschiedene Produkttypen oder Branchen wie Musik skalieren.

6. Mockups entwerfen

Wie könnten wir das gestalten? Wir könnten unseren Algorithmus einsetzen, um der Untersuchung von Diversity-Empfehlungen einen bestimmten Prozentsatz zuzuweisen, beispielsweise eine Aufteilung von 70% Ähnlichkeits- und 30% Diversity-Empfehlungen.

Ein potenzieller Nutzer gab Feedback, dass er sich einen „Diversity-Schalter“ wünschen würde. Lassen Sie uns dieses potenzielle Design nachbilden.

Design-Mockup von Amazon.com mit einem „Diversity Recommendation“-Schalter

Sobald der Kunde es einschaltet, können wir 3 Bücher als übliche Ähnlichkeitsempfehlungen und die nächsten 2 als unsere Diversitätsempfehlungen führen.

Diversity einschalten

In unseren Produktmetriken würden wir die Anzahl und den Prozentsatz der Interaktionen von Benutzern mit diesem Wechsel, die Erhöhung/Verringerung der Anzahl der besuchten Produktseiten, andere nachfolgende Verhaltensweisen des Benutzerflusses und die Konversionsrate beim Kauf der empfohlenen Bücher oder anderen Produkte verfolgen. Was denken Sie als potenzieller Kunde dazu?

7. Geschäftswerthypothese und Zielstart

Was ist der potenzielle Geschäftswert hinter dieser Idee? Wir können damit beginnen, den Zielkundenstart auf Amazon.com USA-Kunden einzugrenzen, die in den letzten 12 Monaten: ein Buch gekauft, nach Fantasy-Büchern gesucht und aus mehreren Buchkategorien gekauft haben. Konservative Annahmen:

USA customers: 112 million
x book buying customers: 25%
x searches for fantasy: 25%
x buys multiple categories: 25%
= roll out to 1.75 million customers x conversion rate: 10%
= 175,000 customers convert x increase in average annual spend $40
= $7 million additional annual revenue

Im Jahr 2019 betrugen die durchschnittlichen Ausgaben von Amazon-Kunden etwa 600 US-Dollar pro Jahr und der Jahresumsatz von Amazon betrug 280 Milliarden US-Dollar. Diese Schätzung ist im Vergleich leicht, was als erster Rollout-Test gut ist. Wenn wir den Umfang der Einführung erhöhen, erhalten wir einen größeren potenziellen Wert. Lassen Sie uns unsere Reichweite erweitern und dies auf alle Amazon-Kunden in den USA ausweiten, die ein Buch gekauft haben, mit einer konservativen Annahme von 25 %:

USA customers: 112 million
x book buying customers: 25%
= roll out to 28 million customers x conversion rate: 10%
= 2.8 million customers convert x increase in average annual spend $40
= $112 million additional annual revenue

Wenn wir schließlich aggressiver sind und davon ausgehen, dass die Hälfte der Amazon-Kunden Buchkäufer sein können, die Conversion-Rate erhöhen, den durchschnittlichen jährlichen Ausgabenanstieg erhöhen, kommen wir in den Milliarden-Mehrwert:

USA customers: 112 million
x book buying customers: 50%
= roll out to 56 million customers x conversion rate: 20%
= 28 million customers convert x increase in average annual spend $90
= $1 billion additional annual revenue

Die potenzielle Falle besteht darin, dass sich dieses neue Empfehlungssystem negativ auf das Kundenerlebnis auswirkt und die Conversion-Rate verringert, was zu einem Umsatzverlust führt. Aus diesem Grund sind eine erste Kundenvalidierung und kleinere Einführungs- und Testpläne ein guter Ausgangspunkt.

Der Geschäftswert nach oben ist signifikant, da 35 % (98 Milliarden US-Dollar) des Umsatzes von Amazon durch Empfehlungssysteme generiert wurden. Schon eine kleine prozentuale Verbesserung des Algorithmus würde Millionen und Abermilliarden zusätzlicher Einnahmen bedeuten.

Der End-to-End-Data-Science-Prozess zum Aufbau eines Empfehlungssystems

Struktur & Organisation

Dieser Machbarkeitsnachweis veranschaulicht das Potenzial von Diversity-Recommender-Systemen zur Verbesserung der Kundenerfahrung, zur Lösung gesellschaftlicher Probleme, zur Steigerung des Geschäftswerts und skizziert einen praktikablen Data-Science-Prozess zur Verbesserung unserer Technologie.

Durch besseres maschinelles Lernen und KI-Recommender-Systeme kann die Technologie mehr Gedankenvielfalt ermöglichen. Das aktuelle Ethos der Gesellschaft besagt, dass Ähnlichkeiten gut sind, während Vielfalt gemischt werden kann. Vielleicht hat sich deshalb die Mehrheit der Forschung und Entwicklung von Empfehlungssystemen heute nur darauf konzentriert, Ähnlichkeiten zu finden. Wenn wir keine Veränderungen in unseren Algorithmen implementieren, wird uns der Status Quo mehr davon geben.

Technologie, um eine Vielfalt des Denkens zu ermöglichen

Stellen Sie sich eine Welt vor, in der Gedankenvielfalt in allen Produkten ermöglicht wird, die uns jeden Tag beeinflussen. Wie könnte das die Welt für Sie, Ihre Freunde und Menschen verändern, die anders denken als Sie? Maschinelles Lernen und KI-Empfehlungsalgorithmen können ein starker Change Agent sein. Wenn wir diesen Weg der Vielfalt weitergehen, können wir die Menschen und die Welt um uns herum positiv beeinflussen.

Dieser Artikel wurde ursprünglich veröffentlicht am Auf dem Weg zur KI und mit Genehmigung des Autors erneut auf TOPBOTS veröffentlicht.

Genießen Sie diesen Artikel? Melden Sie sich für weitere AI-Updates an.

Wir werden Sie informieren, wenn wir mehr technische Ausbildung veröffentlichen.

Münzsmart. Beste Bitcoin-Börse in Europa
Quelle: https://www.topbots.com/diversity-through-recommendation-systems/

spot_img

Neueste Intelligenz

spot_img