Logo Zephyrnet

Hướng dẫn toàn diện về động cơ khuyến nghị vào năm 2022

Ngày:

Bài báo này đã được xuất bản như một phần của Blogathon Khoa học Dữ liệu.

Giới thiệu

Thị trường toàn cầu về việc sử dụng Công cụ khuyến nghị được định giá là 2.69 tỷ USD vào năm 2021. Dự kiến ​​sẽ vượt qua 15.10 tỷ USD vào năm 2026, báo cáo tốc độ CAGR là 37.79% trong giai đoạn 2022-2026.

Các khuyến nghị mà các công ty cung cấp cho bạn đôi khi sử dụng kỹ thuật phân tích dữ liệu để xác định các mặt hàng phù hợp với khẩu vị và sở thích của bạn. Với dữ liệu đang phát triển nhanh chóng trên internet, không có gì ngạc nhiên khi nói rằng Netflix biết bộ phim nào bạn sẽ muốn xem tiếp theo hoặc bài báo hàng đầu mà bạn muốn đọc trên Twitter của mình.

Với những tiến bộ gần đây của Trí tuệ nhân tạo và sự cạnh tranh ngày càng tăng giữa nhiều doanh nghiệp, việc tìm kiếm, lập bản đồ và cung cấp cho người dùng lượng dữ liệu phù hợp là điều cần thiết để cải thiện trải nghiệm của người tiêu dùng và gia tăng xu hướng số hóa.

Như đã nói, trong hướng dẫn hôm nay, chúng ta sẽ thảo luận về các công cụ Đề xuất, tầm quan trọng của chúng, những thách thức phải đối mặt, nguyên tắc làm việc, các kỹ thuật, ứng dụng khác nhau và các công ty hàng đầu sử dụng chúng và cuối cùng, cách xây dựng công cụ đề xuất của riêng bạn bằng Python.

Mục lục

  • Công cụ khuyến nghị là gì?
  • Tại sao Công cụ Đề xuất lại Quan trọng trong Học máy?
  • Các kỹ thuật khác nhau của động cơ giới thiệu
  • Hoạt động của các động cơ khuyến nghị
  • Những thách thức của động cơ khuyến nghị
  • Làm thế nào để xây dựng một công cụ đề xuất
  • Ứng dụng & Các công ty hàng đầu sử dụng Công cụ Đề xuất
  • Kết luận

Công cụ đề xuất là gì?

Công cụ đề xuất là một hệ thống lọc dữ liệu hoạt động dựa trên các thuật toán học máy khác nhau để đề xuất các sản phẩm, dịch vụ và thông tin cho người dùng dựa trên phân tích dữ liệu. Nó hoạt động trên nguyên tắc tìm kiếm các mẫu trong dữ liệu hành vi khách hàng sử dụng nhiều yếu tố như sở thích của khách hàng, lịch sử giao dịch trong quá khứ, thuộc tính hoặc bối cảnh tình huống.

Dữ liệu được sử dụng để tìm kiếm thông tin chi tiết có thể được thu thập một cách ẩn ý hoặc rõ ràng. Các công ty thường sử dụng hàng petabyte dữ liệu cho các công cụ khuyến nghị của họ để trình bày quan điểm của họ với kinh nghiệm, hành vi, sở thích và mối quan tâm của họ.

Trong thị trường không ngừng phát triển về mật độ thông tin và quá tải sản phẩm, mỗi công ty sử dụng các công cụ khuyến nghị cho các mục đích hơi khác nhau. Tuy nhiên, tất cả đều có chung mục tiêu là thúc đẩy doanh số bán hàng nhiều hơn, tăng cường sự tương tác và giữ chân khách hàng, đồng thời cung cấp cho người tiêu dùng kiến ​​thức và giải pháp được cá nhân hóa.

Tại sao các Công cụ Đề xuất lại quan trọng trong ML?

Không còn nghi ngờ gì nữa, công cụ đề xuất là một cách phi thường để nâng cao trải nghiệm người dùng, kích thích nhu cầu, tăng doanh thu, tăng tỷ lệ nhấp (CTR), tích cực thu hút người dùng và các chỉ số quan trọng khác. Là công cụ lọc dữ liệu mạnh mẽ, công cụ đề xuất hoạt động trong thời gian thực. Chúng có thể mang lại lợi ích khi có nhu cầu cung cấp cho người dùng các đề xuất và lời khuyên được cá nhân hóa.

Hãy để chúng tôi lấy Netflix làm ví dụ.

Có hàng ngàn bộ phim và nhiều thể loại chương trình để xem. Tuy nhiên, Netflix cung cấp cho bạn sự lựa chọn chắc chắn hơn nhiều về các chương trình quảng cáo phim mà bạn có nhiều khả năng sẽ thích nhất. Với chiến lược này, Netflix đạt được tỷ lệ hủy đặt phòng thấp hơn, tiết kiệm một tỷ đô la mỗi năm, tiết kiệm thời gian của bạn và mang lại trải nghiệm người dùng tốt hơn.

Đây là lý do tại sao các công cụ đề xuất lại rất cần thiết và chính xác là có bao nhiêu doanh nghiệp đang tăng cường cơ hội tương tác với sản phẩm của họ bằng cách cung cấp nhiều cơ hội bán chéo đáng kể hơn.

Các kỹ thuật khác nhau của động cơ khuyến nghị

Có ba loại công cụ giới thiệu khác nhau được biết đến trong học máy và chúng là:

1. Lọc cộng tác

Phương pháp lọc cộng tác thu thập và phân tích dữ liệu về hành vi của người dùng, hoạt động trực tuyến và sở thích để dự đoán những gì họ sẽ thích dựa trên sự tương đồng với những người dùng khác. Nó sử dụng một công thức kiểu ma trận để vẽ và tính toán những điểm tương đồng này.

Lợi thế

Một lợi thế đáng kể của lọc cộng tác là nó không cần phải phân tích hoặc hiểu đối tượng (sản phẩm, phim, sách) để đề xuất chính xác các mục phức tạp. Không có sự phụ thuộc vào nội dung máy có thể phân tích, có nghĩa là nó chọn các đề xuất dựa trên những gì nó biết về người dùng.

Ví dụ

Nếu người dùng X thích Quyển A, Quyển B và Quyển C trong khi người dùng Y thích Quyển A, Quyển B và Quyển D, họ có cùng sở thích. Vì vậy, rất có thể người dùng X sẽ chọn Sách D và người dùng Y sẽ thích đọc Bood C. Đây là cách lọc cộng tác xảy ra.

2. Lọc dựa trên nội dung

Tính năng lọc dựa trên nội dung hoạt động dựa trên nguyên tắc mô tả sản phẩm và hồ sơ về các lựa chọn mong muốn của người dùng. Nó giả định rằng bạn cũng sẽ thích mặt hàng này khác nếu bạn thích một mặt hàng cụ thể. Sản phẩm được xác định bằng cách sử dụng các từ khóa (thể loại, loại sản phẩm, màu sắc, độ dài từ) để đưa ra đề xuất. Hồ sơ người dùng được tạo để mô tả loại mặt hàng mà người dùng này yêu thích. Sau đó, thuật toán đánh giá mức độ giống nhau của các mục bằng cách sử dụng khoảng cách cosin và Euclide.

Lợi thế

Một ưu điểm đáng kể của kỹ thuật công cụ khuyến nghị này là nó không cần thêm bất kỳ dữ liệu bổ sung nào về những người dùng khác vì các khuyến nghị dành riêng cho người dùng này. Ngoài ra, mô hình này có thể nắm bắt sở thích cụ thể của người dùng và đề xuất các đối tượng thích hợp mà rất ít người dùng khác quan tâm.

Ví dụ

Giả sử một người dùng X thích xem phim hành động như Spider-man. Trong trường hợp đó, kỹ thuật công cụ giới thiệu này chỉ đề xuất các phim thuộc thể loại hành động hoặc phim mô tả Tom Holland.

3. Mô hình lai

Trong hệ thống đề xuất kết hợp, cả dữ liệu meta (cộng tác) và dữ liệu giao dịch (dựa trên nội dung) đều được sử dụng đồng thời để đề xuất nhiều loại mục hơn cho người dùng. Trong kỹ thuật này, các thẻ xử lý ngôn ngữ tự nhiên có thể được phân bổ cho từng đối tượng (phim, bài hát) và các phương trình vectơ tính toán độ tương tự. Ma trận lọc cộng tác sau đó có thể đề xuất mọi thứ cho người dùng, tùy thuộc vào hành vi, hành động và ý định của họ.

Ưu điểm

Hệ thống khuyến nghị này đang phát triển và được cho là vượt trội hơn cả hai phương pháp trên về độ chính xác.

Ví dụ

Netflix sử dụng công cụ đề xuất kết hợp. Nó đưa ra các đề xuất bằng cách phân tích sở thích của người dùng (cộng tác) và đề xuất những chương trình / phim có cùng thuộc tính với những chương trình / phim được người dùng đánh giá cao (dựa trên nội dung).

Hoạt động của các động cơ khuyến nghị

Dữ liệu là yếu tố quan trọng nhất trong việc xây dựng công cụ đề xuất. Nó là khối xây dựng mà từ đó các mẫu được bắt nguồn bằng các thuật toán. Nó càng có nhiều chi tiết, nó càng chính xác và thực tế, nó sẽ đưa ra các đề xuất tạo doanh thu phù hợp. Về cơ bản, công cụ đề xuất hoạt động bằng cách sử dụng kết hợp dữ liệu và các thuật toán học máy trong bốn giai đoạn. Hãy hiểu chúng một cách chi tiết ngay bây giờ:

KHAI THÁC. Thu thập dữ liệu

Bước đầu tiên và quan trọng nhất để tạo công cụ đề xuất là thu thập dữ liệu thích hợp cho mọi người dùng. Có hai loại dữ liệu, tức là, Rõ ràng dữ liệu chứa thông tin được thu thập từ đầu vào của người dùng như xếp hạng, đánh giá, thích, không thích hoặc nhận xét về sản phẩm.

Ngược lại, chúng tôi có Ngầm hiểu dữ liệu chứa thông tin được thu thập từ các hoạt động của người dùng, chẳng hạn như lịch sử tìm kiếm trên web, số lần nhấp chuột, hành động với giỏ hàng, nhật ký tìm kiếm và lịch sử đặt hàng.

Hồ sơ dữ liệu của mỗi người dùng sẽ trở nên khác biệt hơn theo thời gian; do đó, việc thu thập dữ liệu thuộc tính khách hàng như:

  • nhân khẩu học (tuổi, giới tính)
  • Nhà tâm lý học (sở thích, giá trị) để xác định những khách hàng tương tự
  • dữ liệu đặc điểm (thể loại, loại đối tượng) để xác định độ giống của sản phẩm tương tự.

2. Lưu trữ dữ liệu

Khi bạn đã thu thập dữ liệu, bước tiếp theo là lưu trữ dữ liệu một cách hiệu quả. Khi bạn thu thập nhiều dữ liệu hơn, phải có sẵn bộ nhớ phong phú, có thể mở rộng. Một số tùy chọn lưu trữ có sẵn tùy thuộc vào loại dữ liệu bạn thu thập, như NoSQL, cơ sở dữ liệu SQL tiêu chuẩn, MongoDB và AWS.

Khi chọn các tùy chọn lưu trữ tốt nhất, người ta nên xem xét một số yếu tố: dễ thực hiện, kích thước lưu trữ dữ liệu, tích hợp và tính di động.

3. Phân tích dữ liệu

Sau khi thu thập dữ liệu, bạn cần phân tích dữ liệu. Dữ liệu sau đó phải được khoan và phân tích để đưa ra các khuyến nghị ngay lập tức. Các phương pháp phổ biến nhất mà bạn có thể phân tích dữ liệu là:

  • Phân tích thời gian thực, trong đó hệ thống sử dụng các công cụ đánh giá và phân tích các sự kiện khi nó được tạo ra. Kỹ thuật này chủ yếu được thực hiện khi chúng tôi muốn cung cấp các khuyến nghị tức thì.
  • Phân tích hàng loạt, trong đó việc xử lý và phân tích dữ liệu được thực hiện theo định kỳ. Kỹ thuật này chủ yếu được thực hiện khi chúng tôi muốn gửi email với các khuyến nghị.
  • Phân tích thời gian thực gần, trong đó bạn phân tích và xử lý dữ liệu trong vài phút thay vì vài giây vì bạn không cần nó ngay lập tức. Kỹ thuật này chủ yếu được triển khai khi chúng tôi cung cấp các đề xuất trong khi người dùng vẫn ở trên trang web.

4. Lọc dữ liệu

Khi bạn phân tích dữ liệu, bước cuối cùng là lọc chính xác dữ liệu để đưa ra các đề xuất có giá trị. Các ma trận, quy tắc toán học và công thức khác nhau được áp dụng cho dữ liệu để đưa ra gợi ý phù hợp. Bạn phải chọn thuật toán thích hợp và kết quả của việc lọc này là các khuyến nghị.

Những thách thức của các công cụ khuyến nghị

Sự hoàn hảo chỉ đơn giản là không tồn tại. Một nhà vật lý lý thuyết người Anh “Stephen Hawking,” đã từng nói:

"Một trong những quy tắc cơ bản của vũ trụ là không có gì là hoàn hảo."

Tương tự, có một số thách thức mà các công ty phải vượt qua để xây dựng một hệ thống tư vấn hiệu quả. Dưới đây là một số trong số họ:

1. Vấn đề KHỞI ĐỘNG LẠNH

Sự cố này phát sinh khi người dùng mới tham gia hệ thống hoặc thêm các mục mới vào bản ghi. Hệ thống giới thiệu ban đầu không thể đề xuất mặt hàng hoặc người dùng mới này vì nó không có bất kỳ đánh giá hoặc đánh giá nào. Do đó, công cụ dự đoán sở thích hoặc mức độ ưu tiên của người dùng mới hoặc xếp hạng của các mặt hàng mới sẽ gặp nhiều thách thức, dẫn đến các đề xuất kém chính xác hơn.

Ví dụ: không thể đề xuất một bộ phim mới trên Netflix cho đến khi nó nhận được một số lượt xem và xếp hạng.

Tuy nhiên, một mô hình dựa trên học tập sâu có thể giải quyết vấn đề khởi động nguội vì các mô hình này không phụ thuộc nhiều vào hành vi của người dùng để đưa ra dự đoán. Nó có thể tối ưu hóa mối tương quan giữa người dùng và mặt hàng bằng cách kiểm tra bối cảnh sản phẩm và thông tin chi tiết của người dùng như mô tả sản phẩm, hình ảnh và hành vi của người dùng.

2. Vấn đề về độ thưa thớt dữ liệu

Như chúng ta đã biết, các công cụ đề xuất phụ thuộc rất nhiều vào dữ liệu. Trong một số tình huống, một số người dùng không đưa ra xếp hạng hoặc đánh giá về các mặt hàng họ đã mua. Nếu chúng ta không có dữ liệu chất lượng cao, mô hình xếp hạng sẽ trở nên rất thưa thớt, dẫn đến vấn đề thưa thớt dữ liệu.

Vấn đề này gây khó khăn cho thuật toán trong việc tìm kiếm những người dùng có xếp hạng hoặc sở thích tương tự.

Để đảm bảo dữ liệu có chất lượng tốt nhất và để có thể tận dụng tối đa công cụ đề xuất, hãy tự hỏi bản thân XNUMX câu hỏi:

  • Dữ liệu gần đây như thế nào?
  • Thông tin ồn ào như thế nào?
  • Thông tin đa dạng như thế nào?
  • Bạn có thể cung cấp dữ liệu mới cho mô hình hệ thống tư vấn của mình nhanh chóng như thế nào?

Các câu hỏi trên sẽ đảm bảo rằng doanh nghiệp của bạn đáp ứng các yêu cầu phân tích dữ liệu phức tạp.

3. Sự cố Thay đổi Sở thích Người dùng

Tương tác giữa người dùng với mục trong xếp hạng và đánh giá có thể tạo ra dữ liệu thay đổi lớn.

Ví dụ, tôi có thể lên Netflix hôm nay để xem một bộ phim Lãng mạn với bạn gái của mình. Nhưng ngày mai, tôi có thể có một tâm trạng khác, và một bộ phim kinh dị tâm lý kinh điển là thứ tôi muốn xem.

Về vấn đề sở thích của người dùng, các công cụ giới thiệu có thể gắn nhãn sai cho người dùng, điều này sẽ giải thích kết quả trên các tập dữ liệu lớn không hiệu quả. Do đó, khả năng mở rộng là một thách thức lớn đối với các bộ dữ liệu này và cần có một số phương pháp quy mô lớn nâng cao để giải quyết vấn đề này.

Làm thế nào để xây dựng một công cụ đề xuất bằng Python?

Phần hướng dẫn này sẽ giúp bạn xây dựng các hệ thống khuyến nghị cơ bản bằng Python. Chúng tôi sẽ tập trung vào việc xây dựng hệ thống đề xuất cơ bản bằng cách đề xuất các mặt hàng có thể so sánh tốt nhất với một mặt hàng cụ thể, trong trường hợp của chúng tôi là phim. Hãy nhớ rằng đây không phải là một công cụ đề xuất chính xác và mạnh mẽ. Nó chỉ gợi ý những bộ phim / mục nào giống nhất với sở thích xem phim của bạn.

Bạn có thể tìm thấy mã và tệp dữ liệu ở cuối phần này. Vậy hãy bắt đầu:

Lưu ý: Chúng tôi khuyên bạn nên vận hành trên google collab hoặc sổ ghi chép jupyter để chạy mã này.

# 1. Nhập các thư viện cần thiết.

Nhập các thư viện máy học của gấu trúc và numpy, vì chúng tôi sẽ sử dụng chúng cho các khung dữ liệu và đánh giá các mối tương quan.

nhập numpy dưới dạng np
gấu trúc nhập khẩu như pd

# 2. Nhận dữ liệu

Xác định tên cột, đọc tệp csv cho phim và đánh giá tập dữ liệu và in 5 hàng đầu tiên.

column_names = ['user_id', 'item_id', 'rating', 'timestamp']
df = pd.read_csv ('u.data', sep = 't', names = column_names)
df.head ()

Đầu ra

Động cơ khuyến nghị 2022

Như bạn có thể thấy ở trên, chúng tôi có bốn cột: id người dùng, là duy nhất cho mỗi người dùng. Id mục là duy nhất cho mỗi phim, xếp hạng của phim và dấu thời gian của chúng.

Bây giờ chúng ta hãy lấy tên phim:

movie_titles = pd.read_csv ("Movie_Id_Titles")
movie_titles.head ()

Đầu ra

Đầu ra | Động cơ khuyến nghị 2022

Đọc dữ liệu bằng thư viện của gấu trúc và in 5 hàng trên cùng từ tập dữ liệu. Chúng tôi có id và tiêu đề cho mỗi bộ phim.

Bây giờ chúng ta có thể nối hai cột:

df = pd.merge (df, movie_titles, on = 'item_id')
df.head ()

Đầu ra

Mã | Động cơ khuyến nghị 2022

Bây giờ chúng tôi có khung dữ liệu kết hợp, mà chúng tôi sẽ sử dụng tiếp theo cho Phân tích dữ liệu khám phá (EDA).

# 3. Phân tích dữ liệu khám phá

Chúng ta hãy xem xét dữ liệu một chút và xem qua một số bộ phim được đánh giá cao nhất.

Nhập trực quan sẽ là bước đầu tiên của chúng tôi trong EDA.

nhập matplotlib.pyplot dưới dạng plt
nhập seaborn dưới dạng sns
sns.set_style ('trắng')
% matplotlib inline

Tiếp theo, chúng tôi sẽ tạo khung dữ liệu xếp hạng với xếp hạng trung bình và số lượng xếp hạng dưới dạng hai cột của chúng tôi:

df.groupby ('title') ['rating']. mean (). sort_values ​​(ascending = False) .head ()

Đầu ra

Phân tích dữ liệu thăm dò

df.groupby ('title') ['rating']. count (). sort_values ​​(ascending = False) .head ()

Đầu ra

Đầu ra 3 | Động cơ khuyến nghị 2022

xếp hạng = pd.DataFrame (df.groupby ('tiêu đề') ['xếp hạng']. mean ())
rating.head ()

Đầu ra

Đầu ra 4 | Động cơ khuyến nghị 2022

Tiếp theo, đặt số lượng cột xếp hạng ngay bên cạnh xếp hạng trung bình:

xếp hạng ['num of xếp hạng'] = pd.DataFrame (df.groupby ('title') ['rating']. count ())
rating.head ()

Đầu ra

Động cơ khuyến nghị 2022

Vẽ một vài biểu đồ để kiểm tra một số xếp hạng một cách trực quan:

plt.figure (figsize = (10,4))
xếp hạng ['num of xếp hạng']. hist (bins = 70)

Đầu ra

Động cơ khuyến nghị 2022 | đầu ra

plt.figure (figsize = (10,4))
xếp hạng ['xếp hạng']. hist (bins = 70)

Đầu ra

Đầu ra | Động cơ khuyến nghị 2022

sns.jointplot (x = 'xếp hạng', y = 'số xếp hạng', dữ liệu = xếp hạng, alpha = 0.5)

Đầu ra

Động cơ khuyến nghị 2022

Được chứ! Bây giờ chúng ta đã có một cái nhìn toàn diện về dữ liệu trông như thế nào, hãy chuyển sang xây dựng một hệ thống đề xuất đơn giản bằng Python:

#4. Đề xuất phim tương tự

Bây giờ, hãy xây dựng một ma trận với các ID người dùng và tiêu đề phim. Sau đó, mỗi ô sẽ bao gồm xếp hạng của người dùng về bộ phim đó.

Lưu ý: Sẽ có nhiều NaN vì hầu hết mọi người chưa xem phần lớn bộ phim.

phimmoiat = df.pivot_table (index = 'user_id', cột = 'tiêu đề', giá trị = 'xếp hạng')
phimmoi.head ()

Đầu ra

Đề xuất phim tương tự

In những bộ phim được đánh giá cao nhất:

xếp hạng.sort_values ​​('số xếp hạng', tăng dần = Sai) .head (10)

Đầu ra

đầu ra | Đề xuất phim tương tự

Hãy chọn hai bộ phim: Chiến tranh giữa các vì sao, một bộ phim khoa học viễn tưởng. Và cái còn lại là Liar Liar, là một bộ phim hài. Bước tiếp theo là lấy xếp hạng của người dùng cho hai bộ phim đó:

starwars_user_ratings = phimmoi ['Chiến tranh giữa các vì sao (1977)']
liarliar_user_ratings = phimmoi ['Liar Liar (1997)']
starwars_user_ratings.head ()

Đầu ra

Đề xuất phim tương tự | đầu ra

Sau đó, chúng ta có thể sử dụng phương thức corrwith () để nhận các mối tương quan giữa hai chuỗi gấu trúc:

tương tự_to_starwars = phimmoi.corrwith (starwars_user_ratings)
same_to_liarliar = phimmoi.corrwith (liarliar_user_ratings)

Đầu ra

Đầu ra | Đề xuất phim tương tự

Vẫn còn nhiều giá trị rỗng có thể được làm sạch bằng cách loại bỏ các giá trị NaN. Vì vậy, chúng tôi sử dụng DataFrame thay vì một chuỗi:

corr_starwars = pd.DataFrame (same_to_starwars, cột = ['Tương quan'])
corr_starwars.dropna (inplace = True)
corr_starwars.head ()

Đầu ra

Đầu ra mã

Bây giờ, giả sử chúng ta sắp xếp khung dữ liệu theo tương quan. Trong trường hợp đó, chúng ta nên lấy những bộ phim có thể so sánh được nhiều nhất, tuy nhiên, hãy lưu ý rằng chúng ta nhận được một vài bộ phim không thực sự có ý nghĩa.

Điều này là do có rất nhiều bộ phim chỉ được xem một lần bởi những người dùng cũng đã xem chiến tranh giữa các vì sao.

corr_starwars.sort_values ​​('Tương quan', tăng dần = Sai) .head (10)

Đầu ra

Đầu ra | Khuyến nghị động cơ 2022

Chúng tôi có thể khắc phục điều này bằng cách lọc ra những bộ phim có ít hơn 100 bài đánh giá. Chúng tôi có thể xác định giá trị này dựa trên biểu đồ mà chúng tôi đã vẽ trong phần EDA trước đó.

corr_starwars = corr_starwars.join (xếp hạng ['số xếp hạng'])
corr_starwars.head ()

Đầu ra

Đầu ra | Động cơ được đề xuất 2022

Bây giờ hãy sắp xếp các giá trị và chứng kiến ​​cách các tiêu đề giúp hiểu rõ hơn:

corr_starwars [corr_starwars ['số xếp hạng']> 100] .sort_values ​​('Tương quan', tăng dần = Sai) .head ()

Đầu ra

Đầu ra mã | Động cơ được đề xuất 2022

Bây giờ số tiền tương tự cho bộ phim hài Liar Liar:

corr_liarliar = pd.DataFrame (tương tự_to_liarliar, cột = ['Tương quan'])
corr_liarliar.dropna (inplace = True)
corr_liarliar = corr_liarliar.join (xếp hạng ['số xếp hạng'])
corr_liarliar [corr_liarliar ['số xếp hạng']> 100] .sort_values ​​('Tương quan', tăng dần = Sai) .head ()

Đầu ra

Động cơ được đề xuất 2022

Rất tốt, bạn đã tạo ra một công cụ đề xuất phim của riêng mình.

Lưu ý: Truy cập sổ ghi chép của google tại đây.

Ứng dụng & Các công ty hàng đầu sử dụng Công cụ Đề xuất

Nhiều ngành sử dụng các công cụ đề xuất để thúc đẩy tương tác của người dùng và nâng cao triển vọng mua sắm. Như chúng ta đã thấy, công cụ đề xuất có thể thay đổi cách doanh nghiệp giao tiếp với người dùng và tối đa hóa lợi tức đầu tư (ROI) của họ dựa trên thông tin họ có thể thu thập.

Chúng ta sẽ thấy hầu hết mọi doanh nghiệp sử dụng công cụ khuyến nghị để có cơ hội thu lợi nhuận như thế nào.

1. Thương mại điện tử

Thương mại điện tử là một ngành mà công cụ khuyến nghị lần đầu tiên được sử dụng rộng rãi. Các doanh nghiệp thương mại điện tử phù hợp nhất để cung cấp các khuyến nghị chính xác với hàng triệu khách hàng và dữ liệu trên cơ sở dữ liệu trực tuyến của họ.

KHAI THÁC. Bán lẻ

Dữ liệu mua sắm là thông tin có giá trị nhất đối với thuật toán máy học. Đây là điểm dữ liệu chính xác nhất về ý định của người dùng. Các nhà bán lẻ với vô số dữ liệu mua sắm luôn đi đầu trong các doanh nghiệp đưa ra các đề xuất cụ thể cho khách hàng của họ.

3. Phương tiện truyền thông

Giống như thương mại điện tử, các công ty truyền thông là những người đầu tiên sử dụng các kỹ thuật của công cụ khuyến nghị. Thật khó để nhận thấy một trang web tin tức mà không có công cụ giới thiệu đang hoạt động.

4. Ngân hàng

Ngân hàng là một ngành công nghiệp thị trường đại chúng được hàng triệu người sử dụng kỹ thuật số và là một trong những khuyến nghị hàng đầu. Việc hiểu được tình hình tài chính chính xác của khách hàng và các lựa chọn trong quá khứ, tương quan với dữ liệu của hàng nghìn người dùng có thể so sánh, là khá quyết định.

5. Viễn thông

Ngành này có động lực tương tự với ngành ngân hàng. Các công ty viễn thông có thông tin đăng nhập của hàng triệu khách hàng mà mọi hành động của họ đều được ghi lại. Phạm vi sản phẩm của họ cũng hẹp vừa phải so với các lĩnh vực khác, khiến các khuyến nghị trong lĩnh vực viễn thông trở thành một giải pháp dễ quản lý hơn.

6. Tiện ích

Động lực tương tự với viễn thông, nhưng các tiện ích có phạm vi sản phẩm hạn chế hơn, nên các đề xuất tương đối dễ sử dụng.

Các công ty hàng đầu sử dụng công cụ đề xuất bao gồm

  • đàn bà gan dạ                    
  • Netflix
  • Spotify
  • LinkedIn
  • YouTube
  • TikTok    
  • Instagram
  • Facebook
  • Vật liệu để bắt lửa
  • Quora
  • Google
  • Yahoo        

Kết luận:

Công cụ đề xuất là một công cụ tiếp thị mạnh mẽ sẽ giúp bạn bán thêm hàng, bán kèm và thúc đẩy hoạt động kinh doanh của mình. Nhiều thứ đang diễn ra trong lĩnh vực công cụ khuyến nghị. Mọi công ty đều phải cập nhật công nghệ để cung cấp bộ khuyến nghị về mức độ hài lòng tốt nhất cho tất cả người dùng của họ.

Ở đây chúng tôi đến phần cuối của hướng dẫn này. Tôi hy vọng tất cả các chủ đề và giải thích đủ hữu ích để hỗ trợ bạn bắt đầu hành trình của mình trong các công cụ đề xuất trong học máy.

Đọc thêm các bài viết trên blog của chúng tôi về Công cụ khuyến nghị

Nếu bạn vẫn còn nghi ngờ, hãy liên hệ với tôi trên hồ sơ mạng xã hội của tôi và tôi sẽ sẵn lòng giúp bạn. Bạn có thể đọc thêm về tôi dưới đây:

Tôi là Nhà khoa học dữ liệu có bằng Cử nhân khoa học máy tính chuyên về Máy học, Trí tuệ nhân tạo và Thị giác máy tính. Mrinal cũng là một blogger, tác giả và một người đam mê tự do với năm năm kinh nghiệm trong công việc của mình. Với nền tảng làm việc thông qua hầu hết các lĩnh vực khoa học máy tính, tôi hiện đang theo học Thạc sĩ về Máy tính Ứng dụng với chuyên ngành AI từ Đại học Windsor và tôi là một nhà viết nội dung tự do và nhà phân tích nội dung.

Đọc thêm về động cơ đề xuất của Mrinal Walia:

1. 5 dự án hệ thống đề xuất máy học mã nguồn mở hàng đầu với tài nguyên

2. Các dự án học sâu mã nguồn mở phải thử dành cho sinh viên khoa học máy tính

Phương tiện hiển thị trong bài viết này không thuộc sở hữu của Analytics Vidhya và được sử dụng theo quyết định riêng của Tác giả. 

Nguồn: https://www.analyticsvidhya.com/blog/2022/01/a-comprehensive-guide-on-recommendation-engines-in-2022/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?