Các nhà nghiên cứu đã sử dụng ML để phát hiện các đánh giá của người dùng độc hại chuyên nghiệp (PMU)

Một sự hợp tác nghiên cứu mới giữa Trung Quốc và Hoa Kỳ đưa ra một cách phát hiện các đánh giá thương mại điện tử độc hại được thiết kế để làm suy yếu đối thủ cạnh tranh hoặc tạo điều kiện cho hành vi tống tiền bằng cách tận dụng hành vi chữ ký của những người đánh giá đó.

Mục lục

Thuật toán học máy đã quản lý để phát hiện các PMU

Bài viết mô tả cách một hệ thống được gọi là mô hình phát hiện người dùng độc hại (MMD) phân tích đầu ra của những người dùng đó để xác định và gắn nhãn họ là Người dùng độc hại chuyên nghiệp (PMU). Sử dụng Học số liệu, một phương pháp được sử dụng trong hệ thống đề xuất và thị giác máy tính cũng như Mạng thần kinh tái phát (RNN), hệ thống xác định và phân loại kết quả đầu ra của những nhà phê bình này.

Các nhà nghiên cứu từ Trung Quốc và Hoa Kỳ đã phát triển một mô hình Ml có khả năng phát hiện Pmus (Người dùng độc hại chuyên nghiệp) đăng các đánh giá tiêu cực giả mạo. — Thuật toán ML có thể phát hiện PMU

Trải nghiệm người dùng có thể được đánh giá bằng cách sử dụng xếp hạng theo sao (hoặc điểm trên XNUMX) và nhận xét dựa trên văn bản, thường có ý nghĩa trong trường hợp điển hình. Mặt khác, các PMU thường xuyên đi ngược lại suy nghĩ này bằng cách gửi đánh giá văn bản tiêu cực với xếp hạng cao hoặc xếp hạng kém với đánh giá tốt.

Nó nguy hiểm hơn nhiều vì nó cho phép đánh giá của người dùng gây tổn hại đến danh tiếng mà không kích hoạt các bộ lọc khá đơn giản của các trang thương mại điện tử để xác định và giải quyết các nhận xét xấu độc hại. Nếu bộ lọc NLP phát hiện hành vi phản cảm trong một đánh giá, thì xếp hạng sao (hoặc số thập phân) cao do PMU chỉ định sẽ loại bỏ nội dung tiêu cực một cách hiệu quả, khiến nội dung đó có vẻ 'trung lập', theo thống kê.

Nghiên cứu mới chỉ ra rằng các PMU thường được sử dụng để đòi tiền từ các nhà bán lẻ internet để đổi lấy việc sửa đổi các bình luận tiêu cực và hứa sẽ không đăng thêm bất kỳ đánh giá tiêu cực nào nữa. Một số cá nhân muốn giảm giá đôi khi được đối thủ của nạn nhân tuyển dụng, mặc dù trong hầu hết các trường hợp, PMU đang bị đối thủ cạnh tranh của nạn nhân lợi dụng một cách phi đạo đức.

Loại máy dò tự động mới nhất dành cho các cuộc kiểm tra như vậy sử dụng phương pháp Lọc dựa trên nội dung hoặc Lọc cộng tác, tìm kiếm 'các ngoại lệ' rõ ràng. Đây là những đánh giá tiêu cực ảm đạm ở cả hai chế độ phản hồi và khác biệt đáng kể so với xu hướng chung về cảm nhận và xếp hạng đánh giá.

Tần suất đăng bài cao là dấu hiệu điển hình cho thấy các bộ lọc như vậy đang tìm kiếm. Ngược lại, PMU sẽ đăng bài một cách chiến lược nhưng hiếm khi vì mỗi đánh giá có thể là một khoản hoa hồng riêng lẻ hoặc một phần của kế hoạch dài hơn nhằm che giấu số liệu thống kê 'tần suất'.

Do đó, các nhà nghiên cứu của bài báo đã kết hợp tính phân cực bất thường của các bình luận ác ý của chuyên gia vào một thuật toán riêng biệt, mang lại cho nó những khả năng gần như giống hệt với người đánh giá trong việc phát hiện các đánh giá gian lận.

Các nghiên cứu trước

Theo các tác giả, không có công trình nào trước đây có thể so sánh được để so sánh MMD vì đây là công nghệ đầu tiên cố gắng phát hiện các PMU dựa trên phong cách đăng tin tâm thần phân liệt của họ. Do đó, các nhà nghiên cứu đã so sánh phương pháp của họ với các thuật toán thành phần khác nhau được sử dụng trước đây bởi các bộ lọc tự động thông thường, bao gồm; hysad; bán buồn; Phát hiện ngoại lệ thống kê (CỎ NHÂN TẠO); K-nghĩa++ Phân cụm; CNN-buồn; Và Hệ thống đề xuất phát hiện người dùng vu khống (SDRS).

“[Trên] tất cả bốn bộ dữ liệu, mô hình MMD (MLC+MUP) được đề xuất của chúng tôi vượt trội hơn tất cả các đường cơ sở về điểm F. Lưu ý rằng MMD là sự kết hợp giữa MLC và MUP, đảm bảo tính ưu việt của nó so với các mô hình được giám sát và không giám sát”, các nhà nghiên cứu cho biết.

Bài báo còn nêu rõ rằng MMD có thể được sử dụng làm phương pháp tiền xử lý cho các hệ thống lọc tự động tiêu chuẩn và nó trình bày kết quả thử nghiệm trên một số bộ dữ liệu như Lọc cộng tác dựa trên người dùng (UBCF), Lọc cộng tác dựa trên mục (IBCF), Dữ liệu hóa ma trận (MF-eALS), Xếp hạng cá nhân hóa Bayesian (MF-BPR) và Lọc cộng tác thần kinh (NCF).

Theo kết luận của bài viết, các tác giả cho rằng xét về mặt Tỷ lệ truy cập (nhân sự) và Lãi lũy kế chiết khấu bình thường hóa (NDCG), những cải tiến được điều tra này đã mang lại kết quả được cải thiện:

“Trong số tất cả bốn bộ dữ liệu, MMD cải thiện các mô hình đề xuất về mặt nhân sự và NDCG. Cụ thể, MMD có thể nâng cao hiệu quả hoạt động của HR trung bình lên 28.7% và HDCG trung bình lên 17.3%. Bằng cách xóa những người dùng độc hại chuyên nghiệp, MMD có thể cải thiện chất lượng của bộ dữ liệu. Nếu không có [phản hồi] giả mạo của những người dùng độc hại chuyên nghiệp này, tập dữ liệu sẽ trở nên [trực quan] hơn.”

Tờ giấy đó có tên là Phát hiện người dùng độc hại chuyên nghiệp trong hệ thống đề xuất học tập số liệu và được xuất bản bởi các nhà nghiên cứu tại Khoa Khoa học và Công nghệ Máy tính của Đại học Cát Lâm; Phòng thí nghiệm trọng điểm về xử lý thông tin thông minh của Viện Hàn lâm Khoa học Trung Quốc tại Bắc Kinh; và Trường Kinh doanh của Đại học Rutgers.

Phương pháp

Rất khó để phát hiện các PMU vì hai tham số không tương đương (xếp hạng sao/thập phân có giá trị bằng số và đánh giá dựa trên văn bản) phải được xem xét. Theo các tác giả của bài báo mới, chưa có nghiên cứu tương tự nào được thực hiện trước đây.

Chủ đề đánh giá được chia thành các phần nội dung bằng cách sử dụng một Mạng thần kinh tái phát chú ý kép phân cấp (HDAN). HDAN dùng trọng âm để gán trọng số cho từng từ, từng câu. Trong hình trên, các tác giả nêu rõ rằng thuật ngữ “nghèo hơn” nên được coi trọng hơn các từ khác trong đánh giá.

Thuật toán MMD sử dụng Học số liệu để ước tính khoảng cách chính xác giữa các mục nhằm mô tả đặc điểm của toàn bộ tập hợp kết nối trong dữ liệu.

MMD sử dụng Mô hình yếu tố tiềm ẩn (LFM) để chọn người dùng và mục, sau đó lấy điểm đánh giá cơ bản. Mặt khác, HDAN kết hợp các đánh giá vào điểm cảm tính dưới dạng thông tin bổ sung.

Mô hình MUP tạo ra vectơ khoảng cách cảm tính, là sự khác biệt giữa xếp hạng và điểm cảm tính dự đoán của nội dung văn bản của bài đánh giá. Lần đầu tiên có thể phát hiện các PMU bằng phương pháp này.

Các nhãn đầu ra được sử dụng trong Metric Learning for Clustering (MLC) để thiết lập một số liệu dựa vào đó tính toán xác suất đánh giá của người dùng là độc hại.

Các nhà nghiên cứu cũng thực hiện một nghiên cứu về người dùng để xem hệ thống xác định các đánh giá độc hại chỉ dựa trên nội dung và xếp hạng sao của chúng hiệu quả như thế nào. Những người tham gia được yêu cầu cho điểm đánh giá là 0 (đối với người dùng thông thường) hoặc 1 (đối với người dùng có ác ý có kinh nghiệm).

Trung bình, các sinh viên xác định được 24 kết quả tích cực đúng và 24 kết quả tiêu cực sai trên tổng số đánh giá tốt và xấu theo tỷ lệ 50/50. MMD có thể gắn nhãn trung bình cho 23 người dùng tích cực thực sự và 24 người dùng tiêu cực thực sự, hoạt động gần như ở cấp độ con người, vượt qua tỷ lệ cơ bản của nhiệm vụ.

“Về bản chất, MMD là một giải pháp chung có thể phát hiện những người dùng độc hại chuyên nghiệp được khám phá trong bài viết này và đóng vai trò là nền tảng chung cho việc phát hiện người dùng độc hại. Với nhiều dữ liệu hơn, chẳng hạn như hình ảnh, video hoặc âm thanh, ý tưởng về MMD có thể mang tính hướng dẫn để phát hiện khoảng cách cảm tính giữa tiêu đề và nội dung của chúng, điều này có tương lai tươi sáng để chống lại các chiến lược che giấu khác nhau trong các ứng dụng khác nhau,” các tác giả giải thích. Nếu bạn quan tâm đến hệ thống ML, hãy xem lịch sử của Học máy, nó có từ thế kỷ 17.

Trí thông minh dữ liệu tạo

Các nhà nghiên cứu đã sử dụng ML để phát hiện các đánh giá của Người dùng độc hại (PMU) chuyên nghiệp

Thuật toán học máy đã quản lý để phát hiện các PMU

Các nghiên cứu trước

Phương pháp

Ethereum, Solana và các loại tiền thay thế đang tiếp cận 'Vùng chuối', Theo Macro Guru Raoul Pal - Đây là quan điểm của ông ấy - The Daily Hodl

Các cơ quan thực thi pháp luật của Vương quốc Anh giờ đây có thể thu giữ tiền điện tử dễ dàng hơn khi các quy tắc mới có hiệu lực

Tin tức mới nhất

Gấu Bitcoin có nguy cơ mất 7.2 tỷ USD nếu giá BTC đạt đến mức này

Meme coin Dog Go To The Moon vượt qua mức vốn hóa thị trường 500 triệu USD

Tại sao nhiều 'Blockchain Zombie' vẫn có vốn hóa thị trường lên tới hàng tỷ đô la – Unchained

Các quỹ ETF tiền điện tử giao ngay sẽ bắt đầu giao dịch ở Hồng Kông vào tuần tới: Báo cáo – The Daily Hodl

Khủng hoảng Cardano hay sự trở lại? Chỉ số chính của ADA đạt mức thấp, điều này có ý nghĩa gì đối với các nhà đầu tư

Lựa chọn đồng xu Meme hàng đầu để nắm giữ lâu dài: Dogecoin (DOGE), Shiba Inu (SHIB) và Furrever Token (FURR)

Trò chuyện trực tiếp với chúng tôi (chat)