제퍼넷 로고

연구원들은 ML을 사용하여 PMU(Professional Malicious User) 리뷰를 탐지했습니다.

시간

중국과 미국 간의 새로운 연구 협력에서는 리뷰어의 서명 행동을 활용하여 경쟁사를 약화시키거나 협박을 조장하도록 설계된 악의적인 전자상거래 리뷰를 탐지하는 방법을 제공합니다.

차례

기계 학습 알고리즘이 PMU를 감지했습니다.

이 문서에서는 MMD(악의적인 사용자 감지 모델)라는 시스템이 이러한 사용자의 출력을 분석하여 PMU(Professional Malicious User)를 결정하고 레이블을 지정하는 방법을 설명합니다. 컴퓨터 비전 및 추천 시스템에 사용되는 방법인 Metric Learning과 RNN(Recurrent Neural Network)을 사용하여 시스템은 이러한 비평가의 결과를 식별하고 분류합니다.

중국과 미국의 연구원들은 가짜 부정적인 리뷰를 게시하는 Pmus(전문 악성 사용자)를 탐지할 수 있는 Ml 모델을 개발했습니다.
ML 알고리즘은 PMU를 감지할 수 있었습니다.

사용자 경험은 일반적으로 일반적인 시나리오에서 의미가 있는 별점(또는 XNUMX점 만점)과 텍스트 기반 댓글을 사용하여 평가할 수 있습니다. 반면에 PMU는 높은 평점으로 부정적인 텍스트 평가를 제출하거나 좋은 리뷰로 낮은 평점을 제출함으로써 이러한 생각에 어긋나는 경우가 많습니다.

이는 악의적인 악성 댓글을 식별하고 처리하기 위한 전자상거래 사이트의 단순한 필터를 설정하지 않고 사용자의 리뷰가 평판에 해를 끼칠 수 있도록 허용하기 때문에 훨씬 더 해롭습니다. NLP 필터가 리뷰에서 욕설을 감지하면 PMU가 할당한 높은 별(또는 소수) 등급이 부정적인 내용을 효과적으로 상쇄하여 통계적으로 볼 때 '중립'으로 보이게 만듭니다.

새로운 연구에 따르면 PMU는 부정적인 댓글을 수정하고 더 이상 나쁜 리뷰를 게시하지 않겠다는 약속의 대가로 인터넷 소매업체에 돈을 요구하는 데 자주 사용되는 것으로 나타났습니다. 할인을 원하는 일부 개인은 피해자의 경쟁업체에 고용되는 경우가 있지만 대부분의 경우 PMU는 피해자의 경쟁업체에 의해 비윤리적으로 활용됩니다.

중국과 미국의 연구원들은 가짜 부정적인 리뷰를 게시하는 Pmus(전문 악성 사용자)를 탐지할 수 있는 Ml 모델을 개발했습니다.
PMU를 감지할 수 있는 비교 가능한 이전 연구는 없습니다.

이러한 검사를 위한 최신 자동화 탐지기는 콘텐츠 기반 필터링 또는 협업 필터링 접근 방식을 사용하여 명확한 '이상값'을 찾습니다. 이는 두 피드백 모드 모두에서 음울하고 부정적인 리뷰이며 리뷰 정서 및 평가의 전반적인 추세와 크게 다릅니다.

높은 게시 빈도는 이러한 필터가 찾는 일반적인 신호입니다. 대조적으로, PMU는 전략적으로 게시하지만 각 검토는 개별 커미션일 수도 있고 '빈도' 통계를 모호하게 하는 장기 계획의 구성 요소일 수 있기 때문에 거의 게시하지 않습니다.

이 때문에 본 논문의 연구자들은 전문가 악성 댓글의 특이한 극성을 별도의 알고리즘에 통합하여 허위 리뷰를 탐지하는 데 인간 리뷰어와 거의 동일한 기능을 제공했습니다.

중국과 미국의 연구원들은 가짜 부정적인 리뷰를 게시하는 Pmus(전문 악성 사용자)를 탐지할 수 있는 Ml 모델을 개발했습니다.
이 방법을 사용하여 최초로 PMU를 탐지하는 것이 가능해졌습니다.

이전의 연구

저자에 따르면 MMD는 정신분열증 게시 스타일을 기반으로 PMU를 탐지하는 최초의 기술이기 때문에 비교할 수 있는 이전 연구는 없습니다. 결과적으로 연구원들은 이전에 기존 자동 필터에서 사용했던 다양한 구성 요소 알고리즘과 자신의 방법을 비교했습니다. 히사드약간 슬픈통계 이상값 감지 (잔디); K-평균++ 클러스터링; CNN 슬픈및 비방유저 적발 추천 시스템 (SDRS).

“XNUMX개 데이터 세트 모두에서 우리가 제안한 모델 MMD(MLC+MUP)는 F 점수 측면에서 모든 기준선보다 성능이 뛰어납니다. MMD는 MLC와 MUP의 조합으로 지도 및 비지도 모델에 비해 우수함을 보장합니다.”라고 연구진은 말했습니다.

이 논문에서는 MMD가 표준 자동 필터링 시스템의 전처리 방법으로 사용될 수 있으며 다음과 같은 여러 데이터 세트에 대한 실험 결과를 제시합니다. 사용자 기반 협업 필터링 (UBCF), 아이템 기반 협업 필터링 (IBCF), 행렬 분해 (MF-eALS), 베이지안 개인화 순위 (MF-BPR) 및 신경 협업 필터링 (NCF).

중국과 미국의 연구원들은 가짜 부정적인 리뷰를 게시하는 Pmus(전문 악성 사용자)를 탐지할 수 있는 Ml 모델을 개발했습니다.
MMD는 PMU를 탐지할 수 있는 일반적인 솔루션입니다.

기사의 결론에 따르면 저자는 다음과 같이 말합니다. 적중률 (HR) 및 정규화 할인 누적 이득 (NDCG), 이러한 조사된 증강으로 인해 향상된 결과가 나타났습니다.

“네 가지 데이터 세트 모두 중에서 MMD는 HR 및 NDCG 측면에서 추천 모델을 개선합니다. 구체적으로 MMD는 HR의 성과를 평균 28.7%, HDCG는 평균 17.3% 향상시킬 수 있다. 전문적인 악의적인 사용자를 삭제함으로써 MMD는 데이터 세트의 품질을 향상시킬 수 있습니다. 이러한 전문적인 악의적 사용자의 가짜 [피드백]이 없으면 데이터 세트가 더욱 [직관적으로] 됩니다.”

종이라고 하는데 메트릭 학습 추천 시스템의 전문적인 악성 사용자 탐지 길림대학교 컴퓨터 과학기술학과 연구원들이 출판했습니다. 베이징에 있는 중국과학원 지능정보처리 핵심 연구실; 및 Rutgers 대학교 경영대학원.

방법

두 개의 비동등 매개변수(숫자 값 별점/소수점 등급 및 텍스트 기반 리뷰)를 고려해야 하기 때문에 PMU를 감지하기가 어렵습니다. 새로운 논문의 저자에 따르면 이전에는 유사한 연구가 수행되지 않았습니다.

중국과 미국의 연구원들은 가짜 부정적인 리뷰를 게시하는 Pmus(전문 악성 사용자)를 탐지할 수 있는 Ml 모델을 개발했습니다.
HDAN은 강조를 사용하여 각 단어와 각 문장에 가중치를 할당합니다.

리뷰 주제는 다음을 사용하여 콘텐츠 청크로 나뉩니다. 계층적 Dual-Attention 순환 신경망 (HDAN). HDAN은 강조를 사용하여 각 단어와 각 문장에 가중치를 할당합니다. 위 그림에서 저자는 리뷰에서 다른 단어보다 "가난한"이라는 용어에 더 큰 중요성을 부여해야 한다고 말합니다.

MMD 알고리즘은 측정 학습을 사용하여 항목 간의 정확한 거리를 추정하여 데이터의 전체 연결 집합을 특성화합니다.

MMD는 LFM(Latent Factor Model)을 사용하여 사용자와 항목을 선택하고 기본 평가 점수를 얻습니다. 반면 HDAN은 리뷰를 감성 점수에 보충 정보로 포함합니다.

MUP 모델은 리뷰 텍스트 콘텐츠의 평점과 예측된 감정 점수 간의 차이인 감정 격차 벡터를 생성합니다. 이 방법을 사용하여 최초로 PMU를 탐지하는 것이 가능해졌습니다.

출력 레이블은 MLC(클러스터링을 위한 메트릭 학습)에서 사용자 리뷰가 악의적일 확률을 계산하는 메트릭을 설정하는 데 사용됩니다.

중국과 미국의 연구원들은 가짜 부정적인 리뷰를 게시하는 Pmus(전문 악성 사용자)를 탐지할 수 있는 Ml 모델을 개발했습니다.
평균적으로 학생들은 좋은 리뷰와 나쁜 리뷰를 24/24으로 혼합하여 50개의 참 긍정과 50개의 거짓 부정을 식별했습니다.

또한 연구원들은 사용자 연구를 수행하여 시스템이 콘텐츠와 별점만을 기반으로 악성 리뷰를 얼마나 효과적으로 식별하는지 확인했습니다. 참가자들에게 평가 점수를 0(일반 사용자의 경우) 또는 1(경험이 있는 악의적인 사용자의 경우)으로 할당하도록 요청했습니다.

평균적으로 학생들은 좋은 리뷰와 나쁜 리뷰를 24/24으로 혼합하여 50개의 참 긍정과 50개의 거짓 부정을 식별했습니다. MMD는 평균적으로 23명의 진짜 긍정적인 사용자와 24명의 진짜 부정적인 사용자에게 라벨을 붙일 수 있었으며 거의 ​​인간 수준으로 운영되어 작업의 기준 속도를 능가했습니다.

“본질적으로 MMD는 이 백서에서 살펴본 전문적인 악성 사용자를 탐지하고 악의적인 사용자 탐지를 위한 일반적인 기반 역할을 할 수 있는 일반적인 솔루션입니다. 이미지, 비디오 또는 사운드와 같은 더 많은 데이터를 사용하면 MMD 아이디어는 제목과 콘텐츠 사이의 감정 격차를 감지하는 데 도움이 될 수 있으며, 이는 다양한 애플리케이션에서 다양한 마스킹 전략에 대응할 수 있는 밝은 미래를 가지고 있습니다.”라고 저자는 설명했습니다. ML 시스템에 관심이 있다면 다음을 확인하세요. 머신 러닝의 역사는 17세기로 거슬러 올라갑니다..

spot_img

최신 인텔리전스

spot_img