Logo Zephyrnet

Các dòng tweet của Trump làm mờ ranh giới giữa thực tế và hư cấu.

Ngày:


Photo by hình ảnh on Unsplash
Hướng dẫn Meijer

Chúng ta đang sống trong thời đại của thông tin sai lệch, trong đó ngày càng khó phân biệt sự thật và giả dối. Một phần nguyên nhân là do những tiến bộ công nghệ, được hình thành trong sự ra đời của bong bóng internet; mạng nơ-ron có thể tạo ra các video và chương trình giả mạo sâu sắc khiến Internet tràn ngập tin tức giả mạo. Trong các trường hợp khác, lời đổ lỗi nằm ở những cá nhân cố tình lan truyền các thông điệp gây hiểu lầm hoặc lừa dối hoàn toàn, bởi vì cá nhân họ được hưởng lợi từ việc nhầm lẫn đâu là thật và đâu là giả. Một trong những người này là đương kim Tổng thống Hoa Kỳ. Ông Trump thường xuyên làm mất uy tín các nguồn tin tức được nhiều người coi là đáng tin cậy. Một số ví dụ về các hãng tin mà anh ta gán cho là “phương tiện truyền thông tin tức giả mạo” là The New York Times, CNN và The Washington Post. Hầu như không phải là sự trùng hợp ngẫu nhiên mà có sự trùng lặp lớn giữa các nguồn bị cho là giả mạo và những nguồn không đồng ý với quan điểm chính trị của ông Trump.

Để khuếch đại những tuyên bố thường gây hiểu lầm của mình, ông Trump thường sử dụng Twitter như một nền tảng. Ví dụ, anh ấy có đã tuyên bố sai rằng các lá phiếu gửi qua thư dẫn đến một cuộc bầu cử gian lận (họ không), và rằng anh ấy sa thải tướng James Mattis của Thủy quân lục chiến (ông từ chức). Để bảo vệ Twitter, công ty đã gắn nhãn một số tweet của ông Trump là chứa thông tin sai lệch. Bên cạnh tính chính xác của các dòng tweet của ông Trump, phong cách viết thường đặc biệt không mang tính tổng thống với vô số dấu chấm than và cách viết hoa ngẫu nhiên. Nội dung gây hiểu lầm được viết theo phong cách kỳ quặc đã trở thành chữ ký đặc biệt của ông và khuyến khích nhiều người bắt đầu chế nhạo các tài khoản Twitter bắt chước ông Trump một cách đùa cợt. Điều này đã tạo ra một ranh giới mờ nhạt khác giữa sự thật và hư cấu trên một tình huống vốn đã không rõ ràng. Đôi khi, tôi rất khó xác định xem một tweet là thật hay là một trò nhại. Đó là khi tôi quyết định xem liệu một thuật toán học máy có thể tạo ra sự khác biệt này cho tôi hay không.

Tôi đã trích xuất 1000 tweet từ chính ông Trump và 500 tweet từ hai tài khoản nhại lại (@realDonaldTrFan@RealDonalDrumpf) để đào tạo một thuật toán học máy (xem Kho lưu trữ Github để biết chi tiết) để biết sự khác biệt giữa tweet thật và nhái. Bộ phân loại được đào tạo đã hoạt động rất tốt và có thể phân loại chính xác 88% các tweet mới là thật hay giả. Thật không may, nó chưa hoàn toàn đạt đến hiệu suất cấp độ con người. Bạn gái của tôi đã đủ tốt bụng và buồn chán khi ngồi sau máy tính xách tay và phân loại 100 tweet cho tôi, và có 96% đúng. Chỉ có hai lần tôi nghe thấy "Anh ấy thực sự ** người nói tục ngữ ** đã nói điều đó?!".

Tôi đã lấy bộ phân loại được đào tạo và đặt nó vào Bot Twitter; @real_fakeTrump đã được sinh ra. Bot hiển thị cho bạn một tweet từ chính ông Trump hoặc một trong các tài khoản nhại lại, sau đó bạn phải đoán xem đó là thật hay giả. Trong chuỗi bot sau đó cho bạn biết dự đoán của chính nó, câu trả lời chính xác và liên kết đến tweet ban đầu. Chúng ta hãy đi sâu vào và xem xét một vài ví dụ, đầu tiên là một tweet mà bộ phân loại đã xác định chính xác sau đó là hai vị trí nó bị nhầm lẫn. Trường hợp thứ hai là thú vị nhất vì chúng là những dòng tweet nhại lại có thể là thật hoặc những dòng tweet của ông Trump vô lý đến mức không thể phân biệt được với nhại.

Chúng ta hãy thử đi nhé? Bạn nghĩ gì về cái này:

1. 8 cách đã được chứng minh để sử dụng Chatbots cho tiếp thị (với các ví dụ thực tế)

2. Cách sử dụng Texthero để chuẩn bị tập dữ liệu dựa trên văn bản cho dự án NLP của bạn

3. 5 mẹo hàng đầu để thiết kế Chatbot lấy con người làm trung tâm

4. Hội nghị Chatbot trực tuyến

Nếu bạn nghĩ rằng tweet này là giả mạo, bạn đã nhầm lẫn một cách đáng buồn. Người phân loại đã xác định chính xác dòng tweet này là thật (nhưng chỉ với độ chắc chắn 55%), nó thực sự là từ chính ông Trump. Hãy thử một cái khác:

Đây là một ví dụ thú vị về nơi mà bộ phân loại đã mắc lỗi; nó xác định dòng tweet này là giả mạo nhưng nó thực sự là của ông Trump. Điều này có nghĩa là dòng tweet này rất gần với sự bắt chước liên quan đến việc lựa chọn từ ngữ và cách xây dựng câu. Tuy nhiên, vì thuật toán xây dựng mô hình chiều cao để đưa ra dự đoán nên rất tiếc là không thể xác định chính xác làm thế nào nó đã đi đến kết luận của nó. OK, điều cuối cùng:

Bạn có thể đoán rằng cái này là giả, nó thực sự là từ một tài khoản nhại lại @RealDonalDrumpf. Tuy nhiên, người phân loại cho rằng điều này rất gần với phong cách tweet của ông Trump đến mức dự đoán nó là thật.

Hiện tại, các video giả mạo sâu sắc và các bài báo giả mạo do chương trình tương đối dễ phát hiện, mặc dù trong một số trường hợp, điều đó là không thể. Lấy ví dụ sinh viên đại học đã tạo một blog năng suất với nội dung được tạo bằng mô hình ngôn ngữ GPT-3. Không ai nhận ra blog không phải do con người viết và nó đã lọt vào top Tin tặc. Khi công nghệ ngày càng phát triển, việc phân biệt sự thật với hư cấu sẽ ngày càng trở nên khó khăn. Trớ trêu thay, chúng ta có thể cần phải phụ thuộc vào AI để tạo ra sự khác biệt này cho chúng ta.

Source: https://chatbotslife.com/trumps-tweets-blur-the-boundary-between-reality-and-fiction-6dab612570b9?source=rss—-a49517e4c30b—4

tại chỗ_img

Tin tức mới nhất

tại chỗ_img