Logo Zephyrnet

Trình phân loại văn bản AI: Trình phát hiện ChatGPT của OpenAI cho biết văn bản do AI tạo

Ngày:

OpenAI đã phát hành kryptonite của riêng mình có tên là Trình phân loại văn bản AI. Trình phát hiện ChatGPT nhằm mục đích phân biệt văn bản do AI tạo ra với văn bản do con người viết sau khi báo trước động thái xuất hiện trên phương tiện truyền thông, như Buzzfeed. Trình phân loại văn bản AI có khả năng ngăn chặn sự lan truyền tự động của thông tin không chính xác, đạo văn và chatbot giả làm con người. Nhưng cần có nhiều tiến bộ hơn để đạt được những mục tiêu này. Độ chính xác phân loại thấp vào lúc này. Nó có tỷ lệ thành công 26%, không đủ tốt. Tuy nhiên, OpenAI tin rằng nó, khi kết hợp với các biện pháp bảo mật khác, có thể giúp ngăn chặn việc lạm dụng trình tạo văn bản AI.

Chúng tôi đã đào tạo một bộ phân loại để phân biệt giữa văn bản do con người viết và văn bản do AI viết từ nhiều nhà cung cấp khác nhau. Mặc dù không thể phát hiện tất cả văn bản do AI viết một cách đáng tin cậy, nhưng chúng tôi tin rằng các công cụ phân loại tốt có thể cung cấp thông tin giảm nhẹ cho các tuyên bố sai sự thật rằng văn bản do AI tạo ra được viết bởi con người: ví dụ: chạy các chiến dịch cung cấp thông tin sai lệch tự động, sử dụng các công cụ AI để gian lận trong học thuật và định vị một chatbot AI như một con người.

-MởAI

Trình phân loại văn bản AI là gì? Trình phát hiện ChatGPT của OpenAI đã giải thích

Trình phân loại văn bản AI từ OpenAI là trình phát hiện GPT-3 và ChatGPT được tạo để phân biệt giữa văn bản do con người viết và văn bản do AI tạo. Dựa theo OpenAI, trình phát hiện ChatGPT là một “mô hình GPT được tinh chỉnh để dự đoán khả năng một đoạn văn bản được tạo bởi AI từ nhiều nguồn khác nhau, chẳng hạn như ChatGPT”.

Chúng tôi đang phát triển một công cụ mới để giúp phân biệt giữa văn bản do AI viết và do con người viết. Chúng tôi đang phát hành phiên bản ban đầu để thu thập phản hồi và hy vọng chia sẻ các phương pháp cải tiến trong tương lai. https://t.co/4dQE3dX6vX

Khi được áp dụng cho một kho văn bản tiếng Anh, công nghệ này chỉ ra tài liệu do AI viết trong 26% thời gian. Mặt khác, nó đã xác định nhầm 9% các tác phẩm do con người viết là do máy tạo ra. OpenAI tuyên bố rằng công nghệ sẽ cải thiện với nội dung dài hơn. Do đó, nó cần ít nhất 1,000 ký tự để thực hiện phân tích. Như bạn có thể thấy, OpenAI AI Text Classifier có một số hạn chế, chẳng hạn như:

Khi áp dụng cho các văn bản ngắn, trình phân loại hoạt động rất kém (dưới 1,000 ký tự) và không hiếm khi trình phân loại mắc lỗi khi đánh dấu các văn bản dài hơn.

  • Trình phân loại văn bản AI của OpenAI có thể xác định nhầm nội dung do con người viết là do trí tuệ nhân tạo tạo ra.
  • Trình phân loại được sử dụng tốt nhất với văn bản tiếng Anh. Nó kém hiệu quả hơn nhiều trong các ngôn ngữ khác và không đáng tin cậy trong mã.
  • Văn bản cực kỳ dễ đoán không thể nhận dạng một cách đáng tin cậy.
  • Bất kỳ văn bản nào do AI tạo ra đều có thể được điều chỉnh để đánh lừa bộ phân loại. Mặc dù các bộ phân loại của OpenAI có thể được đào tạo lại và cập nhật dựa trên các cuộc tấn công thành công, nhưng việc phát hiện có mang lại lợi ích lâu dài hay không vẫn còn gây tranh cãi.
  • Hiệu suất của các bộ phân loại dựa trên mạng nơ-ron nổi tiếng là kém khi áp dụng cho dữ liệu không phải là một phần của tập huấn luyện. Người ta đã quan sát thấy rằng bộ phân loại có thể quá tự tin vào dự đoán của nó khi được trình bày với các đầu vào rất khác với văn bản trong tập huấn luyện.

Trình phát hiện ChatGPT của OpenAI đã được đào tạo bằng cách sử dụng dữ liệu từ 34 trình tạo văn bản khác nhau của 5 công ty, bao gồm cả OpenAI. Văn bản này được kết hợp với nội dung do con người viết tương tự nhưng không giống nhau từ các nguồn bao gồm Wikipedia, các trang web được lấy từ các liên kết Reddit và một tập hợp "các cuộc biểu tình của con người" được thu thập cho một hệ thống tạo văn bản OpenAI trước đó. (OpenAI thừa nhận trong một bài viết hữu ích rằng nó có thể đã dán nhãn nhầm một số bài viết do AI viết thành bài viết của con người “dựa trên sự phong phú của nội dung do AI tạo ra trên internet.”)

Điều quan trọng cần lưu ý là Trình phân loại văn bản OpenAI sẽ không phân loại đúng tất cả các văn bản. Yêu cầu tối thiểu 1,000 ký tự, tức là khoảng 150-250 từ. Vì AI tạo văn bản đã được phát hiện là đọc lại văn bản mà nó đã được dạy, nên việc nó không có khả năng phát hiện đạo văn là điều đặc biệt đáng thất vọng. Do bộ dữ liệu chuyển tiếp sang tiếng Anh, OpenAI tuyên bố rằng nó có nhiều khả năng mắc lỗi hơn khi xử lý văn bản được viết bởi trẻ em hoặc bằng một ngôn ngữ không phải tiếng Anh.

Trình phân loại văn bản AI của OpenAI là gì và cách sử dụng nó? Tìm hiểu các hạn chế của trình phát hiện ChatGPT và tìm hiểu các tính năng của nó. Nó có thể phát hiện đạo văn.
Trình phân loại văn bản AI của OpenAI vẫn cần cải thiện

Bất chấp tất cả những hạn chế của nó, chúng tôi có thể yên tâm nói rằng công cụ này vẫn đáng để thử. Xem xét rằng nó nằm ngoài tầm tay của nhóm đã phát triển ChatGPT, nó được kỳ vọng sẽ trở nên thành công hơn trong tương lai.


Bạn có muốn học không cách sử dụng ChatGPT hiệu quả và thậm chí kiếm tiền với nó? Chúng tôi có một số mẹo và thủ thuật dành cho bạn! Kỹ thuật nhắc nhở AI là chìa khóa của thế giới vô hạn, nhưng bạn nên cẩn thận; khi bạn muốn sử dụng công cụ AI, bạn có thể gặp lỗi, chẳng hạn như ChatGPT hiện đang hoạt động hết công suất. Vâng, đó là một lỗi thực sự khó chịu, nhưng đừng lo lắng; chúng tôi biết cách khắc phục mà không cần chuyển sang Trò chuyệnGPT chuyên nghiệp.


Làm cách nào để sử dụng Trình phân loại văn bản AI của OpenAI?

Thực hiện theo các bước đơn giản sau để sử dụng Trình phân loại văn bản AI của OpenAI:

  • Truy cập trang web Trình phân loại văn bản AI và đăng nhập.
  • Dán văn bản vào khu vực dành riêng.

Trình phân loại văn bản AI của OpenAI là gì và cách sử dụng nó? Tìm hiểu các hạn chế của trình phát hiện ChatGPT và tìm hiểu các tính năng của nó. Nó có thể phát hiện đạo văn.

    Trình phát hiện ChatGPT có những hạn chế nhưng đầy hứa hẹn

  • Nhấp vào gửi.

Chúng tôi đã sử dụng ChatGPT để viết văn bản mẫu và như bạn có thể thấy, chúng tôi nhận được kết quả “Bộ phân loại coi văn bản có khả năng do AI tạo ra”. Vậy “có thể” thực sự có nghĩa là gì?

Trình phân loại văn bản AI của OpenAI ước tính khả năng văn bản được tạo ra bởi trí tuệ nhân tạo. Kết quả có thể là bất cứ điều gì từ:

  • Rất khó xảy ra
  • Không có khả năng
  • Không rõ nếu nó là
  • Có thể
  • Có khả năng

Máy dò đưa ra phán quyết khá mơ hồ về việc liệu một đoạn văn bản nhất định có phải do trí tuệ nhân tạo tạo ra hay không. Nó sẽ phân loại văn bản là “rất khó xảy ra” (ít hơn 10% cơ hội), “không chắc” (xác suất 10%-45%), “không rõ nếu có” (45%-90%), “có thể” (90% -98%), hoặc “có khả năng” (trên 98%) nếu tin chắc rằng nó được tạo ra bởi trí tuệ nhân tạo. Vì vậy, câu trả lời của trình phát hiện ChatGPT là đúng trong trường hợp này.


Trong khi vẫn còn một số tranh luận về hình ảnh do trí tuệ nhân tạo tạo ra, mọi người vẫn đang tìm kiếm máy tạo nghệ thuật AI tốt nhấtAI sẽ thay thế các nhà thiết kế? Tiếp tục đọc và tìm hiểu.


Phân loại văn bản đề cập đến quá trình phân loại và gắn thẻ văn bản. Đó là một điều kỳ diệu mà máy học có thể phân loại chính xác văn bản dạng tự do thành các danh mục cứng nhắc. Một số hệ thống phần mềm dựa vào phương pháp này, từ phân tích tình cảm đến lọc email.

Nỗ lực này là một nhiệm vụ học tập có giám sát bởi vì mỗi đoạn văn bản được gắn nhãn với các danh mục được xác định trước. Giống như một học giả kỳ cựu, thuật toán phải học từ tài liệu được chú thích để phân loại chính xác văn bản mới. Phân loại văn bản đã được chứng minh là một công cụ thay đổi cuộc chơi trong nhiều lĩnh vực, bắt đầu bằng phân tích tình cảm, gắn nhãn chủ đề, nhận dạng thư rác và phát hiện ý định.

Phân loại văn bản là một kỹ thuật hấp dẫn, được trau dồi kỹ lưỡng chỉ bao gồm một vài bước chính. Bước đầu tiên là mã hóa, bao gồm việc tách văn bản thành các từ và cụm từ riêng lẻ. Sau đó, nó sử dụng sự sang trọng của kỹ thuật nhúng từ để chuyển đổi các mã thông báo này thành các giá trị số mang lại cái nhìn thoáng qua về không gian có chiều cao hơn.

Sau đó, nó sử dụng những con số này làm đầu vào cho thuật toán Machine Learning, thuật toán này sẽ phân tích các kết nối giữa văn bản và nhãn của nó để đưa ra kết luận. Khi thuật toán đã được đào tạo, nó có thể phân loại hiệu quả văn bản chưa được đào tạo.

Cần có sự cân bằng tốt giữa chất lượng của dữ liệu huấn luyện, phương pháp được chọn và các tham số được sử dụng để tối ưu hóa độ chính xác của mô hình. Một cách để cải thiện độ chính xác của sáng tạo nghệ thuật là điều chỉnh các tham số của nó hoặc sử dụng các kỹ thuật tổng hợp.

Chào mừng đến với thế giới do AI điều khiển

Bạn là người mới làm quen với trí tuệ nhân tạo? Đừng lo lắng; vẫn còn thời gian để nhảy lên chuyến tàu AI. Đừng sợ biệt ngữ AI; chúng tôi đã tạo ra một chi tiết Bảng thuật ngữ AI để được sử dụng phổ biến nhất thuật ngữ trí tuệ nhân tạo và giải thích những điều cơ bản về trí tuệ nhân tạo cũng như các rủi ro và lợi ích của trí tuệ nhân tạo.

Bạn có thắc mắc về tác dụng của trí tuệ nhân tạo trong cuộc sống hàng ngày? Hầu như mỗi ngày, một công cụ, mô hình hoặc tính năng mới xuất hiện và thay đổi cuộc sống của chúng ta, chẳng hạn như ChatGPTvà chúng tôi đã xem xét một số cái tốt nhất:

  • Công cụ AI chuyển văn bản thành văn bản

tại chỗ_img

Tin tức mới nhất

tại chỗ_img