Logo Zephyrnet

Hiểu các kỹ thuật học máy khác nhau

Ngày:

Học tăng cường có được giám sát hay không giám sát? Mặc dù câu hỏi kỹ thuật này rất quan trọng nhưng hãy chuyển trọng tâm sang lăng kính kinh doanh. Học tăng cường (RL) có tiềm năng to lớn trong việc chuyển đổi các quy trình ra quyết định và tối ưu hóa các chiến lược giữa các ngành.

Khối lượng dữ liệu khổng lồ được tạo ra bởi máy tính, điện thoại thông minh và các công nghệ khác nhau có thể gây khó khăn, đặc biệt đối với những người không chắc chắn về ý nghĩa của nó. Để khai thác dữ liệu này một cách hiệu quả, các nhà nghiên cứu và lập trình viên thường xuyên sử dụng máy học để nâng cao trải nghiệm người dùng.

Nổi lên hàng ngày là các phương pháp phức tạp dành cho các nhà khoa học dữ liệu bao gồm các kỹ thuật học tập có giám sát, không giám sát và tăng cường. Bài viết này nhằm mục đích mô tả ngắn gọn việc học có giám sát, không giám sát và tăng cường, nêu bật sự khác biệt của chúng và minh họa các ứng dụng của chúng bởi các công ty nổi tiếng.

Học tăng cường có được giám sát hay không giám sát?

Học tăng cường có con đường riêng trong thế giới học máy, khác biệt với cả việc học có giám sát và không giám sát. Nhưng trước tiên chúng ta hãy tìm hiểu thế nào là học có giám sát và học không giám sát đã.

Học có giám sát là gì?

Học có giám sát là một kỹ thuật học máy trong đó một mô hình được đào tạo trên tập dữ liệu được gắn nhãn. Điều này có nghĩa là dữ liệu bao gồm cả ví dụ đầu vào và đầu ra (nhãn) mong muốn tương ứng của chúng. Mục tiêu là để mô hình tìm hiểu mối quan hệ giữa đầu vào và đầu ra, để có thể dự đoán chính xác đầu ra cho dữ liệu mới, chưa được nhìn thấy.

Hãy nghĩ về nó giống như một học sinh đang học với một giáo viên. Tập dữ liệu được gắn nhãn giống như các bài tập thực hành có lời giải. Học sinh (người mẫu) nghiên cứu các ví dụ này và giáo viên (thuật toán) hướng dẫn quá trình học tập. Mục đích là để học sinh học cách giải quyết các vấn đề tương tự một cách độc lập.

Ý chính:

  • Dữ liệu được gắn nhãn: Trọng tâm của việc học có giám sát. Mỗi điểm dữ liệu có một đầu vào (tính năng) và đầu ra chính xác tương ứng (nhãn).
  • Đào tạo: Mô hình được cung cấp dữ liệu được dán nhãn. Nó phân tích các mô hình và mối tương quan giữa đầu vào và đầu ra.
  • Chức năng học tập: Mô hình này phát triển một hàm toán học để ánh xạ đầu vào thành đầu ra một cách chính xác nhất có thể.
  • Dự đoán: Sau khi được đào tạo, mô hình có thể nhận đầu vào mới và dự đoán đầu ra tương ứng của chúng.
Học tăng cường được giám sát hay không giám sát
Học có giám sát là một kỹ thuật học máy trong đó một mô hình được đào tạo trên tập dữ liệu được gắn nhãn

Học tập không giám sát là gì?

Học không giám sát là một kỹ thuật học máy trong đó mô hình được đào tạo trên tập dữ liệu không được gắn nhãn. Điều này có nghĩa là dữ liệu chỉ bao gồm đầu vào mà không có đầu ra mục tiêu tương ứng. Mục tiêu là để mô hình khám phá các mẫu, cấu trúc hoặc mối quan hệ ẩn bên trong chính dữ liệu.

Hãy nghĩ về nó giống như một đứa trẻ khám phá một môi trường mới mà không có bất kỳ hướng dẫn cụ thể nào. Trẻ học bằng cách quan sát các khuôn mẫu, nhóm các đồ vật giống nhau và hiểu các mối quan hệ mà không cần ai trực tiếp nói cho chúng biết các đồ vật được gọi là gì.

Ý chính:

  • Dữ liệu chưa được gắn nhãn: Học tập không giám sát không có câu trả lời được xác định trước để học.
  • Khám phá mẫu: Mô hình phân tích dữ liệu để tìm ra điểm tương đồng, khác biệt và cấu trúc cơ bản.
  • Không có hướng dẫn rõ ràng: Không có “giáo viên” nào sửa mẫu. Nó học thông qua việc tự khám phá.
Học tăng cường được giám sát hay không giám sát
Học không giám sát là một kỹ thuật học máy trong đó mô hình được đào tạo trên tập dữ liệu không được gắn nhãn

Học tăng cường là gì?

Học tăng cường là một loại học máy trong đó tác nhân học thông qua thử và sai bằng cách tương tác với môi trường. Tác nhân thử các hành động khác nhau, nhận phần thưởng hoặc hình phạt dựa trên hành động của mình và điều chỉnh chiến lược của mình để tối đa hóa tổng phần thưởng theo thời gian.

Hãy tưởng tượng việc huấn luyện một con chó. Bạn không nói rõ ràng cho con chó cách ngồi. Thay vào đó, bạn thưởng cho nó (phần thưởng) khi nó thực hiện các hành động dẫn đến việc ngồi. Theo thời gian, con chó học cách liên kết việc ngồi với phần thưởng

Ý chính:

  • Đại lý: Người ra quyết định, thực thể học hỏi.
  • môi trường: Hệ thống mà tác nhân tương tác.
  • Nhà nước: Tình hình hiện tại của tác nhân trong môi trường của nó.
  • Hành động: Tác nhân có thể làm gì trong môi trường của nó.
  • thưởng: Tín hiệu phản hồi tích cực hoặc tiêu cực mà tác nhân nhận được cho hành động của mình.
  • chính sách: Chiến lược mà tác nhân sử dụng để xác định hành động cần thực hiện trong một trạng thái nhất định.
Học tăng cường được giám sát hay không giám sát
Học tăng cường là một loại học máy trong đó tác nhân học thông qua thử và sai bằng cách tương tác với môi trường

Chọn kỹ thuật học máy nào?

Không có kỹ thuật học máy nào “tốt nhất” có thể vượt trội hơn tất cả các kỹ thuật khác. Kỹ thuật tốt nhất phụ thuộc hoàn toàn vào các yếu tố sau:

  • Vấn đề: Bạn đang cố gắng giải quyết nhiệm vụ gì?
    • Phân loại (ví dụ: lọc thư rác)?
    • Hồi quy (ví dụ, dự đoán giá nhà đất)?
    • Phân cụm (ví dụ: phân nhóm khách hàng)
    • Phát hiện bất thường (ví dụ: xác định các giao dịch gian lận)?
  • Loại dữ liệu:
    • Dữ liệu của bạn có được gắn nhãn hoặc không được gắn nhãn không?
    • Tập dữ liệu của bạn lớn đến mức nào?
    • Dữ liệu có cấu trúc (ví dụ: số, danh mục) hay không có cấu trúc (ví dụ: hình ảnh, văn bản)?
  • Hiệu suất mong muốn:
    • Bạn ưu tiên tốc độ hay độ chính xác cao?
    • Việc mô hình có thể được diễn giải dễ dàng (hiểu cách nó đưa ra quyết định) quan trọng như thế nào?

Chọn học có giám sát nếu bạn có tập dữ liệu với các ví dụ được gắn nhãn (dữ liệu đầu vào và kết quả đầu ra chính xác tương ứng của chúng). Các kỹ thuật phổ biến bao gồm Hồi quy tuyến tính (để dự đoán các giá trị liên tục), Hồi quy logistic (để phân loại), Cây quyết định (để tạo mô hình dựa trên quy tắc), SVM (để tìm ranh giới giữa các lớp dữ liệu) và Mạng thần kinh (để nhận dạng mẫu phức tạp).

Học tập không giám sát là giải pháp hoàn hảo để khám phá tập dữ liệu của bạn, khám phá các mẫu ẩn hoặc nhóm các điểm dữ liệu tương tự khi bạn chưa có sẵn kết quả được xác định trước. Các kỹ thuật phổ biến bao gồm K-Means Clustering (nhóm dữ liệu theo độ tương tự), Phân tích thành phần chính (PCA) (giảm độ phức tạp của dữ liệu) và Bộ mã hóa tự động (để tìm các biểu diễn dữ liệu nhỏ gọn).

Học tăng cường đặc biệt hữu ích cho các vấn đề tập trung vào việc ra quyết định với phần thưởng dài hạn, như trong trò chơi hoặc robot. Trong học tăng cường, tác nhân tương tác với môi trường, nhận phản hồi dưới dạng phần thưởng hoặc hình phạt và tìm hiểu chiến lược tối ưu để tối đa hóa phần thưởng theo thời gian.


Hình ảnh tín dụng: Kerem Gülen/Giữa hành trình

tại chỗ_img

Tin tức mới nhất

tại chỗ_img