Logo Zephyrnet

Năm loại máy học cần biết – IBM Blog

Ngày:


Năm loại máy học cần biết – IBM Blog




học máy Công nghệ (ML) có thể thúc đẩy việc ra quyết định trong hầu hết các ngành, từ chăm sóc sức khỏe đến nhân sự, tài chính và trong vô số trường hợp sử dụng, như thị giác máy tính, mô hình ngôn ngữ lớn (LLM), nhận dạng giọng nói, xe tự lái và hơn thế nữa.

Tuy nhiên, ảnh hưởng ngày càng tăng của ML không phải là không có biến chứng. Các bộ dữ liệu đào tạo và xác thực làm nền tảng cho công nghệ ML thường được con người tổng hợp và con người dễ bị thiên vị và dễ mắc lỗi. Ngay cả trong trường hợp mô hình ML không bị sai lệch hoặc bị lỗi, việc triển khai nó trong bối cảnh sai có thể tạo ra lỗi với những hậu quả có hại không lường trước được.

Đó là lý do tại sao việc đa dạng hóa việc sử dụng AI và ML của doanh nghiệp có thể chứng tỏ là vô giá để duy trì lợi thế cạnh tranh. Mỗi loại và loại phụ của thuật toán ML đều có những lợi ích và khả năng riêng biệt mà các nhóm có thể tận dụng cho các nhiệm vụ khác nhau. Ở đây, chúng ta sẽ thảo luận về năm loại chính và ứng dụng của chúng.

Học máy là gì?

ML là một môn khoa học máy tính, khoa học dữ liệutrí tuệ nhân tạo (AI) tập hợp con cho phép các hệ thống học hỏi và cải thiện từ dữ liệu mà không cần can thiệp lập trình bổ sung.

Thay vì sử dụng các hướng dẫn rõ ràng để tối ưu hóa hiệu suất, các mô hình ML dựa vào các thuật toán và mô hình thống kê để triển khai các tác vụ dựa trên các mẫu dữ liệu và suy luận. Nói cách khác, ML tận dụng dữ liệu đầu vào để dự đoán kết quả đầu ra, liên tục cập nhật kết quả đầu ra khi có dữ liệu mới.

Ví dụ: trên các trang web bán lẻ, thuật toán học máy ảnh hưởng đến quyết định mua hàng của người tiêu dùng bằng cách đưa ra khuyến nghị dựa trên lịch sử mua hàng. Nền tảng thương mại điện tử của nhiều nhà bán lẻ—bao gồm cả nền tảng của IBM, Amazon, Google, Meta và Netflix—dựa vào mạng thần kinh nhân tạo (ANN) để đưa ra các đề xuất được cá nhân hóa. Và các nhà bán lẻ thường xuyên tận dụng dữ liệu từ chatbot và trợ lý ảo, phối hợp với ML và xử lý ngôn ngữ tự nhiên (NLP), để tự động hóa trải nghiệm mua sắm của người dùng.

các loại máy học

Các thuật toán học máy được chia thành năm loại chính: học có giám sát, học không giám sát, học bán giám sát, học tự giám sát và học tăng cường.

1. Học máy có giám sát

Máy học có giám sát là một loại máy học trong đó mô hình được đào tạo trên tập dữ liệu được gắn nhãn (tức là đã biết biến mục tiêu hoặc kết quả). Ví dụ: nếu các nhà khoa học dữ liệu đang xây dựng mô hình dự báo lốc xoáy, các biến đầu vào có thể bao gồm ngày, vị trí, nhiệt độ, kiểu luồng gió, v.v. và đầu ra sẽ là hoạt động lốc xoáy thực tế được ghi lại trong những ngày đó.

Học có giám sát thường được sử dụng để đánh giá rủi ro, nhận dạng hình ảnh, phân tích tiên đoán và phát hiện gian lận, đồng thời bao gồm một số loại thuật toán.

  • Thuật toán hồi quy—dự đoán các giá trị đầu ra bằng cách xác định mối quan hệ tuyến tính giữa các giá trị thực hoặc liên tục (ví dụ: nhiệt độ, tiền lương). Các thuật toán hồi quy bao gồm hồi quy tuyến tính, rừng ngẫu nhiên và tăng cường độ dốc, cũng như các kiểu con khác.
  • Các thuật toán phân loại—dự đoán các biến đầu ra được phân loại (ví dụ: “rác” hoặc “không phải rác”) bằng cách dán nhãn các phần dữ liệu đầu vào. Các thuật toán phân loại bao gồm hồi quy logistic, k-láng giềng gần nhất và máy vectơ hỗ trợ (SVM), cùng với các thuật toán khác.
  • Bộ phân loại Naïve Bayes—kích hoạt các nhiệm vụ phân loại cho các tập dữ liệu lớn. Chúng cũng là một phần của nhóm thuật toán học tổng quát mô hình hóa phân phối đầu vào của một lớp hoặc/danh mục nhất định. Thuật toán Naïve Bayes bao gồm cây quyết định, thực sự có thể chứa cả thuật toán hồi quy và phân loại.
  • Mạng lưới thần kinh—mô phỏng cách thức hoạt động của bộ não con người, với số lượng lớn các nút xử lý được liên kết có thể hỗ trợ các quá trình như dịch ngôn ngữ tự nhiên, nhận dạng hình ảnh, nhận dạng giọng nói và tạo hình ảnh.
  • Thuật toán rừng ngẫu nhiên—dự đoán một giá trị hoặc danh mục bằng cách kết hợp các kết quả từ một số cây quyết định.

2. Học máy không giám sát

Học tập không giám sát các thuật toán—như Apriori, Mô hình hỗn hợp Gaussian (GMM) và phân tích thành phần chính (PCA)—rút ra các suy luận từ các bộ dữ liệu không được gắn nhãn, tạo điều kiện thuận lợi cho việc phân tích dữ liệu khám phá và cho phép nhận dạng mẫu và lập mô hình dự đoán.

Phương pháp học không giám sát phổ biến nhất là phân tích cụm, sử dụng thuật toán phân cụm để phân loại các điểm dữ liệu theo độ tương tự về giá trị (như trong phân khúc khách hàng hoặc phát hiện bất thường). Thuật toán liên kết cho phép các nhà khoa học dữ liệu xác định mối liên kết giữa các đối tượng dữ liệu bên trong cơ sở dữ liệu lớn, tạo điều kiện trực quan hóa dữ liệu và giảm kích thước.

  • K-có nghĩa là phân cụm—gán các điểm dữ liệu vào các nhóm K, trong đó các điểm dữ liệu gần nhất với một trọng tâm nhất định được nhóm lại trong cùng một danh mục và K đại diện cho các cụm dựa trên kích thước và mức độ chi tiết của chúng. Phân cụm K-means thường được sử dụng để phân đoạn thị trường, phân cụm tài liệu, phân đoạn hình ảnh và nén hình ảnh.
  • Phân cụm theo thứ bậc—mô tả một tập hợp các kỹ thuật phân cụm, bao gồm phân cụm kết tụ—trong đó các điểm dữ liệu ban đầu được tách thành các nhóm và sau đó được hợp nhất lặp đi lặp lại dựa trên sự giống nhau cho đến khi còn lại một cụm—và phân cụm phân chia—trong đó một cụm dữ liệu duy nhất được phân chia dựa trên sự khác biệt giữa các điểm dữ liệu .
  • Phân cụm xác suất—giúp giải quyết các vấn đề về ước tính mật độ hoặc phân cụm “mềm” bằng cách nhóm các điểm dữ liệu dựa trên khả năng chúng thuộc về một phân bố cụ thể.

Các mô hình ML không được giám sát thường đứng sau loại hệ thống đề xuất “khách hàng đã mua cái này cũng đã mua…”.

3. Học máy tự giám sát

Học tự giám sát (SSL) cho phép các mô hình tự đào tạo trên dữ liệu không được gắn nhãn, thay vì yêu cầu các tập dữ liệu lớn được chú thích và/hoặc được gắn nhãn. Các thuật toán SSL, còn được gọi là các thuật toán học dự đoán hoặc học theo văn bản, học một phần đầu vào từ một phần khác, tự động tạo nhãn và chuyển các vấn đề không được giám sát thành các vấn đề được giám sát. Các thuật toán này đặc biệt hữu ích cho các công việc như thị giác máy tính và NLP, nơi khối lượng dữ liệu đào tạo được gắn nhãn cần thiết để đào tạo mô hình có thể cực kỳ lớn (đôi khi rất lớn).

4. Học tập củng cố

Học tăng cường, Còn gọi là học tăng cường từ phản hồi của con người (RLHF), là một loại lập trình động đào tạo các thuật toán sử dụng hệ thống khen thưởng và trừng phạt. Để triển khai học tăng cường, một tác nhân thực hiện các hành động trong một môi trường cụ thể để đạt được mục tiêu đã xác định trước. Tác nhân được khen thưởng hoặc bị phạt vì hành động của mình dựa trên số liệu đã được thiết lập (thường là điểm), khuyến khích tác nhân tiếp tục thực hành tốt và loại bỏ những hành động xấu. Với sự lặp lại, đặc vụ sẽ học được các chiến lược tốt nhất.

Các thuật toán học tăng cường rất phổ biến trong phát triển trò chơi điện tử và thường được sử dụng để dạy robot cách tái tạo các nhiệm vụ của con người.

5. Học bán giám sát

Loại kỹ thuật học máy thứ năm cung cấp sự kết hợp giữa học có giám sát và không giám sát.

Các thuật toán học bán giám sát được huấn luyện trên một tập dữ liệu có nhãn nhỏ và một tập dữ liệu lớn không có nhãn, với dữ liệu có nhãn sẽ hướng dẫn quá trình học cho phần lớn dữ liệu không có nhãn. Mô hình học bán giám sát có thể sử dụng học không giám sát để xác định các cụm dữ liệu và sau đó sử dụng học có giám sát để gắn nhãn cho các cụm.

Mạng đối thủ sáng tạo (GAN)—học kĩ càng công cụ tạo ra dữ liệu không được gắn nhãn bằng cách đào tạo hai mạng thần kinh—là một ví dụ về học máy bán giám sát.

Bất kể loại nào, các mô hình ML đều có thể thu thập thông tin chuyên sâu về dữ liệu từ dữ liệu doanh nghiệp, nhưng tính dễ bị tổn thương trước sự thiên vị của con người/dữ liệu khiến việc thực hành AI có trách nhiệm trở thành một mệnh lệnh bắt buộc của tổ chức.

Quản lý một loạt mô hình học máy với watstonx.ai

Gần như tất cả mọi người, từ nhà phát triển, người dùng đến cơ quan quản lý, đều tham gia vào các ứng dụng học máy tại một số thời điểm, cho dù họ có tương tác trực tiếp với công nghệ AI hay không. Và việc áp dụng công nghệ ML chỉ đang tăng tốc. Các thị trường máy học toàn cầu được đánh giá cao ở mức 19 tỷ USD vào năm 2022 và dự kiến ​​sẽ đạt 188 tỷ USD vào năm 2030 (tốc độ CAGR trên 37%).

Quy mô áp dụng ML và tác động kinh doanh ngày càng tăng của nó khiến việc hiểu rõ các công nghệ AI và ML trở thành một cam kết liên tục và cực kỳ quan trọng, đòi hỏi phải có sự giám sát thận trọng và điều chỉnh kịp thời khi công nghệ phát triển. Với IBM® watsonx.ai™ AI studio, các nhà phát triển có thể quản lý các thuật toán và quy trình ML một cách dễ dàng.

IBM watsonx.ai—một phần của nền tảng dữ liệu và AI IBM watsonx™—kết hợp các khả năng AI tổng hợp mới và studio doanh nghiệp thế hệ tiếp theo để giúp các nhà xây dựng AI đào tạo, xác thực, điều chỉnh và triển khai các mô hình AI với một phần dữ liệu, trong một một phần nhỏ thời gian. Watsonx.ai cung cấp cho các nhóm các tính năng phân loại và tạo dữ liệu nâng cao giúp doanh nghiệp tận dụng thông tin chi tiết về dữ liệu để có hiệu suất AI trong thế giới thực tối ưu.

Trong thời đại bùng nổ dữ liệu, AI và học máy không thể thiếu trong hoạt động kinh doanh hàng ngày cũng như đối với đổi mới công nghệ và cạnh tranh kinh doanh. Nhưng với tư cách là những trụ cột mới của một xã hội hiện đại, chúng cũng đại diện cho cơ hội đa dạng hóa cơ sở hạ tầng CNTT của doanh nghiệp và tạo ra các công nghệ hoạt động vì lợi ích của doanh nghiệp và những người phụ thuộc vào chúng.

Khám phá studio AI của watsonx.ai


Xem thêm từ Trí tuệ nhân tạo




Các tổ chức chiến thắng xu hướng dịch vụ khách hàng cần tuân theo

4 phút đọcViệc chú ý đến các xu hướng dịch vụ khách hàng mới nhất đảm bảo rằng tổ chức sẵn sàng đáp ứng những mong đợi luôn thay đổi của khách hàng. Lòng trung thành của khách hàng đang suy giảm do đại dịch COVID-19, ảnh hưởng xã hội và sự dễ dàng chuyển đổi thương hiệu. Hơn bao giờ hết, các tổ chức phải luôn cập nhật những thay đổi trong trải nghiệm dịch vụ khách hàng để cải thiện sự hài lòng của khách hàng và đáp ứng nhu cầu ngày càng tăng của khách hàng. Một nghiên cứu của Gartner năm 2023 cho thấy 58% các nhà lãnh đạo xác định tăng trưởng kinh doanh là một trong những mục tiêu quan trọng nhất của họ.…




Năm công cụ AI nguồn mở cần biết

5 phút đọcTrí tuệ nhân tạo nguồn mở (AI) đề cập đến các công nghệ AI trong đó mã nguồn được cung cấp miễn phí cho bất kỳ ai sử dụng, sửa đổi và phân phối. Khi các thuật toán AI, các mô hình được đào tạo trước và bộ dữ liệu có sẵn để sử dụng và thử nghiệm công khai, các ứng dụng AI sáng tạo sẽ xuất hiện như một cộng đồng những người đam mê tình nguyện được xây dựng dựa trên công việc hiện có và đẩy nhanh quá trình phát triển các giải pháp AI thực tế. Do đó, những công nghệ này thường mang lại những công cụ tốt nhất để xử lý những thách thức phức tạp trong nhiều trường hợp sử dụng của doanh nghiệp.…




IBM Tech Now: Ngày 11 tháng 2023 năm XNUMX

<1 phút đọc​Chào mừng IBM Tech Now, loạt web video của chúng tôi giới thiệu những tin tức và thông báo mới nhất và hay nhất trong thế giới công nghệ. Đảm bảo bạn đăng ký kênh YouTube của chúng tôi để được thông báo mỗi khi video IBM Tech Now mới được xuất bản. IBM Tech Now: Tập 90 Trong tập này, chúng tôi đề cập đến các chủ đề sau: IBM Quantum Heron Hệ thống lượng tử IBM Hai GA của watsonx.governance Luôn theo dõi Bạn có thể xem Thông báo trên Blog của IBM để biết đầy đủ…




Phương tiện được xác định bằng phần mềm: Kiến trúc đằng sau sự phát triển tiếp theo của ngành ô tô

4 phút đọcNgày càng có nhiều người tiêu dùng mong đợi phương tiện của họ mang lại trải nghiệm không khác gì trải nghiệm được cung cấp bởi các thiết bị thông minh khác. Họ tìm kiếm sự tích hợp hoàn toàn vào cuộc sống số của mình, mong muốn một phương tiện có thể quản lý hoạt động của họ, bổ sung chức năng và kích hoạt các tính năng mới chủ yếu hoặc hoàn toàn thông qua phần mềm. Theo báo cáo của GMI, thị trường phương tiện được xác định bằng phần mềm (SDV) toàn cầu dự kiến ​​sẽ đạt tốc độ CAGR là 22.1% từ năm 2023 đến năm 2032. Sự tăng trưởng này được thúc đẩy bởi nhu cầu ngày càng tăng đối với…

Bản tin IBM

Nhận các bản tin và cập nhật chủ đề của chúng tôi nhằm cung cấp thông tin chi tiết và lãnh đạo tư tưởng mới nhất về các xu hướng mới nổi.

Theo dõi ngay

Các bản tin khác

tại chỗ_img

Tin tức mới nhất

tại chỗ_img