Logo Zephyrnet

Quay lại vấn đề cơ bản Tuần 4: Chủ đề nâng cao và triển khai – KDnuggets

Ngày:

Quay lại vấn đề cơ bản Tuần 4: Chủ đề nâng cao và triển khai
Hình ảnh của Tác giả
 

Hãy tham gia KDnuggets với lộ trình Quay lại Cơ bản của chúng tôi để giúp bạn bắt đầu với một nghề nghiệp mới hoặc trau dồi kỹ năng khoa học dữ liệu của mình. Lộ trình Quay lại Cơ bản được chia thành 4 tuần kèm theo một tuần thưởng. Chúng tôi hy vọng bạn có thể sử dụng những blog này làm hướng dẫn khóa học. 

Nếu bạn chưa có, hãy xem:

Bước sang tuần thứ ba, chúng ta sẽ đi sâu vào các chủ đề và cách triển khai nâng cao.

  • Ngày 1: Khám phá mạng lưới thần kinh
  • Ngày 2: Giới thiệu về Thư viện Deep Learning: PyTorch và Lightening AI
  • Ngày 3: Bắt đầu với PyTorch trong 5 bước
  • Ngày 4: Xây dựng Mạng lưới thần kinh chuyển đổi với PyTorch
  • Ngày 5: Giới thiệu về Xử lý ngôn ngữ tự nhiên
  • Ngày 6: Triển khai mô hình học máy đầu tiên của bạn
  • Ngày 7: Giới thiệu về Điện toán đám mây cho Khoa học Dữ liệu

Tuần 4 – Phần 1: Khám phá mạng lưới thần kinh

Giải phóng sức mạnh của AI: hướng dẫn về mạng lưới thần kinh và các ứng dụng của chúng.

Hãy tưởng tượng một cỗ máy suy nghĩ, học hỏi và thích nghi giống như bộ não con người và khám phá các mẫu ẩn trong dữ liệu.

Công nghệ này, Mạng thần kinh (NN), các thuật toán đang bắt chước nhận thức. Chúng ta sẽ khám phá NN là gì và chúng hoạt động như thế nào sau.

Trong bài viết này, tôi sẽ giải thích cho bạn các khía cạnh cơ bản của Mạng thần kinh (NN) - cấu trúc, loại, ứng dụng thực tế và các thuật ngữ chính xác định hoạt động.

Tuần 4 – Phần 2: Giới thiệu về Thư viện Deep Learning: PyTorch và Lightning AI

Giải thích đơn giản về PyTorch và Lightning AI.

Học sâu là một nhánh của mô hình học máy dựa trên mạng thần kinh. Ở các mẫu máy khác, việc xử lý dữ liệu để tìm ra các tính năng có ý nghĩa thường được thực hiện thủ công hoặc dựa vào chuyên môn về miền; tuy nhiên, deep learning có thể bắt chước bộ não con người để khám phá các tính năng cần thiết, tăng hiệu suất của mô hình. 

Có nhiều ứng dụng cho mô hình học sâu, bao gồm nhận dạng khuôn mặt, phát hiện gian lận, chuyển giọng nói thành văn bản, tạo văn bản, v.v. Học sâu đã trở thành một cách tiếp cận tiêu chuẩn trong nhiều ứng dụng học máy tiên tiến và chúng ta không mất gì khi tìm hiểu về chúng.

Để phát triển mô hình học sâu này, chúng ta có thể dựa vào nhiều khung thư viện khác nhau thay vì làm việc từ đầu. Trong bài viết này, chúng ta sẽ thảo luận về hai thư viện khác nhau mà chúng ta có thể sử dụng để phát triển các mô hình deep learning: PyTorch và Lighting AI.

Tuần 4 – Phần 3: Bắt đầu với PyTorch trong 5 bước

Hướng dẫn này cung cấp phần giới thiệu chuyên sâu về học máy bằng cách sử dụng PyTorch và trình bao bọc cấp cao của nó, PyTorch Lightning. Bài viết bao gồm các bước thiết yếu từ cài đặt đến các chủ đề nâng cao, cung cấp cách tiếp cận thực tế để xây dựng và đào tạo mạng lưới thần kinh, đồng thời nhấn mạnh lợi ích của việc sử dụng Lightning.

Kim tự tháp là một khung máy học nguồn mở phổ biến dựa trên Python và được tối ưu hóa cho tính toán tăng tốc GPU. Được phát triển lần đầu bởi Meta AI vào năm 2016 và hiện là một phần của Linux Foundation, PyTorch đã nhanh chóng trở thành một trong những framework được sử dụng rộng rãi nhất cho các ứng dụng và nghiên cứu deep learning.

Tia chớp PyTorch là một trình bao bọc nhẹ được xây dựng dựa trên PyTorch giúp đơn giản hóa hơn nữa quy trình làm việc của nhà nghiên cứu và phát triển mô hình. Với Lightning, các nhà khoa học dữ liệu có thể tập trung nhiều hơn vào việc thiết kế các mô hình thay vì mã soạn sẵn. 

Tuần 4 – Phần 4: Xây dựng mạng lưới thần kinh chuyển đổi với PyTorch

Bài đăng trên blog này cung cấp hướng dẫn về cách xây dựng mạng lưới thần kinh tích chập để phân loại hình ảnh trong PyTorch, tận dụng các lớp tích chập và gộp để trích xuất tính năng cũng như các lớp được kết nối đầy đủ để dự đoán.

Mạng thần kinh chuyển đổi (CNN hoặc ConvNet) là một thuật toán học sâu được thiết kế đặc biệt cho các nhiệm vụ trong đó nhận dạng đối tượng là rất quan trọng – như phân loại, phát hiện và phân đoạn hình ảnh. CNN có thể đạt được độ chính xác tiên tiến nhất trong các nhiệm vụ tầm nhìn phức tạp, cung cấp năng lượng cho nhiều ứng dụng thực tế như hệ thống giám sát, quản lý kho hàng, v.v.

Là con người, chúng ta có thể dễ dàng nhận ra các vật thể trong hình ảnh bằng cách phân tích các mẫu, hình dạng và màu sắc. CNN cũng có thể được đào tạo để thực hiện việc nhận dạng này bằng cách tìm hiểu những mẫu nào là quan trọng để phân biệt. Ví dụ: khi cố gắng phân biệt giữa ảnh Mèo và Chó, não của chúng ta tập trung vào hình dạng, kết cấu và đặc điểm khuôn mặt độc đáo. CNN học cách tiếp thu những đặc điểm phân biệt tương tự này. Ngay cả đối với các tác vụ phân loại rất chi tiết, CNN vẫn có thể tìm hiểu các cách biểu diễn tính năng phức tạp trực tiếp từ pixel.

Tuần 4 – Phần 5: Giới thiệu về xử lý ngôn ngữ tự nhiên

Tổng quan về Xử lý ngôn ngữ tự nhiên (NLP) và các ứng dụng của nó.

Chúng tôi đang tìm hiểu rất nhiều về ChatGPT và các mô hình ngôn ngữ lớn (LLM). Xử lý ngôn ngữ tự nhiên là một chủ đề thú vị, một chủ đề hiện đang làm mưa làm gió trong thế giới công nghệ và AI. Đúng, các LLM như ChatGPT đã giúp họ phát triển, nhưng sẽ không tốt nếu hiểu được tất cả những điều đó đến từ đâu? Vì vậy, hãy quay lại những điều cơ bản – NLP.

NLP là một trường con của trí tuệ nhân tạo và đó là khả năng máy tính phát hiện và hiểu ngôn ngữ của con người, thông qua lời nói và văn bản theo cách mà con người chúng ta có thể làm được. NLP giúp các mô hình xử lý, hiểu và xuất ra ngôn ngữ của con người.

Mục tiêu của NLP là thu hẹp khoảng cách giao tiếp giữa con người và máy tính. Các mô hình NLP thường được đào tạo về các nhiệm vụ như dự đoán từ tiếp theo, cho phép chúng xây dựng các phụ thuộc theo ngữ cảnh và sau đó có thể tạo ra các đầu ra có liên quan. 

Tuần 4 – Phần 6: Triển khai mô hình học máy đầu tiên của bạn

Chỉ với 3 bước đơn giản, bạn có thể xây dựng và triển khai mô hình phân loại kính nhanh hơn bạn có thể nói…mô hình phân loại kính!

Trong hướng dẫn này, chúng ta sẽ tìm hiểu cách xây dựng một mô hình đa phân loại đơn giản bằng cách sử dụng Phân loại kính tập dữ liệu. Mục tiêu của chúng tôi là phát triển và triển khai một ứng dụng web có thể dự đoán nhiều loại kính khác nhau, chẳng hạn như: 

  1. Xây dựng Windows Float đã được xử lý
  2. Xây dựng Windows không được xử lý nổi
  3. Xe Windows Float đã được xử lý
  4. Xe Windows Không được xử lý nổi (thiếu trong tập dữ liệu)
  5. Container
  6. Đồ dùng trên bàn
  7. đèn pha gắn đầu

Ngoài ra chúng ta sẽ tìm hiểu về:

  • Skops: Chia sẻ các mô hình dựa trên scikit-learn của bạn và đưa chúng vào sản xuất.
  • Gradio: Khung ứng dụng web ML.
  • HuggingFace Spaces: mô hình học máy miễn phí và nền tảng lưu trữ ứng dụng. 

Khi kết thúc hướng dẫn này, bạn sẽ có kinh nghiệm thực hành về xây dựng, đào tạo và triển khai mô hình học máy cơ bản dưới dạng ứng dụng web.

Tuần 4 – Phần 7: Giới thiệu về Điện toán đám mây cho khoa học dữ liệu

Và Bộ đôi sức mạnh của công nghệ hiện đại.

Trong thế giới ngày nay, hai lực lượng chính đã nổi lên với tư cách là những người thay đổi cuộc chơi: Khoa học dữ liệu và Điện toán đám mây. 

Hãy tưởng tượng một thế giới nơi lượng dữ liệu khổng lồ được tạo ra mỗi giây. Chà… bạn không cần phải tưởng tượng… Đó là thế giới của chúng ta!

Từ tương tác trên mạng xã hội đến giao dịch tài chính, từ hồ sơ chăm sóc sức khỏe đến ưu tiên thương mại điện tử, dữ liệu có ở khắp mọi nơi. 

Nhưng dữ liệu này có ích lợi gì nếu chúng ta không nhận được giá trị? Đó chính xác là những gì Khoa học dữ liệu làm. 

Và chúng ta lưu trữ, xử lý và phân tích dữ liệu này ở đâu? Đó là nơi Điện toán đám mây tỏa sáng. 

Hãy bắt tay vào cuộc hành trình tìm hiểu mối quan hệ đan xen giữa hai tuyệt tác công nghệ này. Hãy (cố gắng) cùng nhau khám phá nhé! 

Chúc mừng bạn đã hoàn thành tuần 4!!

Nhóm tại KDnuggets hy vọng rằng lộ trình Quay lại vấn đề cơ bản đã cung cấp cho độc giả một cách tiếp cận toàn diện và có cấu trúc để nắm vững các nguyên tắc cơ bản của khoa học dữ liệu. 

Tuần thưởng sẽ được đăng vào thứ Hai tuần sau - hãy chú ý theo dõi!
 
 

Nisha Arya là Nhà khoa học dữ liệu và Nhà văn kỹ thuật tự do. Cô ấy đặc biệt quan tâm đến việc cung cấp lời khuyên hoặc hướng dẫn nghề nghiệp về Khoa học Dữ liệu và kiến ​​thức dựa trên lý thuyết về Khoa học Dữ liệu. Cô cũng mong muốn khám phá những cách khác nhau mà Trí tuệ nhân tạo có thể mang lại / có thể mang lại lợi ích cho sự trường tồn của cuộc sống con người. Một người ham học hỏi, tìm cách mở rộng kiến ​​thức công nghệ và kỹ năng viết của mình, đồng thời giúp hướng dẫn người khác.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img