Logo Zephyrnet

Giới thiệu về Mô hình Mạng Neural, Bảng chú giải thuật ngữ và Truyền bá ngược

Ngày:

Bài báo này đã được xuất bản như một phần của Blogathon Khoa học Dữ liệu.

Giới thiệu

Nếu bạn là một nhà phát triển phần mềm quan tâm đến việc tìm hiểu cách mạng nơ-ron hoạt động, bạn đã đến một điểm hoàn hảo. Chúng tôi sẽ hỗ trợ người mới hiểu mạng nơ-ron là gì, mô hình mạng nơ-ron là gì và cách mở rộng kiến ​​thức của họ sang các lĩnh vực khác của chủ đề trong hướng dẫn này.

Mục lục

  1. Mạng thần kinh là gì?
  2. Mô hình mạng nơ ron nhân tạo là gì?
  3. Bảng chú giải thuật ngữ mô hình mạng nơ ron nhân tạo
  4. Backpropagation trong mô hình mạng thần kinh là gì?
  5. Tại sao sự lan truyền ngược lại cần thiết trong mạng nơ-ron?
  6. Kết luận

Mạng thần kinh là gì?

Trước khi chúng ta tìm hiểu về biệt ngữ tính toán, điều quan trọng là phải nắm được vai trò của mạng nơ-ron trong cuộc sống hàng ngày của chúng ta.

Thuật ngữ "nơ-ron" bắt nguồn từ thuật ngữ "nơ-ron", dùng để chỉ một tế bào thần kinh đơn lẻ. Đúng vậy - mạng nơ-ron chỉ đơn giản là một tập hợp các nơ-ron thực hiện các nhiệm vụ thường ngày trong cuộc sống hàng ngày của chúng ta.

Nhận dạng khuôn mẫu, nhận dạng đối tượng và trí thông minh đều đóng một vai trò quan trọng trong việc giải quyết những khó khăn mà chúng ta phải đối mặt hàng ngày. Mặc dù những phản xạ này được thực hiện dễ dàng đến mức chúng ta không thể nhận biết được, nhưng thực tế là chúng rất khó để tự động hóa.

  • Trẻ em ghi nhớ sự xuất hiện của một quả táo

  • Một con vật nhận ra mẹ hoặc chủ của nó

  • Nhận biết nhiệt độ của một vật thể

Những tính toán phức tạp này được thực hiện bởi mạng nơ-ron của chúng tôi.

Con người hiện đã phát triển một hệ thống máy tính có khả năng hoạt động theo cách tương tự như hệ thống thần kinh của chúng ta. Chúng được gọi là mạng nơ-ron nhân tạo (ANN).

Mặc dù lần đầu tiên chúng tôi sử dụng ANN để xử lý các tác vụ đơn giản, sự gia tăng sức mạnh tính toán đã cho phép chúng tôi phát triển một kiến ​​trúc mạng thần kinh khá mạnh mẽ có khả năng giải quyết các vấn đề phức tạp hơn.

Trong phần sau, chúng ta sẽ đi tìm hiểu chi tiết hơn về ANN.

Mô hình mạng nơ ron nhân tạo là gì?

Mạng nơ-ron nhân tạo, hay ANN, là một mạng nơ-ron đa lớp, được kết nối đầy đủ bao gồm lớp đầu vào, lớp ẩn và lớp đầu ra.

ANN được nhìn thấy trong hình dưới đây.

Nếu bạn quan sát kỹ hơn, bạn sẽ phát hiện ra rằng mỗi nút trong một lớp được kết nối với mọi nút trong lớp trên và dưới nó.

Mạng lưới phát triển sâu hơn khi số lượng cấp độ ẩn tăng lên.

Xem xét sự xuất hiện của một nút riêng lẻ trong đầu ra hoặc lớp ẩn.

Như bạn có thể thấy, nút nhận được một số lượng lớn các đầu vào. Nó cộng tất cả các trọng số lại với nhau và xuất ra tổng thông qua một hàm kích hoạt phi tuyến tính.

Đầu ra của nút này trở thành đầu vào của nút trong lớp tiếp theo.

Điều quan trọng cần ghi nhớ là tín hiệu sẽ luôn chuyển từ trái sang phải. Kết quả cuối cùng sẽ được cung cấp khi tất cả các nút đã tuân theo giao thức.

Đây là cách phương trình của nút xuất hiện

Trong phương trình trên, b biểu thị độ lệch. Nó đóng vai trò là đầu vào cho tất cả các nút và luôn được đặt thành 1.

Độ lệch cho phép chuyển kết quả của chức năng kích hoạt sang trái hoặc phải.

Đọc thêm về Mạng thần kinh nhân tạo tại đây.

Bảng chú giải thuật ngữ mô hình mạng nơ ron nhân tạo

Chúng ta hãy xem xét một số từ cơ bản mà bạn nên làm quen khi nói đến mô hình mạng nơ-ron nhân tạo.

Dữ liệu ban đầu được cung cấp vào mạng nơ-ron từ một nguồn được coi là đầu vào. Mục đích của nó là cung cấp dữ liệu cho mạng để nó đưa ra phán đoán hoặc dự đoán về thông tin mà nó nhận được. Trong hầu hết các trường hợp, mô hình mạng nơ-ron nhận các đầu vào có giá trị thực nên được cung cấp cho một nơ-ron trong lớp đầu vào.

Tập huấn luyện

Tập huấn luyện là đầu vào mà bạn đã biết đầu ra phù hợp. Chúng được sử dụng để hỗ trợ đào tạo mạng nơ-ron và bộ nhớ cho bộ đầu vào nhất định.

Tùy thuộc vào đầu vào mà nó nhận được, mỗi mạng nơ-ron tạo ra một dự đoán hoặc một phán đoán. Một tập hợp các số nguyên hoặc một phán đoán Boolean có thể được sử dụng để biểu diễn kết quả đầu ra này. Một nơ-ron duy nhất trong lớp đầu ra chịu trách nhiệm tạo ra giá trị đầu ra.

Một nơ-ron, cách khác được gọi là nơ-ron, là đơn vị cơ bản của mạng nơ-ron. Nó nhận một giá trị đầu vào và xuất ra một giá trị tùy thuộc vào giá trị đó.

Như đã nói trước đó, mỗi nơ-ron nhận một phần đầu vào và truyền nó đến nút của lớp tiếp theo thông qua chức năng kích hoạt phi tuyến tính. Các chức năng kích hoạt TanH, sigmoid hoặc ReLu đều có thể thực hiện được. Bản chất phi tuyến tính của các hàm này hỗ trợ trong việc đào tạo mạng.

Không gian trọng lượng

Mỗi nơ-ron có một trọng số số duy nhất. Khi nó truyền dữ liệu đến một nút khác, trọng lượng của nó được thêm vào trọng lượng của các nốt khác để tạo thành một đầu ra. Việc đào tạo mạng nơ-ron được thực hiện bằng cách thực hiện các điều chỉnh nhỏ đối với các trọng số này. Tinh chỉnh trọng lượng hỗ trợ xác định bộ trọng lượng và độ lệch tối ưu. Đây là lúc mà khái niệm lan truyền ngược phát huy tác dụng.

Backpropagation trong mô hình mạng thần kinh là gì?

Nhân giống ngược là một trong những phương pháp để xác định hiệu quả các sửa đổi khiêm tốn cần thực hiện đối với trọng số để giảm tổn thất mạng.

Ban đầu, các kích hoạt nên được truyền lên trên hoặc theo kiểu truyền dần.

Bây giờ, các đạo hàm của hàm chi phí phải được truyền xuống hoặc theo một cách khác.

Với phương pháp này, bạn có thể tính toán đạo hàm chi phí riêng cho từng trọng số. Sau đó, bạn có thể tính toán khoản tiết kiệm chi phí liên quan đến các sửa đổi.

Tại sao Backpropagation lại cần thiết trong mạng nơ-ron?

Lỗi được lan truyền ngược lại trong các mạng nơ-ron nhân tạo thông qua quá trình lan truyền ngược. Để đào tạo mạng nơ-ron nhân tạo theo kiểu lặp lại, phương pháp này được chuẩn hóa. Trọng số của mạng nơ-ron được tinh chỉnh thông qua việc nhân giống ngược, giúp giảm lỗi và cải thiện độ chính xác và độ tin cậy của hệ thống. Sử dụng phương pháp này là một điều thuận lợi để thực hiện. Bạn không cần biết bất cứ điều gì về mạng thần kinh để sử dụng chiến lược này. Nó không làm gì khác hơn là tinh chỉnh các số liệu đã được hệ thống đưa ra và không yêu cầu cấu hình thêm.

Kết luận

Do đó, nhiều nhà phát triển phần mềm không ủng hộ mô hình mạng nơ-ron vì họ cảm thấy nó không hiệu quả, đặc biệt là khi xem xét thực tế là cần thực hiện nhiều vòng để tìm ra giải pháp hiệu quả nhất về chi phí.

Có một số kỹ thuật hiện đại yêu cầu ít điều chỉnh hơn đáng kể để tạo ra một mô hình chính xác so với các phương pháp trước đây, chẳng hạn như mạng con nhộng của Hinton và mạng nơ-ron dạng con nhộng. Do đó, mạng nơ-ron có thể sẽ có một tương lai lâu dài và thịnh vượng.

Tôi rất vui vì bạn thấy nó thú vị. Để liên hệ với tôi, bạn có thể thực hiện việc này bằng các phương pháp sau:

LinkedIn

Nếu bạn vẫn còn thắc mắc, hãy gửi chúng cho tôi bằng cách e-mail.

Phương tiện hiển thị trong bài viết này không thuộc sở hữu của Analytics Vidhya và được sử dụng theo quyết định riêng của Tác giả. 

Nguồn: https://www.analyticsvidhya.com/blog/2022/01/introduction-to-the-neural-network-model-glossary-and-backpropagation/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?