Logo Zephyrnet

nhúng vector là gì? | Định nghĩa từ TechTarget

Ngày:

nhúng vector là gì?

Việc nhúng vectơ là các biểu diễn số thể hiện mối quan hệ và ý nghĩa của các từ, cụm từ và các loại dữ liệu khác. Thông qua việc nhúng vectơ, các đặc điểm hoặc tính năng thiết yếu của một đối tượng được chuyển thành một dãy số ngắn gọn và có tổ chức, giúp máy tính truy xuất thông tin nhanh chóng. Các điểm dữ liệu tương tự được nhóm lại gần nhau hơn sau khi được dịch thành các điểm trong không gian đa chiều.

Được sử dụng trong nhiều ứng dụng, đặc biệt là trong xử lý ngôn ngữ tự nhiên (NLP) và học máy (ML), việc nhúng vectơ giúp thao tác và xử lý dữ liệu cho các tác vụ như so sánh độ tương tự, phân cụm và phân loại. Ví dụ: khi xem dữ liệu văn bản, các từ như làm sao mèo con truyền đạt ý nghĩa tương tự mặc dù có sự khác biệt trong thành phần chữ cái của chúng. Tìm kiếm ngữ nghĩa hiệu quả dựa vào các biểu diễn chính xác để nắm bắt đầy đủ sự tương đồng về ngữ nghĩa giữa các thuật ngữ.

[Nhúng nội dung]

Các phần nhúng và vectơ có giống nhau không?

Các điều khoản vectơnhúng có thể được sử dụng thay thế cho nhau trong bối cảnh nhúng vectơ. Cả hai đều đề cập đến các biểu diễn dữ liệu số trong đó mỗi điểm dữ liệu được biểu diễn dưới dạng vectơ trong không gian nhiều chiều.

Vector đề cập đến một mảng số có thứ nguyên xác định, trong khi việc nhúng vectơ sử dụng các vectơ này để biểu thị các điểm dữ liệu trong một không gian liên tục.

Bài viết này là một phần của

Việc nhúng đề cập đến việc biểu thị dữ liệu dưới dạng vectơ để nắm bắt thông tin quan trọng, liên kết ngữ nghĩa, đặc tính ngữ cảnh hoặc biểu diễn có tổ chức của dữ liệu đã học thông qua thuật toán đào tạo hoặc mô hình học máy.

Các loại nhúng vector

Các phần nhúng vectơ có nhiều dạng khác nhau, mỗi dạng có một chức năng riêng biệt để thể hiện các loại dữ liệu khác nhau. Sau đây là một số kiểu nhúng vector phổ biến:

  • nhúng từ. Việc nhúng từ là biểu diễn vector của các từ riêng lẻ trong một không gian liên tục. Chúng thường được sử dụng để nắm bắt các liên kết ngữ nghĩa giữa các từ trong các nhiệm vụ như Phân tích tâm lý, dịch ngôn ngữ và từ giống nhau.
  • Các câu nhúng. Biểu diễn vectơ của các câu hoàn chỉnh được gọi là nhúng câu. Chúng hữu ích cho các nhiệm vụ bao gồm phân tích cảm xúc, phân loại văn bản và truy xuất thông tin vì chúng nắm bắt được ý nghĩa và ngữ cảnh của câu.
  • Nhúng tài liệu. Nhúng tài liệu là biểu diễn dạng vector của toàn bộ tài liệu, chẳng hạn như bài viết hoặc báo cáo. Thường được sử dụng trong các tác vụ như tính tương tự của tài liệu, hệ thống phân cụm và đề xuất, chúng nắm bắt được ý nghĩa và nội dung chung của tài liệu.
  • Các vectơ hồ sơ người dùng. Đây là các biểu diễn dạng vector về sở thích, hành động hoặc đặc điểm của người dùng. Chúng được sử dụng trong phân khúc khách hàng, hệ thống đề xuất được cá nhân hóa và quảng cáo được nhắm mục tiêu để thu thập dữ liệu cụ thể của người dùng.
  • Vectơ hình ảnh. Đây là các biểu diễn vector của các mục trực quan, chẳng hạn như hình ảnh hoặc khung video. Chúng được sử dụng trong các nhiệm vụ như Nhận dạng đối tượng, hệ thống tìm kiếm hình ảnh và đề xuất dựa trên nội dung để nắm bắt các đặc điểm trực quan.
  • Các vectơ sản phẩm Biểu thị các sản phẩm hoặc mặt hàng dưới dạng vectơ, chúng được sử dụng trong tìm kiếm sản phẩm, hệ thống phân loại và đề xuất sản phẩm để thu thập các tính năng và điểm tương đồng giữa các sản phẩm.
  • Các vectơ hồ sơ người dùng. Các vectơ hồ sơ người dùng thể hiện sở thích, hành động hoặc đặc điểm của người dùng. Chúng được sử dụng trong phân khúc người dùng, hệ thống đề xuất được cá nhân hóa và quảng cáo mục tiêu để thu thập dữ liệu cụ thể của người dùng.

Việc nhúng vector được tạo ra như thế nào?

Việc nhúng vectơ được tạo bằng cách sử dụng phương pháp ML để huấn luyện mô hình để biến dữ liệu thành vectơ số. Thông thường, một độ sâu mạng lưới thần kinh tích chập được sử dụng để huấn luyện các loại mô hình này. Các phần nhúng thu được thường dày đặc — tất cả các giá trị đều khác 2,000 — và có nhiều chiều — lên tới 2 thứ nguyên. Các mô hình phổ biến như WordXNUMXVec, GLoVE và Chứng nhận chuyển đổi các từ, cụm từ hoặc đoạn văn thành các vectơ nhúng cho dữ liệu văn bản.

Các bước sau đây thường được tham gia vào quá trình này:

  1. Tập hợp một tập dữ liệu lớn. Một tập dữ liệu ghi lại danh mục dữ liệu cụ thể mà mục đích nhúng sẽ được tập hợp - cho dù nó liên quan đến văn bản hay hình ảnh - được tập hợp.
  2. Xử lý trước dữ liệu. Tùy thuộc vào loại dữ liệu, việc làm sạch, chuẩn bị và tiền xử lý dữ liệu liên quan đến việc loại bỏ nhiễu, thay đổi kích thước ảnh, chuẩn hóa văn bản và thực hiện các thao tác bổ sung.
  3. Huấn luyện người mẫu. Để xác định các liên kết và mẫu trong dữ liệu, mô hình được đào tạo bằng cách sử dụng tập dữ liệu. Để giảm sự chênh lệch giữa vectơ mục tiêu và vectơ dự đoán, các tham số của mô hình được huấn luyện trước sẽ được thay đổi trong giai đoạn huấn luyện.
  4. Tạo các nhúng vector. Sau khi đào tạo, mô hình có thể chuyển đổi dữ liệu mới thành vectơ số, trình bày cách biểu diễn có ý nghĩa và có cấu trúc giúp gói gọn thông tin ngữ nghĩa của dữ liệu gốc một cách hiệu quả.

Việc nhúng vectơ có thể được thực hiện cho nhiều loại dữ liệu, bao gồm dữ liệu chuỗi thời gian, văn bản, hình ảnh, âm thanh, mô hình ba chiều (3D) và video. Do cách hình thành các phần nhúng, các đối tượng có ngữ nghĩa tương tự sẽ có các vectơ trong không gian vectơ gần nhau.

Các phần nhúng vector được lưu trữ ở đâu?

Các vectơ nhúng được lưu trữ bên trong cơ sở dữ liệu chuyên biệt được gọi là cơ sở dữ liệu vector. Các cơ sở dữ liệu này là các biểu diễn toán học chiều cao của các tính năng dữ liệu. Không giống như cơ sở dữ liệu dựa trên vô hướng tiêu chuẩn hoặc chỉ mục vectơ độc lập, cơ sở dữ liệu vectơ mang lại hiệu quả cụ thể cho việc lưu trữ và truy xuất các phần nhúng vectơ ở quy mô lớn. Chúng cung cấp khả năng lưu trữ và truy xuất lượng dữ liệu khổng lồ một cách hiệu quả cho các chức năng tìm kiếm vectơ.

Cơ sở dữ liệu vectơ bao gồm một số thành phần chính, bao gồm hiệu suất và khả năng chịu lỗi. Để đảm bảo rằng cơ sở dữ liệu vectơ có khả năng chịu lỗi, sao chép và sharding kỹ thuật được sử dụng. Sao chép là quá trình tạo ra các bản sao dữ liệu trên nhiều nút, trong khi phân mảnh là quá trình phân vùng dữ liệu trên một số nút. Điều này cung cấp khả năng chịu lỗi và hiệu suất không bị gián đoạn ngay cả khi một nút bị lỗi.

Cơ sở dữ liệu vectơ có hiệu quả trong học máy và trí tuệ nhân tạo (AI) các ứng dụng, vì chúng chuyên quản lý Dữ liệu phi cấu trúc và bán cấu trúc.

Các ứng dụng của nhúng vector

Có một số cách sử dụng việc nhúng vectơ trong các ngành khác nhau. Các ứng dụng phổ biến của việc nhúng vector bao gồm:

  • Các hệ thống khuyến nghị Việc nhúng vectơ đóng một vai trò quan trọng trong hệ thống đề xuất của những gã khổng lồ trong ngành, bao gồm Netflix và Amazon. Các phần nhúng này cho phép các tổ chức tính toán sự tương đồng giữa người dùng và mặt hàng, chuyển các tùy chọn của người dùng và tính năng của mặt hàng thành vectơ. Quá trình này hỗ trợ việc đưa ra các đề xuất được cá nhân hóa phù hợp với sở thích của từng người dùng.
  • Các công cụ tìm kiếm. Công cụ tìm kiếm sử dụng rộng rãi việc nhúng vectơ để nâng cao hiệu quả và hiệu quả của việc truy xuất thông tin. Vì việc nhúng vectơ vượt xa việc kết hợp từ khóa nên chúng giúp các công cụ tìm kiếm giải thích ý nghĩa của từ và câu. Ngay cả khi các cụm từ chính xác không khớp, các công cụ tìm kiếm vẫn có thể tìm và truy xuất tài liệu hoặc thông tin khác có liên quan đến ngữ cảnh bằng cách mô hình hóa các từ dưới dạng vectơ trong không gian ngữ nghĩa.
  • Chatbots và hệ thống trả lời câu hỏi. Hỗ trợ nhúng vector chatbot và hệ thống trả lời câu hỏi dựa trên AI tổng quát trong sự hiểu biết và tạo ra những phản ứng giống con người. Bằng cách nắm bắt bối cảnh và ý nghĩa của văn bản, phần nhúng giúp chatbot trả lời các câu hỏi của người dùng một cách có ý nghĩa và hợp lý. Ví dụ: mô hình ngôn ngữ và chatbot AI, bao gồm GPT-4 và bộ xử lý hình ảnh như Dall-E2, đã trở nên phổ biến rộng rãi trong việc tạo ra các cuộc trò chuyện và phản hồi giống con người.
  • Phát hiện gian lận và phát hiện ngoại lệ. Việc nhúng vectơ có thể được sử dụng để phát hiện các điểm bất thường hoặc hoạt động gian lận bằng cách đánh giá sự giống nhau giữa các vectơ. Các mẫu không phổ biến được xác định bằng cách đánh giá khoảng cách giữa các điểm nhúng và xác định chính xác ngoại lệ.
  • Tiền xử lý dữ liệu. Để biên đổi dữ liệu chưa được xử lý thành định dạng phù hợp với ML và các mô hình học sâu, phần nhúng được sử dụng trong các hoạt động tiền xử lý dữ liệu. Ví dụ: nhúng từ được sử dụng để thể hiện các từ dưới dạng vectơ, tạo điều kiện thuận lợi cho việc xử lý và phân tích dữ liệu văn bản.
  • Học một lần và không học. Học một lần và không học một lần là các phương pháp nhúng vectơ giúp các mô hình học máy dự đoán kết quả cho các lớp mới, ngay cả khi được cung cấp dữ liệu được gắn nhãn hạn chế. Các mô hình có thể khái quát hóa và tạo ra các dự đoán ngay cả với một số lượng nhỏ các trường hợp đào tạo bằng cách sử dụng thông tin ngữ nghĩa có trong phần nhúng.
  • Sự tương đồng về ngữ nghĩa và phân cụm. Việc nhúng vectơ giúp dễ dàng đánh giá mức độ giống nhau của hai đối tượng trong môi trường nhiều chiều. Điều này cho phép thực hiện các hoạt động như tính toán độ tương tự về ngữ nghĩa, phân cụm và tập hợp những thứ liên quan dựa trên phần nhúng của chúng.
Image showing vector embedding in chatbots.
Tính năng nhúng cho phép chatbot trả lời các câu hỏi của người dùng một cách có ý nghĩa và hợp lý.

Những loại thứ có thể được nhúng?

Nhiều loại đối tượng và kiểu dữ liệu khác nhau có thể được biểu diễn bằng cách sử dụng các vectơ nhúng. Các loại nội dung phổ biến có thể được nhúng bao gồm:

bản văn

Các từ, cụm từ hoặc tài liệu được biểu diễn dưới dạng vectơ bằng cách sử dụng phần nhúng văn bản. Các nhiệm vụ NLP - bao gồm phân tích tình cảm, tìm kiếm ngữ nghĩa và dịch ngôn ngữ - thường xuyên sử dụng các phần nhúng.

Bộ mã hóa câu phổ quát là một trong những mô hình nhúng nguồn mở phổ biến nhất và nó có thể mã hóa các câu riêng lẻ và toàn bộ đoạn văn bản một cách hiệu quả.

Hình ảnh

Việc nhúng hình ảnh nắm bắt và thể hiện các đặc điểm hình ảnh của hình ảnh dưới dạng vectơ. Các trường hợp sử dụng của chúng bao gồm nhận dạng đối tượng, phân loại hình ảnh và tìm kiếm hình ảnh ngược, thường được gọi là tìm kiếm bằng hình ảnh.

Việc nhúng hình ảnh cũng có thể được sử dụng để kích hoạt khả năng tìm kiếm trực quan. Bằng cách trích xuất các phần nhúng từ hình ảnh cơ sở dữ liệu, người dùng có thể so sánh các phần nhúng của hình ảnh truy vấn với các phần nhúng của ảnh cơ sở dữ liệu để tìm các kết quả khớp tương tự về mặt hình ảnh. Điều này thường được sử dụng trong thương mại điện tử ứng dụng, nơi người dùng có thể tìm kiếm các mặt hàng bằng cách tải lên ảnh của các sản phẩm tương tự.

Google Lens là một ứng dụng tìm kiếm hình ảnh giúp so sánh ảnh chụp từ máy ảnh với các sản phẩm có hình ảnh tương tự. Ví dụ: nó có thể được sử dụng để kết hợp các sản phẩm trên Internet tương tự như một đôi giày thể thao hoặc một bộ quần áo.

Bài nghe

Phần nhúng âm thanh là biểu diễn vector của tín hiệu âm thanh. Các vectơ nhúng ghi lại các thuộc tính thính giác, cho phép hệ thống diễn giải dữ liệu âm thanh hiệu quả hơn. Ví dụ: nhúng âm thanh có thể được sử dụng để đề xuất âm nhạc, phân loại thể loại, tìm kiếm độ tương tự của âm thanh, nhận dạng giọng nói và xác minh người nói.

Trong khi AI đang được sử dụng cho nhiều loại nội dung nhúng khác nhau thì AI âm thanh lại nhận được ít sự chú ý hơn AI văn bản hoặc hình ảnh. Tính năng Chuyển giọng nói thành văn bản của Google và OpenAI Whisper là các ứng dụng nhúng âm thanh được sử dụng trong các tổ chức như trung tâm cuộc gọi, công nghệ y tế, khả năng tiếp cận và ứng dụng chuyển lời nói thành văn bản.

Đồ thị

Việc nhúng đồ thị sử dụng vectơ để biểu diễn các nút và cạnh trong biểu đồ. Họ là được sử dụng trong các nhiệm vụ liên quan đến phân tích biểu đồ chẳng hạn như dự đoán liên kết, hệ thống nhận dạng và đề xuất của cộng đồng.

Mỗi nút đại diện cho một thực thể, chẳng hạn như một người, một trang web hoặc một sản phẩm và mỗi cạnh tượng trưng cho liên kết hoặc kết nối tồn tại giữa các thực thể đó. Những nhúng vector này có thể thực hiện mọi thứ từ việc giới thiệu bạn bè trong mạng xã hội để phát hiện các vấn đề an ninh mạng.

Dữ liệu chuỗi thời gian và mô hình 3D

Việc nhúng chuỗi thời gian nắm bắt các mẫu thời gian trong dữ liệu tuần tự. Chúng được sử dụng trong Internet của sự vật ứng dụng, dữ liệu tài chính và dữ liệu cảm biến cho các hoạt động bao gồm phát hiện sự bất thường, dự báo chuỗi thời gian và nhận dạng mẫu.

Các khía cạnh hình học của đối tượng 3D cũng có thể được biểu diễn dưới dạng vectơ bằng cách sử dụng phần nhúng mô hình 3D. Chúng được áp dụng trong các tác vụ như tái tạo 3D, phát hiện đối tượng và khớp biểu mẫu.

phân tử

Các phần nhúng phân tử biểu diễn các hợp chất hóa học dưới dạng vectơ. Chúng được sử dụng trong việc khám phá thuốc, tìm kiếm sự giống nhau về mặt hóa học và dự đoán đặc tính phân tử. Những phần nhúng này cũng được sử dụng trong hóa học tính toán và phát triển thuốc để nắm bắt các đặc điểm cấu trúc và hóa học của các phân tử.

Image showing vector embeddings of objects.
Các tập hợp số có cấu trúc được sử dụng làm vectơ nhúng cho các đối tượng.

Word2Vec là gì?

Word2Vec là một phương pháp nhúng vectơ từ NLP phổ biến. Được tạo bởi Google, Word2Vec được thiết kế để biểu diễn các từ dưới dạng vectơ dày đặc trong không gian vectơ liên tục. Nó có thể nhận dạng ngữ cảnh của một từ trong tài liệu và thường được sử dụng trong các tác vụ NLP như phân loại văn bản, phân tích tình cảm và dịch máy để giúp máy hiểu và xử lý ngôn ngữ tự nhiên hiệu quả hơn.

Word2Vec dựa trên nguyên tắc các từ có nghĩa tương tự phải có cách biểu diễn vectơ tương tự, cho phép mô hình nắm bắt các liên kết ngữ nghĩa giữa các từ.

Word2Vec có hai kiến ​​trúc cơ bản, CBOW (Túi từ liên tục) và Skip-Gram:

  • CBOW. Kiến trúc này dự đoán từ mục tiêu dựa trên các từ ngữ cảnh. Mô hình được cung cấp một ngữ cảnh hoặc các từ xung quanh và có nhiệm vụ dự đoán từ mục tiêu ở trung tâm. Ví dụ: trong câu “Con cáo nâu nhanh nhẹn nhảy qua con chó lười”, CBOW sử dụng ngữ cảnh hoặc các từ xung quanh để dự đoán. fox như từ mục tiêu.
  • Bỏ qua-Gram. Không giống như CBOW, kiến ​​trúc Skip-Gram dự đoán các từ trong ngữ cảnh dựa trên từ đích. Mô hình được cung cấp một từ mục tiêu và được yêu cầu dự đoán các thuật ngữ ngữ cảnh xung quanh. Lấy câu ví dụ “Con cáo nâu nhanh nhẹn nhảy qua con chó lười” ở trên, Skip-gram sẽ lấy từ mục tiêu fox và khám phá các từ ngữ cảnh như “The”, “nhanh”, “nâu”, “nhảy”, “vượt qua”, “the”, “lười biếng” và “con chó”.

Một loạt các doanh nghiệp đang bắt đầu sử dụng AI có tính sáng tạo, chứng tỏ tiềm năng đột phá của nó. Nghiên cứu AI sáng tạo đang phát triển như thế nào, nó sẽ đi theo hướng nào trong tương lai và những thách thức nào có thể phát sinh.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img