Logo Zephyrnet

4 bước để trở thành nhà phát triển AI sáng tạo – KDnuggets

Ngày:

4 bước để trở thành nhà phát triển AI sáng tạo
Sam Altman, Giám đốc điều hành của OpenAI, trình bày số lượng sử dụng sản phẩm tại Ngày nhà phát triển OpenAI vào tháng 2023 năm 9. OpenAI xem xét ba phân khúc khách hàng: nhà phát triển, doanh nghiệp và người dùng phổ thông. liên kết: https://www.youtube.com/watch?v=U120mJuUkhUzk&t=XNUMXs
 

Tại Ngày nhà phát triển OpenAI vào tháng 2023 năm XNUMX, Sam Altman, Giám đốc điều hành của OpenAI, đã hiển thị một slide về việc sử dụng sản phẩm trên ba phân khúc khách hàng khác nhau: nhà phát triển, doanh nghiệp và người dùng phổ thông.

Trong bài viết này, chúng tôi sẽ tập trung vào phân khúc nhà phát triển. Chúng tôi sẽ đề cập đến những gì một nhà phát triển AI sáng tạo làm, những công cụ bạn cần thành thạo cho công việc này và cách bắt đầu.

Trong khi một số công ty chuyên tâm tạo ra các sản phẩm AI có tính sáng tạo, hầu hết các nhà phát triển AI có tính sáng tạo đều có trụ sở tại các công ty khác, nơi đây không phải là trọng tâm truyền thống. 

Lý do cho điều này là AI sáng tạo có những ứng dụng áp dụng cho nhiều loại hình kinh doanh. Bốn cách sử dụng phổ biến của AI tổng quát áp dụng cho hầu hết các doanh nghiệp. 

Chatbots

4 bước để trở thành nhà phát triển AI sáng tạo
Hình ảnh được tạo bởi DALL·E 3
 

Mặc dù chatbot đã trở thành xu hướng phổ biến trong hơn một thập kỷ nhưng phần lớn chúng đều rất tệ. Thông thường, tương tác đầu tiên phổ biến nhất với chatbot là hỏi xem bạn có thể nói chuyện với con người không.

Những tiến bộ trong AI tổng quát, đặc biệt là các mô hình ngôn ngữ lớn và cơ sở dữ liệu vectơ, có nghĩa là điều đó không còn đúng nữa. Giờ đây, chatbot có thể trở nên dễ chịu đối với khách hàng khi sử dụng, nên mọi công ty đều đang bận (hoặc ít nhất là nên bận) đang cố gắng nâng cấp chúng.

Bài viết Tác động của AI tổng hợp lên chatbot từ MIT Technology Review có cái nhìn tổng quan tốt về cách thế giới chatbot đang thay đổi.

Tìm kiếm ngữ nghĩa

Tìm kiếm được sử dụng ở nhiều nơi, từ tài liệu đến trang web mua sắm cho đến chính Internet. Theo truyền thống, các công cụ tìm kiếm sử dụng nhiều từ khóa, điều này gây ra vấn đề là công cụ tìm kiếm cần phải được lập trình để nhận biết các từ đồng nghĩa.

Ví dụ: hãy xem xét trường hợp cố gắng tìm kiếm thông qua một báo cáo tiếp thị để tìm phần phân khúc khách hàng. Bạn nhấn CMD+F, nhập “phân đoạn” và duyệt qua các lần truy cập cho đến khi bạn tìm thấy thứ gì đó. Thật không may, bạn bỏ lỡ những trường hợp tác giả của tài liệu viết “phân loại” thay vì “phân đoạn”.

Tìm kiếm ngữ nghĩa (tìm kiếm trên có nghĩa là) giải quyết vấn đề từ đồng nghĩa này bằng cách tự động tìm văn bản có ý nghĩa tương tự. Ý tưởng là bạn sử dụng một mô hình nhúng—một mô hình học sâu chuyển đổi văn bản thành một vectơ số theo ý nghĩa của nó—và sau đó việc tìm kiếm văn bản liên quan chỉ là đại số tuyến tính đơn giản. Thậm chí tốt hơn, nhiều mô hình nhúng cho phép các loại dữ liệu khác như hình ảnh, âm thanh và video làm đầu vào, cho phép bạn cung cấp các loại dữ liệu đầu vào hoặc loại dữ liệu đầu ra khác nhau cho tìm kiếm của mình.

Cũng như chatbot, nhiều công ty đang cố gắng cải thiện khả năng tìm kiếm trang web của mình bằng cách sử dụng tìm kiếm ngữ nghĩa.

Hướng dẫn này về Tìm kiếm ngữ nghĩa từ Zillus, nhà sản xuất cơ sở dữ liệu vectơ Milvus, cung cấp mô tả hay về các trường hợp sử dụng.

Nội dung được cá nhân hóa

4 bước để trở thành nhà phát triển AI sáng tạo
Hình ảnh được tạo bởi DALL·E 3
 

AI sáng tạo giúp việc tạo nội dung rẻ hơn. Điều này giúp bạn có thể tạo nội dung phù hợp cho các nhóm người dùng khác nhau. Một số ví dụ phổ biến là thay đổi nội dung tiếp thị hoặc mô tả sản phẩm tùy thuộc vào những gì bạn biết về người dùng. Bạn cũng có thể cung cấp bản địa hóa để làm cho nội dung phù hợp hơn với các quốc gia hoặc nhóm nhân khẩu học khác nhau.

Bài viết này về Cách đạt được khả năng siêu cá nhân hóa bằng cách sử dụng nền tảng AI tổng hợp từ Giám đốc truyền giáo kỹ thuật số của Salesforce Vala Afshar đề cập đến những lợi ích và thách thức của việc sử dụng AI tổng hợp để cá nhân hóa nội dung.

Giao diện ngôn ngữ tự nhiên cho phần mềm

Khi phần mềm trở nên phức tạp hơn và có đầy đủ tính năng hơn, giao diện người dùng sẽ tràn ngập các menu, nút và công cụ mà người dùng không thể tìm thấy hoặc tìm ra cách sử dụng. Giao diện ngôn ngữ tự nhiên, nơi người dùng muốn giải thích những gì họ muốn trong một câu, có thể cải thiện đáng kể khả năng sử dụng của phần mềm. “Giao diện ngôn ngữ tự nhiên” có thể đề cập đến cách điều khiển phần mềm bằng giọng nói hoặc gõ. Điều quan trọng là bạn có thể sử dụng những câu tiêu chuẩn mà con người có thể hiểu được.

Nền tảng kinh doanh thông minh là một trong số những nền tảng áp dụng điều này sớm hơn, với giao diện ngôn ngữ tự nhiên giúp các nhà phân tích kinh doanh viết ít mã thao tác dữ liệu hơn. Tuy nhiên, các ứng dụng cho việc này là khá vô hạn: hầu hết mọi phần mềm giàu tính năng đều có thể được hưởng lợi từ giao diện ngôn ngữ tự nhiên.

Bài viết này của Forbes về Sử dụng AI và giao diện ngôn ngữ tự nhiên từ Gaurav Tewari, người sáng lập và Đối tác quản lý của Omega Venture Partners, có một mô tả dễ đọc về lý do tại sao giao diện ngôn ngữ tự nhiên có thể hỗ trợ khả năng sử dụng phần mềm.

Đầu tiên, bạn cần một mô hình AI có tính sáng tạo! Để làm việc với văn bản, điều này có nghĩa là một mô hình ngôn ngữ lớn. GPT 4.0 hiện là tiêu chuẩn vàng về hiệu suất nhưng có nhiều lựa chọn thay thế nguồn mở như Llama 2, Falcon và Mistral. 

Thứ hai, bạn cần một cơ sở dữ liệu vector. Pinecone là cơ sở dữ liệu vectơ thương mại phổ biến nhất và có một số lựa chọn thay thế nguồn mở như Milvus, Weaviate và Chroma.

Về ngôn ngữ lập trình, cộng đồng dường như đã ổn định xung quanh Python và JavaScript. JavaScript rất quan trọng đối với các ứng dụng web và Python phù hợp với những ứng dụng khác.

Trên hết, việc sử dụng khung ứng dụng AI tổng quát sẽ rất hữu ích. Hai đối thủ chính là LangChain và LlamaIndex. LangChain là một khuôn khổ rộng hơn cho phép bạn phát triển nhiều ứng dụng AI tổng hợp và LlamaIndex tập trung chặt chẽ hơn vào việc phát triển các ứng dụng tìm kiếm ngữ nghĩa. 

Nếu bạn đang tạo một ứng dụng tìm kiếm, hãy sử dụng LlamaIndex; nếu không, hãy sử dụng LangChain.

Điều đáng chú ý là bối cảnh đang thay đổi rất nhanh và nhiều công ty khởi nghiệp AI mới đang xuất hiện hàng tuần cùng với các công cụ mới. Nếu bạn muốn phát triển một ứng dụng, hãy mong đợi việc thay đổi các phần của ngăn xếp phần mềm thường xuyên hơn so với các ứng dụng khác.

Đặc biệt, các mô hình mới xuất hiện thường xuyên và mô hình hoạt động tốt nhất cho trường hợp sử dụng của bạn có thể sẽ thay đổi. Một quy trình công việc phổ biến là bắt đầu sử dụng API (ví dụ: API OpenAI cho API và API Pinecone cho cơ sở dữ liệu vectơ) vì chúng phát triển nhanh chóng. Khi cơ sở người dùng của bạn tăng lên, chi phí cho lệnh gọi API có thể trở nên nặng nề, vì vậy tại thời điểm này, bạn có thể muốn chuyển sang các công cụ nguồn mở (hệ sinh thái Ôm Mặt là một lựa chọn phù hợp ở đây).

Như với bất kỳ dự án mới nào, hãy bắt đầu đơn giản! Tốt nhất là bạn nên học từng công cụ một và sau đó tìm ra cách kết hợp chúng.

Bước đầu tiên là thiết lập tài khoản cho bất kỳ công cụ nào bạn muốn sử dụng. Bạn sẽ cần tài khoản nhà phát triển và khóa API để sử dụng nền tảng.

Hướng dẫn cho người mới bắt đầu về API OpenAI: Hướng dẫn thực hành và các phương pháp hay nhất chứa hướng dẫn từng bước về cách thiết lập tài khoản nhà phát triển OpenAI và tạo khóa API.

Tương tự như vậy, Làm chủ cơ sở dữ liệu vectơ với hướng dẫn Pinecone: Hướng dẫn toàn diện chứa các chi tiết để thiết lập Pinecone.

Ôm mặt là gì? Ốc đảo mã nguồn mở của cộng đồng AI giải thích cách bắt đầu với Ôm Mặt.

Học LLM

Để bắt đầu sử dụng LLM như GPT theo chương trình, điều đơn giản nhất là tìm hiểu cách gọi API để gửi lời nhắc và nhận tin nhắn. 

Mặc dù có thể đạt được nhiều nhiệm vụ bằng cách trao đổi qua lại với LLM, nhưng các trường hợp sử dụng như chatbot yêu cầu một cuộc trò chuyện dài. OpenAI gần đây đã công bố tính năng “luồng” như một phần của API Trợ lý của họ. Bạn có thể tìm hiểu tính năng này trong Hướng dẫn API hỗ trợ OpenAI

Điều này không được mọi LLM hỗ trợ, vì vậy bạn cũng có thể cần học cách quản lý trạng thái cuộc trò chuyện theo cách thủ công. Ví dụ: bạn cần quyết định tin nhắn nào trước đó trong cuộc trò chuyện vẫn liên quan đến cuộc trò chuyện hiện tại.

Ngoài ra, không cần phải dừng lại khi chỉ làm việc với văn bản. Bạn có thể thử làm việc với các phương tiện khác; ví dụ: chuyển âm thanh (lời nói thành văn bản) hoặc tạo hình ảnh từ văn bản.

Cơ sở dữ liệu vectơ học tập

Trường hợp sử dụng đơn giản nhất của cơ sở dữ liệu vector là tìm kiếm ngữ nghĩa. Ở đây, bạn sử dụng mô hình nhúng (xem Giới thiệu về nhúng văn bản với API OpenAI) để chuyển đổi văn bản (hoặc đầu vào khác) thành một vectơ số thể hiện ý nghĩa của nó.

Sau đó, bạn chèn dữ liệu nhúng của mình (vectơ số) vào cơ sở dữ liệu vectơ. Tìm kiếm chỉ có nghĩa là viết một truy vấn tìm kiếm và hỏi mục nào trong cơ sở dữ liệu tương ứng nhất với nội dung bạn yêu cầu.

Ví dụ: bạn có thể lấy một số Câu hỏi thường gặp về một trong các sản phẩm của công ty bạn, nhúng chúng và tải chúng lên cơ sở dữ liệu vectơ. Sau đó, bạn đặt câu hỏi về sản phẩm và nó sẽ trả về kết quả trùng khớp gần nhất, chuyển đổi từ vectơ số sang văn bản gốc.

Kết hợp LLM và cơ sở dữ liệu vector

Bạn có thể thấy rằng việc trả lại trực tiếp mục nhập văn bản từ cơ sở dữ liệu vectơ là không đủ. Thông thường, bạn muốn văn bản được xử lý theo cách trả lời truy vấn một cách tự nhiên hơn.

Giải pháp cho vấn đề này là một kỹ thuật được gọi là thế hệ tăng cường truy xuất (RAG). Điều này có nghĩa là sau khi bạn truy xuất văn bản từ cơ sở dữ liệu vectơ, bạn viết lời nhắc cho LLM, sau đó đưa văn bản đã truy xuất vào lời nhắc của bạn (bạn tăng lời nhắc với lấy chữ). Sau đó, bạn yêu cầu LLM viết câu trả lời mà con người có thể đọc được.

Trong ví dụ về trả lời câu hỏi của người dùng từ Câu hỏi thường gặp, bạn sẽ viết lời nhắc có phần giữ chỗ, như sau.

"""
Please answer the user's question about {product}.
---
The user's question is : {query}
---
The answer can be found in the following text: {retrieved_faq}
"""

 

Bước cuối cùng là kết hợp các kỹ năng RAG của bạn với khả năng quản lý chuỗi tin nhắn để duy trì cuộc trò chuyện lâu hơn. Thì đấy! Bạn có một chatbot!

DataCamp có một loạt chín đoạn mã để dạy bạn trở thành một nhà phát triển AI sáng tạo. Bạn cần có kỹ năng Python cơ bản để bắt đầu, nhưng tất cả các khái niệm AI đều được dạy từ đầu.

Bộ sách này được giảng dạy bởi những giảng viên hàng đầu của Microsoft, Pinecone, Imperial College London và Fidelity (và tôi!).

Bạn sẽ tìm hiểu về tất cả các chủ đề được đề cập trong bài viết này, với sáu đoạn mã tập trung vào nhóm thương mại của API OpenAI, API Pinecone và LangChain. Ba phần hướng dẫn còn lại tập trung vào mô hình Ôm Mặt.

Đến cuối loạt bài này, bạn sẽ có thể tạo một chatbot và xây dựng các ứng dụng NLP và thị giác máy tính.
 
 

Bông Richie là Nhà truyền bá dữ liệu tại DataCamp. Anh ấy là người dẫn chương trình podcast DataFramed, anh ấy đã viết 2 cuốn sách về lập trình R và tạo 10 khóa học DataCamp về khoa học dữ liệu đã được hơn 700 nghìn người học tham gia.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img