Logo Zephyrnet

Mô hình nền tảng Falcon 180B của TII hiện có sẵn thông qua Amazon SageMaker JumpStart | Dịch vụ web của Amazon

Ngày:

Hôm nay, chúng tôi vui mừng thông báo rằng mô hình nền tảng Falcon 180B do Viện Đổi mới Công nghệ (TII) phát triển và đào tạo trên Amazon SageMaker đã có sẵn cho khách hàng thông qua Khởi động Amazon SageMaker để triển khai chỉ bằng một cú nhấp chuột để chạy suy luận. Với kích thước 180 tỷ tham số và được đào tạo trên bộ dữ liệu khổng lồ 3.5 nghìn tỷ mã thông báo, Falcon 180B là mô hình lớn nhất và là một trong những mô hình hoạt động hiệu quả nhất với trọng số có thể truy cập công khai. Bạn có thể dùng thử mô hình này với SageMaker JumpStart, một trung tâm máy học (ML) cung cấp quyền truy cập vào các thuật toán, mô hình và giải pháp ML để bạn có thể nhanh chóng bắt đầu với ML. Trong bài đăng này, chúng tôi hướng dẫn cách khám phá và triển khai mô hình Falcon 180B thông qua SageMaker JumpStart.

Falcon 180B là gì

Falcon 180B là mẫu xe được phát hành bởi IIT tiếp theo các phiên bản trước đó trong gia đình Falcon. Đây là phiên bản mở rộng của Falcon 40B và sử dụng tính năng chú ý nhiều truy vấn để có khả năng mở rộng tốt hơn. Đó là mô hình ngôn ngữ tự động hồi quy sử dụng kiến ​​trúc biến áp được tối ưu hóa. Nó được đào tạo trên 3.5 nghìn tỷ mã thông báo dữ liệu, chủ yếu bao gồm dữ liệu web từ Web tinh tế (khoảng 85%). Model có 180 phiên bản: 180B và 180B-Chat. 180B là mô hình thô, được đào tạo trước, cần được tinh chỉnh thêm cho hầu hết các trường hợp sử dụng. XNUMXB-Chat phù hợp hơn với việc thực hiện các hướng dẫn chung chung. Mô hình Trò chuyện đã được tinh chỉnh trên các tập dữ liệu trò chuyện và hướng dẫn cùng với một số tập dữ liệu hội thoại quy mô lớn.

Mô hình này được cung cấp theo Giấy phép Falcon-180B TIISự cho phép của chính trị.

Falcon 180B được TII huấn luyện trên Amazon SageMaker, trên một cụm GPU khoảng 4K A100. Nó sử dụng một cơ sở mã đào tạo phân tán tùy chỉnh có tên Gigatron, sử dụng tính song song 3D với ZeRO và các hạt nhân Triton hiệu suất cao, tùy chỉnh. Kiến trúc đào tạo phân tán được sử dụng Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) là dịch vụ hợp nhất duy nhất để tải dữ liệu cũng như ghi và đọc điểm kiểm tra, góp phần đặc biệt vào độ tin cậy của khối lượng công việc và tính đơn giản trong vận hành.

Khởi động SageMaker là gì

Với SageMaker JumpStart, những người thực hành ML có thể chọn từ danh sách ngày càng nhiều các mô hình nền tảng hoạt động tốt nhất. Người thực hành ML có thể triển khai các mô hình nền tảng cho các phiên bản SageMaker chuyên dụng trong môi trường mạng cách ly và tùy chỉnh các mô hình bằng cách sử dụng Amazon SageMaker để đào tạo và triển khai mô hình.

Bây giờ bạn có thể khám phá và triển khai Falcon 180B chỉ bằng vài cú nhấp chuột trong Xưởng sản xuất Amazon SageMaker hoặc lập trình thông qua SageMaker Python SDK, cho phép bạn lấy được hiệu suất mô hình và các điều khiển MLOps bằng các tính năng của SageMaker như Đường ống Amazon SageMaker, Trình gỡ lỗi Amazon SageMakerhoặc nhật ký vùng chứa. Mô hình này được triển khai trong môi trường bảo mật AWS và dưới sự kiểm soát VPC của bạn, giúp đảm bảo tính bảo mật dữ liệu. Falcon 180B có thể được khám phá và có thể được triển khai ở các Khu vực có sẵn các phiên bản cần thiết. Hiện tại, các phiên bản ml.p4de có sẵn ở Miền Đông Hoa Kỳ (Bắc Virginia) và Miền Tây Hoa Kỳ (Oregon).

Khám phá các mô hình

Bạn có thể truy cập các mô hình nền tảng thông qua SageMaker JumpStart trong giao diện người dùng SageMaker Studio và SageMaker Python SDK. Trong phần này, chúng ta sẽ tìm hiểu cách khám phá các mô hình trong SageMaker Studio.

SageMaker Studio là một môi trường phát triển tích hợp (IDE) cung cấp một giao diện trực quan dựa trên web duy nhất, nơi bạn có thể truy cập các công cụ chuyên dụng để thực hiện tất cả các bước phát triển ML, từ chuẩn bị dữ liệu đến xây dựng, đào tạo và triển khai các mô hình ML của bạn. Để biết thêm chi tiết về cách bắt đầu và thiết lập SageMaker Studio, hãy tham khảo Xưởng sản xuất Amazon SageMaker.

Trong SageMaker Studio, bạn có thể truy cập SageMaker JumpStart, nơi chứa các mô hình, sổ ghi chép và giải pháp dựng sẵn được đào tạo trước, trong Các giải pháp dựng sẵn và tự động.

Từ trang đích SageMaker JumpStart, bạn có thể duyệt tìm giải pháp, mô hình, sổ ghi chép và các tài nguyên khác. Bạn có thể tìm thấy Falcon 180B trong Mô hình nền tảng: Tạo văn bản băng chuyền.

Bạn cũng có thể tìm thấy các biến thể mô hình khác bằng cách chọn Khám phá tất cả các Mô hình tạo văn bản hoặc tìm kiếm Falcon.

Bạn có thể chọn thẻ mô hình để xem thông tin chi tiết về mô hình như giấy phép, dữ liệu dùng để đào tạo và cách sử dụng. Bạn cũng sẽ tìm thấy hai nút, Triển khaiMở Notebook, điều này sẽ giúp bạn sử dụng mô hình (ảnh chụp màn hình sau đây hiển thị Triển khai Tùy chọn).

Triển khai mô hình

Khi bạn chọn Triển khai, quá trình triển khai mô hình sẽ bắt đầu. Ngoài ra, bạn có thể triển khai thông qua sổ ghi chép mẫu hiển thị bằng cách chọn Mở Notebook. Sổ ghi chép ví dụ cung cấp hướng dẫn từ đầu đến cuối về cách triển khai mô hình để suy luận và dọn sạch tài nguyên.

Để triển khai bằng sổ ghi chép, chúng tôi bắt đầu bằng cách chọn một mô hình thích hợp, được chỉ định bởi model_id. Bạn có thể triển khai bất kỳ mô hình đã chọn nào trên SageMaker bằng mã sau:

from sagemaker.jumpstart.model import JumpStartModel my_model = JumpStartModel(model_id="huggingface-llm-falcon-180b-chat-bf16") predictor = my_model.deploy()

Việc này sẽ triển khai mô hình trên SageMaker với các cấu hình mặc định, bao gồm loại phiên bản mặc định và cấu hình VPC mặc định. Bạn có thể thay đổi các cấu hình này bằng cách chỉ định các giá trị không mặc định trong JumpStartModel. Để tìm hiểu thêm, hãy tham khảo Tài liệu API. Sau khi triển khai, bạn có thể chạy suy luận dựa trên điểm cuối đã triển khai thông qua công cụ dự đoán SageMaker. Xem đoạn mã sau:

payload = { "inputs": "User: Hello!nFalcon: ", "parameters": {"max_new_tokens": 256, "top_p": 0.9, "temperature": 0.6}
}
response = predictor.predict(payload)

Các tham số suy luận kiểm soát quá trình tạo văn bản ở điểm cuối. Kiểm soát mã thông báo mới tối đa đề cập đến kích thước của đầu ra do mô hình tạo ra. Lưu ý rằng con số này không giống với số lượng từ vì từ vựng của mô hình không giống với từ vựng tiếng Anh và mỗi mã thông báo có thể không phải là một từ tiếng Anh. Nhiệt độ kiểm soát tính ngẫu nhiên ở đầu ra. Nhiệt độ cao hơn dẫn đến kết quả đầu ra sáng tạo và ảo giác hơn. Tất cả các tham số suy luận là tùy chọn.

Mô hình tham số 180B này có dung lượng 335GB và yêu cầu nhiều bộ nhớ GPU hơn để thực hiện đủ khả năng suy luận ở độ chính xác 16 bit. Hiện tại, JumpStart chỉ hỗ trợ mô hình này trên các phiên bản ml.p4de.24xlarge. Có thể triển khai mô hình lượng tử hóa 8 bit trên phiên bản ml.p4d.24xlarge bằng cách cung cấp env={"HF_MODEL_QUANTIZE": "bitsandbytes"} đối số từ khóa cho JumpStartModel hàm tạo và chỉ định instance_type="ml.p4d.24xlarge" đến phương pháp triển khai. Tuy nhiên, xin lưu ý rằng độ trễ trên mỗi mã thông báo chậm hơn khoảng 5 lần đối với cấu hình lượng tử hóa này.

Bảng sau liệt kê tất cả các mô hình Falcon có sẵn trong SageMaker JumpStart cùng với ID mô hình, loại phiên bản mặc định, tổng số mã thông báo tối đa (tổng số mã thông báo đầu vào và số lượng mã thông báo được tạo) được hỗ trợ và độ trễ phản hồi thông thường trên mỗi mã thông báo cho mỗi mô hình này.

Tên Model ID mô hình Loại phiên bản mặc định Tổng số mã thông báo tối đa Độ trễ trên mỗi mã thông báo*
Chim Ưng 7B huggingface-llm-falcon-7b-bf16 ml.g5.2xlarge 2048 34 ms
Falcon 7B Hướng dẫn huggingface-llm-falcon-7b-instruct-bf16 ml.g5.2xlarge 2048 34 ms
Chim Ưng 40B huggingface-llm-falcon-40b-bf16 ml.g5.12xlarge 2048 57 ms
Falcon 40B Hướng dẫn huggingface-llm-falcon-40b-instruct-bf16 ml.g5.12xlarge 2048 57 ms
Chim Ưng 180B huggingface-llm-falcon-180b-bf16 ml.p4de.24xlarge 2048 45 ms
Trò chuyện Falcon 180B huggingface-llm-falcon-180b-chat-bf16 ml.p4de.24xlarge 2048 45 ms

*độ trễ trên mỗi mã thông báo được cung cấp cho thời gian phản hồi trung bình của các lời nhắc ví dụ được cung cấp trong blog này; giá trị này sẽ thay đổi dựa trên độ dài của chuỗi đầu vào và đầu ra.

Suy luận và gợi ý ví dụ cho Falcon 180B

Mô hình Falcon có thể được sử dụng để hoàn thiện văn bản cho bất kỳ đoạn văn bản nào. Thông qua việc tạo văn bản, bạn có thể thực hiện nhiều nhiệm vụ khác nhau, chẳng hạn như trả lời câu hỏi, dịch ngôn ngữ, phân tích cảm xúc, v.v. Điểm cuối chấp nhận lược đồ tải trọng đầu vào sau:

payload = { "inputs": str, (optional)"parameters": { "do_sample": bool, "max_new_tokens": int, "repetition_penalty": float, "return_full_text": bool, "stop": List[str], "seed": int, "temperature": float, "top_k": int, "top_p": float, "truncate": int, "typical_p": float, "best_of": int, "watermark": bool, "details": bool, "decoder_input_details": bool, }
}

Bạn có thể khám phá định nghĩa của những điều này thông số khách hàng và các giá trị mặc định của chúng trong kho lưu trữ suy luận tạo văn bản.

Sau đây là một số lời nhắc ví dụ mẫu và văn bản do mô hình tạo ra. Tất cả các kết quả đầu ra ở đây được tạo ra với các tham số suy luận {"max_new_tokens": 768, "stop": ["<|endoftext|>", "###"]}.

Xây dựng một trang web có thể được thực hiện trong 10 bước đơn giản:

Input Building a website can be done in 10 simple steps: Output
- Choose a domain name
- Register your domain name
- Choose a web host
- Choose a website builder
- Create your website
- Add content to your website
- Add pages to your website
- Add images to your website
- Add videos to your website
- Add social media to your website
1. Choose a domain name
A domain name is the address of your website. It is what people will type into their browser to find your website. For example, the domain name of this website is.
When choosing a domain name, you should choose something that is easy to remember and that represents your business or website. You should also make sure that the domain name is available. You can check if a domain name is available by using a domain name search tool.
2. Register your domain name
Once you have chosen a domain name, you need to register it. This can be done through a domain name registrar. A domain name registrar is a company that manages the registration of domain names.
When registering your domain name, you will need to provide your contact information and choose a payment method. You will also need to choose a domain name extension. The most common domain name extensions are .com, .net, and .org.
3. Choose a web host
A web host is a company that provides space on a server for your website. When choosing a web host, you should choose one that is reliable and that offers good customer support. You should also make sure that the web host offers the features that you need for your website.
4. Choose a website builder
A website builder is a tool that allows you to create a website without having to learn how to code. There are many different website builders available, so you should choose one that is easy to use and that offers the features that you need.
5. Create your website
Once you have chosen a website builder, you can start creating your website. You will need to choose a template for your website and then add content to your website.
6. Add content to your website
The content of your website is what will make your website unique. You should add content that is relevant to your business or website. You can add text, images, videos, and other types of content to your website.
7. Add pages to your website
A website is made up of pages. You can add as many pages as you want to your website. Each page should have a different purpose. For example, you might have a page for your home page, a page for your about page, and a page for your contact page.
8. Add images to your website
Images can make your website more visually appealing. You can add images to your website by uploading them to your website or by using a image hosting service.
9. Add videos to your website
Videos can also make your website more visually appealing. You can add videos to your website by uploading them to your website or by using a video hosting service.
10. Add social media to your website
Social media can help you promote your website. You can add social media buttons to your website so that people can share your website on social media. You can also add social media feeds to your website so that people can see your latest social media posts.

Bạn có thể nhận thấy mô hình được huấn luyện trước này tạo ra các chuỗi văn bản dài không nhất thiết phải lý tưởng cho các trường hợp sử dụng hộp thoại. Trước khi chúng tôi trình bày cách hoạt động của mô hình trò chuyện được tinh chỉnh đối với một tập hợp lớn hơn các lời nhắc dựa trên hộp thoại, hai ví dụ tiếp theo minh họa cách sử dụng mô hình Falcon với phương pháp học tập trong ngữ cảnh ít lần, trong đó chúng tôi cung cấp các mẫu đào tạo có sẵn cho mô hình. Lưu ý rằng "học vài lần" không điều chỉnh trọng số mô hình - chúng tôi chỉ thực hiện suy luận về mô hình đã triển khai trong quá trình này đồng thời cung cấp một số ví dụ trong ngữ cảnh đầu vào để hỗ trợ đầu ra của mô hình bang hội.

Input
Tweet: "I hate it when my phone battery dies."
Sentiment: Negative
###
Tweet: "My day has been :+1:"
Sentiment: Positive
###
Tweet: "This is the link to the article"
Sentiment: Neutral
###
Tweet: "This new music video was incredible"
Sentiment: Output Positive
###

Input
Translate English to French:
sea otter => loutre de mer
###
peppermint => menthe poivrée
###
plush girafe => girafe peluche
###
cheese => Output fromage
###

Lời nhắc suy luận và ví dụ cho Falcon 180B-Chat

Với các mô hình Falcon 180B-Chat, được tối ưu hóa cho các trường hợp sử dụng đối thoại, đầu vào của điểm cuối mô hình trò chuyện có thể chứa lịch sử trước đó giữa trợ lý trò chuyện và người dùng. Bạn có thể đặt câu hỏi theo ngữ cảnh của cuộc trò chuyện đã diễn ra cho đến nay. Bạn cũng có thể cung cấp cấu hình hệ thống, chẳng hạn như cá tính, xác định hành vi của trợ lý trò chuyện. Tải trọng đầu vào đến điểm cuối giống như mẫu Falcon 180B ngoại trừ inputs giá trị chuỗi nên sử dụng định dạng sau:

System: <An optional system prompt>
User: <Optional user message history>
Falcon: <Optional chat history Falcon response>
User: <Current user message>
Falcon:

Sau đây là một số lời nhắc ví dụ mẫu và văn bản do mô hình tạo ra. Tất cả các đầu ra được tạo với các tham số suy luận {"max_new_tokens":256, "stop": ["nUser:", "<|endoftext|>", " User:", "###"]}.

Input
System: You are a helpful assistant
User: What is Amazon SageMaker JumpStart?
Falcon: Output Amazon SageMaker JumpStart is a capability of Amazon SageMaker that provides a set of solutions to common machine learning problems. These solutions include pre-built machine learning models, algorithms, and pre-configured model training and deployment settings. JumpStart also provides sample notebooks that demonstrate how to use these solutions for various use cases. The goal of JumpStart is to help users get started with machine learning quickly and easily, without the need for extensive machine learning expertise.
User:

Input
User: Simply put, the theory of relativity states that
Falcon: Output 1. The laws of physics are the same for all observers in uniform motion relative to one another.
2. The speed of light in a vacuum is the same for all observers, regardless of their motion or the motion of the light source.
3. Time and space are relative, meaning that they can vary depending on the observer's frame of reference.
4. Mass and energy are interchangeable, as expressed by the famous equation E=mc².
User:

Input
User: Building a website can be done in 10 simple steps:
Falcon: Output
1. Determine the purpose and goals of your website.
2. Choose a domain name and register it.
3. Select a web hosting provider and sign up for a plan.
4. Choose a website builder or content management system (CMS) to use.
5. Select a theme or template for your website.
6. Customize the design and layout of your website.
7. Add content to your website, including text, images, and videos.
8. Set up navigation menus and links to make your website easy to navigate.
9. Test your website to ensure it is functioning properly and is mobile-friendly.
10. Launch your website and promote it to attract visitors.
User:

Input
System: Always answer with a Haiku.
User: I am deploying a large language model on Amazon SageMaker JumpStart. What should I do?
Falcon: Output "JumpStart" your dreams,
Deploy with ease, scale with glee,
SageMaker awaits.

Input
System: Generate a table summarizing the options outlined in this email.
User: Team, we have to make a decision on the product plan for Goocrux v2. The first option will take us 3 weeks of development, and will achieve performance of 80ms, but means that the UI has to change. The second option will take us 4 weeks of development, and will achieve performance of 60ms, without any UI change. The third option will take the longest -- 6 weeks of development, will achieve performance of 30ms, without any UI change. A markdown table with four columns: (1) Option ID, (2) Development time, (3) Performance, (4) UI Change.
Falcon: Output
| Option ID | Development time | Performance | UI Change |
| --- | --- | --- | --- |
| 1 | 3 weeks | 80ms | Yes |
| 2 | 4 weeks | 60ms | No |
| 3 | 6 weeks | 30ms | No |

Input
System: You always translate English to French.
User: sea otter => loutre de mer
peppermint => menthe poivrée
plush girafe => girafe peluche
cheese =>
Falcon: Output
=> fromage

Input
System: Classify the user prompt as Negative, Positive, or Neutral sentiment. Use a short response.
User: Tweet: "This new music video was awesome" Falcon: Output "Positive"

Input
User: What is the recipe of mayonnaise?
Falcon: Output 1. In a mixing bowl, whisk together 1 egg yolk, 1 tablespoon of Dijon mustard, and 1 tablespoon of lemon juice until well combined.
2. While whisking continuously, slowly drizzle in 1 cup of vegetable oil until the mixture thickens and emulsifies.
3. Season with salt and pepper to taste.
4. Store in an airtight container in the refrigerator for up to one week.
User:

Trong ví dụ sau, người dùng đã trò chuyện với trợ lý về các địa điểm du lịch ở Paris. Tiếp theo, người dùng đang hỏi về tùy chọn đầu tiên được trợ lý trò chuyện đề xuất.

Input
System: You are a helpful trip planner.
User: I am going to Paris, what should I see?
Falcon: 1. Eiffel Tower: No trip to Paris is complete without a visit to the iconic Eiffel Tower.
2. Louvre Museum: Home to some of the world's most famous art, including the Mona Lisa.
3. Notre-Dame Cathedral: A stunning example of Gothic architecture and a must-see for history buffs.
4. Champs-Élysées: One of the most famous avenues in the world, lined with shops, cafes, and theaters.
5. Montmartre: A charming neighborhood known for its bohemian vibe, street art, and stunning views of the city.
6. Palace of Versailles: A short train ride from Paris, this opulent palace was once the seat of French royalty.
7. Musée d'Orsay: Housed in a former train station, this museum boasts an impressive collection of Impressionist and Post-Impressionist art.
8. Sainte-Chapelle: A hidden gem in the heart of Paris, this medieval chapel is famous for its stunning stained glass windows.
9. Luxembourg Gardens: A beautiful park in the heart of the city, perfect for a picnic or a leisurely stroll.
User: What is so great about #1?
Falcon: Output
#1 is the Eiffel Tower, which is one of the most famous landmarks in the world. It is a symbol of Paris and a must-see attraction for many visitors. The tower offers stunning views of the city from its observation decks, and it is especially beautiful when lit up at night. Additionally, the Eiffel Tower has a rich history and is an engineering marvel, making it a fascinating destination for anyone interested in architecture or history.
User:

Làm sạch

Sau khi bạn chạy xong sổ ghi chép, hãy đảm bảo xóa tất cả tài nguyên mà bạn đã tạo trong quy trình để dừng thanh toán. Sử dụng mã sau đây:

predictor.delete_model()
predictor.delete_endpoint()

Kết luận

Trong bài đăng này, chúng tôi đã hướng dẫn bạn cách bắt đầu với Falcon 180B trong SageMaker Studio và triển khai mô hình để suy luận. Vì các mô hình nền tảng được đào tạo trước nên chúng có thể giúp giảm chi phí đào tạo và cơ sở hạ tầng, đồng thời cho phép tùy chỉnh cho trường hợp sử dụng của bạn. Hãy truy cập SageMaker JumpStart trong SageMaker Studio ngay bây giờ để bắt đầu.

Thông tin


Về các tác giả

Tiến sĩ Kyle Ulrich là Nhà khoa học ứng dụng của nhóm Amazon SageMaker JumpStart. Lĩnh vực nghiên cứu của ông bao gồm các thuật toán học máy có thể mở rộng, thị giác máy tính, chuỗi thời gian, phi tham số Bayesian và quy trình Gaussian. Tiến sĩ của anh ấy đến từ Đại học Duke và anh ấy đã xuất bản các bài báo trên NeurIPS, Cell và Neuron.

Tiến sĩ Ashish Khetan là Nhà khoa học ứng dụng cấp cao của Amazon SageMaker JumpStart và giúp phát triển các thuật toán máy học. Ông lấy bằng Tiến sĩ tại Đại học Illinois Urbana-Champaign. Ông là một nhà nghiên cứu tích cực về học máy và suy luận thống kê, đồng thời đã xuất bản nhiều bài báo tại các hội nghị NeurIPS, ICML, ICLR, JMLR, ACL và EMNLP.

Olivier Cruchant là Kiến trúc sư giải pháp chuyên gia học máy chính tại AWS, có trụ sở tại Pháp. Olivier giúp khách hàng của AWS – từ các công ty khởi nghiệp nhỏ đến doanh nghiệp lớn – phát triển và triển khai các ứng dụng machine learning cấp sản xuất. Trong thời gian rảnh rỗi, anh thích đọc các tài liệu nghiên cứu và khám phá vùng hoang dã cùng bạn bè và gia đình.

Karl Albertsen lãnh đạo trung tâm mô hình nền tảng, thuật toán và nhóm đối tác của Amazon SageMaker.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img