Logo Zephyrnet

Cuộc cách mạng AI sáng tạo trong trò chơi

Ngày:

Để hiểu việc chơi game sắp được biến đổi triệt để như thế nào bởi Trí tuệ nhân tạo Sáng tạo, không cần tìm đâu xa hơn bài viết gần đây Twitter bài by @emmanuel_2m. Trong bài đăng này, anh ấy khám phá cách sử dụng Khuếch tán ổn định + Dreambooth, các mô hình Trí tuệ nhân tạo 2D phổ biến, để tạo ra hình ảnh của các bình thuốc cho một trò chơi giả định.

Điểm thay đổi của công việc này không chỉ là nó tiết kiệm thời gian và tiền bạc mà còn mang lại chất lượng – do đó phá vỡ tam giác cổ điển “bạn chỉ có thể có hai chi phí, chất lượng hoặc tốc độ”. Các nghệ sĩ hiện đang tạo ra những hình ảnh chất lượng cao chỉ trong vài giờ mà nếu không sẽ mất hàng tuần để tạo ra bằng tay. Điều thực sự biến đổi là:

  • Sức mạnh sáng tạo này hiện có sẵn cho bất kỳ ai có thể học một vài công cụ đơn giản.
  • Những công cụ này có thể tạo ra vô số biến thể theo cách lặp đi lặp lại nhiều lần.
  • Sau khi được đào tạo, quy trình này diễn ra trong thời gian thực – kết quả có sẵn gần như ngay lập tức.

Chưa từng có một công nghệ mang tính cách mạng nào dành cho trò chơi kể từ 3D thời gian thực. Hãy dành bất kỳ thời gian nào để nói chuyện với những người sáng tạo trò chơi, và cảm giác phấn khích và ngạc nhiên có thể cảm nhận được. Vậy công nghệ này sẽ đi về đâu? Và nó sẽ biến đổi trò chơi như thế nào? Tuy nhiên, trước tiên, hãy xem lại AI Sáng tạo là gì?

MỤC LỤC

Trí tuệ nhân tạo là gì

AI sáng tạo là một danh mục học máy trong đó máy tính có thể tạo nội dung mới ban đầu để đáp ứng lời nhắc từ người dùng. Ngày nay, văn bản và hình ảnh là những ứng dụng trưởng thành nhất của công nghệ này, nhưng có nhiều công việc đang được tiến hành trong hầu hết mọi lĩnh vực sáng tạo, từ hoạt ảnh, hiệu ứng âm thanh, âm nhạc, thậm chí là tạo ra các nhân vật ảo có cá tính hoàn chỉnh.

Tất nhiên, AI không có gì mới trong trò chơi. Ngay cả những trò chơi đầu tiên, như Atari's Pong, cũng có các đối thủ do máy tính điều khiển để thách thức người chơi. Tuy nhiên, những kẻ thù ảo này không chạy AI như chúng ta biết ngày nay. Chúng chỉ đơn giản là các thủ tục được viết sẵn bởi các nhà thiết kế trò chơi. Họ mô phỏng một đối thủ thông minh nhân tạo, nhưng họ không thể học được và họ chỉ giỏi ngang với những lập trình viên đã tạo ra chúng.

Điều khác biệt bây giờ là lượng điện toán khả dụng, nhờ bộ vi xử lý nhanh hơn và đám mây. Với sức mạnh này, có thể xây dựng các mạng thần kinh lớn có thể xác định các mẫu và biểu diễn trong các miền có độ phức tạp cao.

Bài đăng trên blog này có hai phần:

  • Phần I bao gồm các quan sát và dự đoán của chúng tôi về lĩnh vực AI sáng tạo cho trò chơi.
  • Phần II là bản đồ thị trường của chúng tôi về không gian, phác thảo các phân khúc khác nhau và xác định các công ty chủ chốt trong từng phân khúc.

MỤC LỤC

Giả định

Trước tiên, hãy khám phá một số giả định nằm dưới phần còn lại của bài đăng trên blog này:

1. Số lượng nghiên cứu đang được thực hiện nói chung về AI sẽ tiếp tục tăng lên, tạo ra các kỹ thuật hiệu quả hơn bao giờ hết

Hãy xem xét biểu đồ này về số lượng bài báo học thuật được xuất bản về Học máy hoặc Trí tuệ nhân tạo trong kho lưu trữ arXiv mỗi tháng:

Như bạn có thể thấy, số lượng giấy tờ đang tăng theo cấp số nhân, không có dấu hiệu chậm lại. Và điều này chỉ bao gồm các bài báo đã xuất bản - phần lớn nghiên cứu thậm chí chưa bao giờ được xuất bản, chuyển trực tiếp đến các mô hình nguồn mở hoặc R&D sản phẩm. Kết quả là một sự bùng nổ về sự quan tâm và đổi mới.

2. Trong tất cả các hoạt động giải trí, trò chơi sẽ bị ảnh hưởng nhiều nhất bởi Generative AI

Trò chơi là hình thức giải trí phức tạp nhất xét về số lượng lớn các loại nội dung có liên quan (nghệ thuật 2D, nghệ thuật 3D, hiệu ứng âm thanh, âm nhạc, hộp thoại, v.v.). Các trò chơi cũng có tính tương tác cao nhất, tập trung nhiều vào trải nghiệm thời gian thực. Điều này tạo ra một rào cản lớn đối với việc gia nhập đối với các nhà phát triển trò chơi mới, cũng như chi phí cao để sản xuất một trò chơi hiện đại, đứng đầu bảng xếp hạng. Nó cũng tạo ra một cơ hội to lớn cho sự đột phá của AI Sáng tạo.

Hãy xem xét một trò chơi như Red Dead Redemption 2, một trong những trò chơi đắt nhất từng được sản xuất, tiêu tốn gần 500 triệu đô la để thực hiện. Thật dễ hiểu tại sao – nó có một trong những thế giới ảo đẹp nhất, được hiện thực hóa hoàn toàn so với bất kỳ trò chơi nào trên thị trường. Nó cũng mất gần 8 năm để xây dựng, có hơn 1,000 nhân vật không thể chơi được (mỗi nhân vật có tính cách, tác phẩm nghệ thuật và diễn viên lồng tiếng riêng), một thế giới rộng gần 30 dặm vuông, hơn 100 nhiệm vụ được chia thành 6 chương và gần 60 giờ âm nhạc được tạo bởi hơn 100 nhạc sĩ. Tất cả mọi thứ về trò chơi này là lớn.

Bây giờ hãy so sánh Red Dead Redemption 2 với Trình mô phỏng bay Microsoft, không chỉ lớn mà còn rất lớn. Microsoft Flight Simulator cho phép người chơi bay vòng quanh toàn bộ hành tinh Trái đất, với tổng diện tích 197 triệu dặm vuông. Làm thế nào mà Microsoft xây dựng một trò chơi lớn như vậy? Bằng cách để AI làm việc đó. Microsoft hợp tác với blackshark.ai, và đào tạo một AI để tạo thế giới 3D chân thực từ hình ảnh vệ tinh 2D.

Đây là một ví dụ về một trò chơi mà theo nghĩa đen là không thể xây dựng nếu không sử dụng AI, và hơn nữa, được hưởng lợi từ thực tế là những mô hình này có thể được cải tiến liên tục theo thời gian. Ví dụ: họ có thể cải tiến mô hình “cầu vượt đường cao tốc lá cỏ ba lá”, chạy lại toàn bộ quá trình xây dựng và đột nhiên tất cả các cầu vượt đường cao tốc trên toàn hành tinh đều được cải thiện.

3. Sẽ có một mô hình AI chung cho mọi tài sản liên quan đến sản xuất trò chơi

Cho đến nay, các trình tạo hình ảnh 2D như Khuếch tán ổn định hoặc MidJourney đã chiếm được phần lớn sự phấn khích phổ biến đối với AI Sáng tạo do tính chất bắt mắt của hình ảnh mà chúng có thể tạo ra. Nhưng đã có các mô hình AI Sáng tạo cho hầu như tất cả nội dung liên quan đến trò chơi, từ mô hình 3D, hoạt ảnh nhân vật, hộp thoại và âm nhạc. Nửa sau của bài đăng trên blog này bao gồm một bản đồ thị trường làm nổi bật một số công ty tập trung vào từng loại nội dung.

4. Giá của nội dung sẽ giảm đáng kể, có hiệu quả bằng XNUMX trong một số trường hợp.

Khi nói chuyện với các nhà phát triển trò chơi đang thử nghiệm tích hợp AI Sáng tạo vào quy trình sản xuất của họ, điều thú vị nhất là việc giảm đáng kể thời gian và chi phí. Một nhà phát triển đã nói với chúng tôi rằng thời gian của họ để tạo ý tưởng nghệ thuật cho một hình ảnh duy nhất, từ đầu đến cuối, đã giảm từ 3 tuần xuống còn một giờ: giảm 120 trên 1. Chúng tôi tin rằng những khoản tiết kiệm tương tự sẽ có thể thực hiện được trên toàn bộ quy trình sản xuất.

Rõ ràng, các nghệ sĩ không có nguy cơ bị thay thế. Điều đó có nghĩa là các nghệ sĩ không còn cần phải tự mình làm tất cả công việc nữa: giờ đây họ có thể thiết lập hướng sáng tạo ban đầu, sau đó giao phần lớn thời gian và kỹ thuật thực hiện cho AI. Về mặt này, họ giống như những họa sĩ cel từ những ngày đầu của hoạt hình vẽ tay, trong đó những “thợ mực” có tay nghề cao vẽ các đường viền của hoạt hình, và sau đó đội quân “họa sĩ” chi phí thấp hơn sẽ thực hiện công việc vẽ tranh tốn nhiều thời gian. hoạt hình cels, điền vào các dòng. Đó là "tự động hoàn thành" để tạo trò chơi.

5. Chúng ta vẫn đang ở giai đoạn sơ khai của cuộc cách mạng này và rất nhiều thực hành vẫn cần được hoàn thiện

Bất chấp tất cả sự phấn khích gần đây, chúng tôi vẫn chỉ ở vạch xuất phát. Có rất nhiều công việc phía trước khi chúng tôi tìm ra cách khai thác công nghệ mới này cho trò chơi và những cơ hội to lớn sẽ được tạo ra cho những công ty nhanh chóng tiến vào không gian mới này.

MỤC LỤC

Dự đoán

Với những giả định này, đây là một số dự đoán về cách ngành công nghiệp trò chơi có thể được chuyển đổi:

1. Học cách sử dụng AI sáng tạo một cách hiệu quả sẽ trở thành một kỹ năng có thể bán được

Chúng tôi đã thấy một số người thử nghiệm sử dụng AI sáng tạo hiệu quả hơn những người khác. Để tận dụng tối đa công nghệ mới này, bạn cần sử dụng nhiều công cụ và kỹ thuật khác nhau cũng như biết cách kết hợp giữa chúng. Chúng tôi dự đoán điều này sẽ trở thành một kỹ năng có thể bán được trên thị trường, kết hợp tầm nhìn sáng tạo của một nghệ sĩ với các kỹ năng kỹ thuật của một lập trình viên.

Chris Anderson nổi tiếng với câu nói: “Mọi sự phong phú đều tạo ra sự khan hiếm mới”. Khi nội dung trở nên phong phú, chúng tôi tin rằng chính những nghệ sĩ biết cách làm việc cộng tác và hiệu quả nhất với các công cụ AI sẽ là những người bị thiếu hụt nhiều nhất.

Ví dụ: để sử dụng AI sáng tạo cho tác phẩm nghệ thuật sản xuất mang đến những thách thức đặc biệt, bao gồm:

  • Tính mạch lạc. Với bất kỳ nội dung sản xuất nào, bạn cần có khả năng thực hiện các thay đổi hoặc chỉnh sửa nội dung trong tương lai. Với một công cụ AI, điều đó có nghĩa là cần có khả năng tái tạo nội dung với cùng một lời nhắc, để sau đó bạn có thể thực hiện các thay đổi. Điều này có thể phức tạp vì cùng một lời nhắc có thể tạo ra các kết quả rất khác nhau.
  • Phong cách. Điều quan trọng đối với tất cả tác phẩm nghệ thuật trong một trò chơi nhất định là phải có một phong cách nhất quán – điều đó có nghĩa là các công cụ của bạn cần được đào tạo hoặc gắn với phong cách nhất định của bạn.

2. Hạ thấp các rào cản sẽ dẫn đến việc chấp nhận rủi ro và khám phá sáng tạo hơn

Chúng ta có thể sẽ sớm bước vào một “thời kỳ hoàng kim” mới của việc phát triển trò chơi, trong đó rào cản gia nhập thấp hơn dẫn đến sự bùng nổ của nhiều trò chơi đổi mới và sáng tạo hơn. Không chỉ vì chi phí sản xuất thấp hơn dẫn đến rủi ro thấp hơn mà còn vì những công cụ này mở ra khả năng tạo nội dung chất lượng cao cho nhiều đối tượng hơn. Dẫn đến dự đoán tiếp theo…

3. Sự gia tăng các “studio trò chơi vi mô” được hỗ trợ bởi AI

Được trang bị các công cụ và dịch vụ AI Sáng tạo, chúng ta sẽ bắt đầu thấy nhiều trò chơi thương mại khả thi hơn được sản xuất bởi các “studio siêu nhỏ” nhỏ chỉ gồm 1 hoặc 2 nhân viên. Ý tưởng về một studio game indie nhỏ không phải là mới – game đình đám Giữa chúng ta được tạo ra bởi studio Innersloth chỉ với 5 nhân viên – nhưng quy mô và quy mô trò chơi mà những studio nhỏ này có thể tạo ra sẽ ngày càng lớn. Điều này sẽ dẫn đến…

4. Số lượng game phát hành mỗi năm tăng lên

Thành công của Unity và Roblox đã chỉ ra rằng việc cung cấp các công cụ sáng tạo mạnh mẽ sẽ dẫn đến nhiều trò chơi được xây dựng hơn. AI sáng tạo sẽ hạ thấp tiêu chuẩn hơn nữa, tạo ra nhiều trò chơi hơn nữa. Ngành công nghiệp đã phải đối mặt với những thách thức khám phá - nhiều hơn 10,000 trò chơi đã được thêm vào Steam riêng năm ngoái – và điều này sẽ càng gây thêm áp lực cho việc khám phá. Tuy nhiên chúng ta cũng sẽ thấy…

5. Các loại trò chơi mới được tạo ra mà trước AI Sáng tạo không thể thực hiện được

Chúng ta sẽ thấy các thể loại trò chơi mới được phát minh mà đơn giản là không thể thực hiện được nếu không có AI sáng tạo. Chúng ta đã nói về trình giả lập chuyến bay của Microsoft, nhưng sẽ có những thể loại hoàn toàn mới được phát minh phụ thuộc vào việc tạo nội dung mới theo thời gian thực.

Hãy xem xét Người bắn tên, Bởi bút lông. Đây là một trò chơi nhập vai có các nhân vật do AI tạo ra để chơi trò chơi mới hầu như không giới hạn.

Chúng tôi cũng biết một nhà phát triển trò chơi khác đang sử dụng AI để cho phép người chơi tạo hình đại diện trong trò chơi của riêng họ. Trước đây, họ có một bộ sưu tập các hình ảnh đại diện vẽ tay mà người chơi có thể trộn và kết hợp để tạo hình đại diện của mình - giờ họ đã loại bỏ hoàn toàn bộ sưu tập này và chỉ đơn giản là tạo hình đại diện từ mô tả của người chơi. Cho phép người chơi tạo nội dung thông qua AI sẽ an toàn hơn là cho phép người chơi tải lên nội dung của chính họ từ đầu, vì AI có thể được đào tạo để tránh tạo nội dung xúc phạm, đồng thời mang lại cho người chơi cảm giác sở hữu tốt hơn.

6. Giá trị sẽ tích lũy cho các công cụ AI cụ thể của ngành chứ không chỉ các mô hình nền tảng

Sự phấn khích và bàn tán xung quanh các mô hình nền tảng như Khuếch tán ổn định và Hành trình giữa chừng đang tạo ra những định giá đáng kinh ngạc, nhưng lượng nghiên cứu mới liên tục đảm bảo rằng các mô hình mới sẽ ra đời khi các kỹ thuật mới được cải tiến. Hãy xem xét lưu lượng tìm kiếm trang web đối với 3 mô hình Generative AI phổ biến: Dall-E, Midjourney và Stable Diffusion. Mỗi mô hình mới có lần lượt của nó trong ánh đèn sân khấu.

Một cách tiếp cận khác có thể là xây dựng các bộ công cụ phù hợp với ngành tập trung vào nhu cầu AI Sáng tạo của một ngành nhất định, với sự hiểu biết sâu sắc về một đối tượng cụ thể và tích hợp phong phú vào các quy trình sản xuất hiện có (chẳng hạn như Unity hoặc Unreal cho trò chơi).

Một ví dụ điển hình là Runway hướng đến nhu cầu của người tạo video bằng các công cụ hỗ trợ AI như chỉnh sửa video, xóa màn hình xanh, tô màu và theo dõi chuyển động. Các công cụ như thế này có thể xây dựng và kiếm tiền từ một đối tượng nhất định, thêm các mô hình mới theo thời gian. Chúng tôi chưa thấy một bộ phần mềm nào như Runway dành cho trò chơi xuất hiện, nhưng chúng tôi biết đó là một không gian phát triển tích cực.

7. Những thách thức pháp lý đang đến

Điểm chung của tất cả các mô hình AI Sáng tạo này là chúng được đào tạo bằng cách sử dụng bộ dữ liệu nội dung khổng lồ, thường được tạo bằng cách tự tìm kiếm trên Internet. Ví dụ, Stable Diffusion được đào tạo trên hơn 5 tỷ cặp hình ảnh/chú thích, được lấy từ web.

Tại thời điểm này, các mô hình này đang tuyên bố hoạt động theo học thuyết bản quyền "sử dụng hợp pháp", nhưng lập luận này vẫn chưa được kiểm chứng chắc chắn trước tòa. Có vẻ như rõ ràng rằng những thách thức pháp lý đang đến điều này có khả năng sẽ thay đổi cục diện của AI sáng tạo.

Có thể các hãng phim lớn sẽ tìm kiếm lợi thế cạnh tranh bằng cách xây dựng các mô hình độc quyền dựa trên nội dung nội bộ mà họ có quyền & tiêu đề rõ ràng. Ví dụ, Microsoft có vị trí đặc biệt tốt ở đây với 23 hãng phim bên thứ nhất ngày hôm nay, và 7 khác sau việc mua lại Activision kết thúc.

8. Lập trình sẽ không bị phá vỡ sâu sắc như nội dung nghệ thuật – ít nhất là chưa

Công nghệ phần mềm là chi phí phát triển trò chơi lớn khác, nhưng như các đồng nghiệp của chúng tôi trong nhóm a16z Enterprise đã chia sẻ trong bài đăng blog gần đây của họ, Nghệ thuật không chết, nó chỉ do máy tạo ra, việc tạo mã bằng mô hình AI yêu cầu nhiều thử nghiệm và xác minh hơn, do đó cải thiện năng suất ít hơn so với việc tạo nội dung sáng tạo. Các công cụ viết mã như Copilot có thể mang lại những cải tiến hiệu suất vừa phải cho các kỹ sư, nhưng sẽ không có tác động tương tự… ít nhất là trong tương lai gần.

MỤC LỤC

Khuyến nghị

Dựa trên những dự đoán này, chúng tôi đưa ra các khuyến nghị sau:

1. Bắt đầu khám phá AI sáng tạo ngay bây giờ

Sẽ mất một thời gian để tìm ra cách tận dụng tối đa sức mạnh của cuộc cách mạng AI Sáng tạo sắp tới này. Các công ty bắt đầu bây giờ sẽ có lợi thế sau này. Chúng tôi biết một số hãng phim đang tiến hành các dự án thử nghiệm nội bộ để khám phá cách những kỹ thuật này có thể tác động đến quá trình sản xuất.

2. Tìm kiếm cơ hội trên bản đồ thị trường

Một số phần trong bản đồ thị trường của chúng tôi đã rất đông đúc, như Ảnh động hoặc Bài phát biểu & Hội thoại, nhưng các lĩnh vực khác vẫn còn rộng mở. Chúng tôi khuyến khích các doanh nhân quan tâm đến không gian này tập trung nỗ lực vào các lĩnh vực vẫn chưa được khám phá, chẳng hạn như “Chạy cho trò chơi”.

MỤC LỤC

Hiện trạng thị trường

Chúng tôi đã tạo một bản đồ thị trường để nắm bắt danh sách các công ty mà chúng tôi đã xác định trong từng danh mục này, nơi chúng tôi thấy AI Sáng tạo đang tác động đến các trò chơi. Bài đăng trên blog này đi qua từng danh mục đó, giải thích chi tiết hơn một chút và nêu bật những công ty thú vị nhất trong mỗi danh mục.

MỤC LỤC

Hình ảnh 2D

Tạo hình ảnh 2D từ lời nhắc văn bản đã là một trong những lĩnh vực được áp dụng rộng rãi nhất của AI tổng quát. Các công cụ như midjourney, Khuếch tán ổn địnhDall-E 2 có thể tạo hình ảnh 2D chất lượng cao từ văn bản và đã tìm được đường vào sản xuất trò chơi ở nhiều giai đoạn của vòng đời trò chơi.

Nghệ thuật Khái niệm

Các công cụ AI sáng tạo rất xuất sắc trong việc “lên ý tưởng” hoặc giúp những người không phải là nghệ sĩ, chẳng hạn như nhà thiết kế trò chơi, khám phá các khái niệm và ý tưởng rất nhanh để tạo ra tác phẩm nghệ thuật ý tưởng, một phần quan trọng của quy trình sản xuất. Ví dụ: một studio (ẩn danh) đang sử dụng một số công cụ này cùng nhau để tăng tốc triệt để quy trình nghệ thuật ý tưởng của họ, chỉ mất một ngày để tạo ra một hình ảnh mà trước đây phải mất tới 3 tuần.

  • Đầu tiên, các nhà thiết kế trò chơi của họ sử dụng Midjourney để khám phá những ý tưởng khác nhau và tạo ra những hình ảnh mà họ thấy truyền cảm hứng.
  • Những thứ này được giao cho một nghệ sĩ ý tưởng chuyên nghiệp, người này sẽ lắp ráp chúng lại với nhau và tô lên kết quả để tạo ra một hình ảnh mạch lạc duy nhất – sau đó được đưa vào Khuếch tán ổn định để tạo ra một loạt các biến thể.
  • Họ thảo luận về các biến thể này, chọn một biến thể, vẽ một số chỉnh sửa theo cách thủ công – sau đó lặp lại quy trình cho đến khi họ hài lòng với kết quả.
  • Ở giai đoạn đó, sau đó chuyển hình ảnh này trở lại Khuếch tán ổn định lần cuối để “nâng cấp” hình ảnh để tạo ra tác phẩm nghệ thuật cuối cùng.

Nghệ thuật sản xuất 2D

Một số studio đã thử nghiệm sử dụng các công cụ tương tự cho tác phẩm nghệ thuật sản xuất trong trò chơi. Ví dụ, đây là một cái đẹp hướng dẫn từ Albert Bozesan về việc sử dụng Khuếch tán ổn định để tạo nội dung 2D trong trò chơi.

MỤC LỤC

Tác phẩm nghệ thuật 3D

Nội dung 3D là khối xây dựng của tất cả các trò chơi hiện đại, cũng như metaverse sắp tới. Thế giới ảo hay cấp độ trò chơi về cơ bản chỉ là một tập hợp các nội dung 3D, được đặt và sửa đổi để đưa vào môi trường. Tuy nhiên, việc tạo nội dung 3D phức tạp hơn tạo hình ảnh 2D và bao gồm nhiều bước bao gồm tạo mô hình 3D và thêm họa tiết cũng như hiệu ứng. Đối với các nhân vật hoạt hình, nó cũng liên quan đến việc tạo một “bộ xương” bên trong, sau đó tạo hoạt ảnh trên bộ xương đó.

Chúng tôi đang chứng kiến ​​một số công ty khởi nghiệp khác nhau thực hiện sau mỗi giai đoạn của quy trình tạo nội dung 3D này, bao gồm tạo mô hình, hoạt ảnh nhân vật và xây dựng cấp độ. Tuy nhiên, đây vẫn chưa phải là một vấn đề đã được giải quyết – chưa có giải pháp nào sẵn sàng được tích hợp hoàn toàn vào sản xuất.

nội dung 3D

Các công ty khởi nghiệp đang cố gắng giải quyết vấn đề tạo mô hình 3D bao gồm Kaedim, MirageGiả thuyết. Các công ty lớn hơn cũng đang xem xét vấn đề, bao gồm cả Nvidia's Nhận3D và Autodesk ClipForge. Kaedim và Get3d tập trung vào image-to-3D; ClipForge và Mirage tập trung vào chuyển văn bản sang 3D, trong khi Hypothetic quan tâm đến cả tìm kiếm chuyển văn bản sang 3D, cũng như chuyển hình ảnh sang 3D.

Kết cấu 3D

Mô hình 3D chỉ trông thực tế khi kết cấu hoặc vật liệu được áp dụng cho lưới. Việc quyết định áp dụng kết cấu đá phong hóa, rêu phong nào cho mô hình lâu đài thời trung cổ có thể thay đổi hoàn toàn giao diện của cảnh. Hoạ tiết chứa siêu dữ liệu về cách ánh sáng phản ứng với vật liệu (tức là độ nhám, độ bóng, v.v.). Việc cho phép các nghệ sĩ dễ dàng tạo kết cấu dựa trên lời nhắc bằng văn bản hoặc hình ảnh sẽ cực kỳ có giá trị đối với việc tăng tốc độ lặp lại trong quy trình sáng tạo. Một số đội đang theo đuổi cơ hội này bao gồm BariAI, sốt PonzuArmorLab.

Hoạt hình

Tạo hoạt hình tuyệt vời là một trong những phần tốn thời gian, tốn kém và khéo léo nhất trong quá trình tạo trò chơi. Một cách để giảm chi phí và để tạo hoạt ảnh chân thực hơn là sử dụng ghi lại chuyển động, trong đó bạn đặt một diễn viên hoặc vũ công trong bộ đồ ghi lại chuyển động và ghi lại chuyển động của họ trong một giai đoạn ghi lại chuyển động được thiết bị đặc biệt.

Hiện chúng ta đang thấy các mô hình AI Sáng tạo có thể chụp hoạt ảnh trực tiếp từ video. Điều này hiệu quả hơn nhiều, vì nó loại bỏ sự cần thiết của một thiết bị chụp chuyển động đắt tiền, và vì nó có nghĩa là bạn có thể chụp hoạt hình từ các video hiện có. Một khía cạnh thú vị khác của các mô hình này là chúng cũng có thể được sử dụng để áp dụng các bộ lọc cho các hoạt ảnh hiện có, chẳng hạn như làm cho chúng trông say xỉn, già nua hoặc vui vẻ. Các công ty theo đuổi không gian này bao gồm Kinetix, chuyển động sâu, Căn bản, di chuyển AiBình hoa.

Thiết kế cấp độ & xây dựng thế giới

Một trong những khía cạnh tốn nhiều thời gian nhất của việc tạo trò chơi là xây dựng thế giới của trò chơi, một nhiệm vụ mà trí tuệ nhân tạo sáng tạo rất phù hợp. Các trò chơi như Minecraft, No Man's Sky và Diablo đã nổi tiếng với việc sử dụng các kỹ thuật thủ tục để tạo cấp độ của chúng, trong đó các cấp độ được tạo ngẫu nhiên, mỗi lần khác nhau nhưng tuân theo các quy tắc do người thiết kế cấp độ đặt ra. Một điểm bán hàng lớn của công cụ trò chơi Unreal 5 mới là bộ sưu tập các công cụ thủ tục dành cho thiết kế thế giới mở, chẳng hạn như vị trí tán lá.

Chúng tôi đã thấy một vài sáng kiến ​​trong không gian, như Promethean, MLXAR, hoặc Meta Bot xây dựngvà nghĩ rằng đó chỉ là vấn đề thời gian trước khi các kỹ thuật tổng quát thay thế phần lớn các kỹ thuật thủ tục. Đã có nghiên cứu học thuật trong không gian trong một thời gian, bao gồm kỹ thuật sáng tạo cho Minecraft or thiết kế cấp độ trong Doom.

Một lý do thuyết phục khác để mong đợi các công cụ AI sáng tạo dành cho thiết kế cấp độ là khả năng tạo cấp độ và thế giới theo các phong cách khác nhau. Bạn có thể tưởng tượng việc yêu cầu các công cụ tạo ra một thế giới ở New York trong kỷ nguyên flapper của những năm 1920, so với tương lai của người chạy bằng kiếm lạc hậu, so với thế giới giả tưởng theo phong cách Tolkien.

Các khái niệm sau đây được tạo ra bởi Midjourney bằng cách sử dụng lời nhắc, “một cấp độ trò chơi theo phong cách…”

Bài nghe

Âm thanh và âm nhạc là một phần quan trọng trong trải nghiệm chơi trò chơi. Chúng tôi bắt đầu thấy các công ty sử dụng Generative AI để tạo âm thanh nhằm bổ sung cho công việc đang diễn ra ở phía đồ họa.

Hiệu ứng âm thanh

Hiệu ứng âm thanh là một lĩnh vực mở hấp dẫn cho AI. Đã có bài báo học thuật khám phá ý tưởng sử dụng AI để tạo ra “foley” trong phim (ví dụ: tiếng bước chân) nhưng chưa có sản phẩm thương mại nào trong trò chơi.

Chúng tôi nghĩ rằng đây chỉ là vấn đề thời gian, vì bản chất tương tác của trò chơi làm cho điều này trở thành một ứng dụng rõ ràng cho AI tổng quát, vừa tạo ra hiệu ứng âm thanh tĩnh như một phần của quá trình sản xuất (“âm thanh súng laze, theo phong cách của Chiến tranh giữa các vì sao”) và tạo hiệu ứng âm thanh tương tác thời gian thực trong thời gian chạy.

Hãy xem xét điều gì đó đơn giản như tạo âm thanh bước chân cho nhân vật của người chơi. Hầu hết các trò chơi giải quyết vấn đề này bằng cách bao gồm một số lượng nhỏ âm thanh bước chân được ghi sẵn: đi trên cỏ, đi trên sỏi, chạy trên cỏ, chạy trên sỏi, v.v. Những âm thanh này rất khó tạo và quản lý, đồng thời âm thanh lặp đi lặp lại và không thực tế trong thời gian chạy.

Một cách tiếp cận tốt hơn sẽ là một mô hình AI tạo ra thời gian thực cho các hiệu ứng âm thanh foley, có thể tạo ra các hiệu ứng âm thanh phù hợp một cách nhanh chóng, hơi khác nhau mỗi lần, phản ứng với các thông số trong trò chơi như mặt đất, trọng lượng của nhân vật, dáng đi, giày dép, v.v.

Âm nhạc

Âm nhạc luôn là một thách thức đối với các trò chơi. Điều này rất quan trọng vì nó có thể giúp thiết lập giai điệu cảm xúc giống như trong phim hoặc truyền hình, nhưng vì trò chơi có thể kéo dài hàng trăm hoặc thậm chí hàng nghìn giờ nên nó có thể nhanh chóng trở nên lặp đi lặp lại hoặc gây khó chịu. Ngoài ra, do tính chất tương tác của trò chơi, âm nhạc có thể khó khớp chính xác với những gì đang diễn ra trên màn hình tại bất kỳ thời điểm nào.

Âm nhạc thích ứng đã là một chủ đề trong âm thanh trò chơi trong hơn hai thập kỷ, bắt nguồn từ “Âm nhạc trực tiếp” hệ thống tạo nhạc tương tác. DirectMusic chưa bao giờ được điều chỉnh rộng rãi, phần lớn là do khó sáng tác ở định dạng này. Chỉ một số trò chơi, như Monolith's Không ai bất tử, đã tạo ra điểm số tương tác thực sự.

Giờ đây, chúng ta đang thấy một số công ty đang cố gắng tạo ra âm nhạc do AI tạo ra, chẳng hạn như âm thanh, Musico, hòa âm, Album vô hạnAiva. Và trong khi một số công cụ ngày nay, như Hộp đựng bởi Open AI, có cường độ tính toán cao và không thể chạy trong thời gian thực, phần lớn có thể chạy trong thời gian thực sau khi mô hình ban đầu được xây dựng.

Lời nói và Đối thoại

Có một số lượng lớn các công ty đang cố gắng tạo ra giọng nói chân thực cho các nhân vật trong trò chơi. Điều này không có gì đáng ngạc nhiên khi xét đến lịch sử lâu dài của việc cố gắng cung cấp cho máy tính một giọng nói thông qua tổng hợp giọng nói. Các công ty bao gồm siêu âm, coqui, Xưởng nhân bản, Giống như.ai, Readloa.ai, Và nhiều hơn nữa.

Có nhiều lợi thế khi sử dụng AI tổng quát cho lời nói, điều này giải thích một phần lý do tại sao không gian này lại đông đúc như vậy.

  • Tạo hộp thoại khi đang di chuyển. Thông thường, bài phát biểu trong trò chơi được ghi âm trước từ các diễn viên lồng tiếng, nhưng chúng chỉ giới hạn ở các bài phát biểu đóng hộp được ghi sẵn. Với hộp thoại AI tổng quát, các nhân vật có thể nói bất cứ điều gì – nghĩa là họ hoàn toàn có thể phản ứng với những gì người chơi đang làm. Kết hợp với các mô hình AI thông minh hơn dành cho NPC (nằm ngoài phạm vi của blog này, nhưng hiện là một lĩnh vực đổi mới thú vị không kém), lời hứa về các trò chơi tương tác hoàn toàn với người chơi sẽ sớm ra mắt.
  • Nhập vai. Nhiều người chơi muốn đóng vai những nhân vật tưởng tượng có chút giống với danh tính trong thế giới thực của họ. Tuy nhiên, tưởng tượng này bị phá vỡ ngay khi người chơi nói bằng giọng nói của chính họ. Sử dụng giọng nói được tạo phù hợp với hình đại diện của người chơi sẽ duy trì ảo ảnh đó.
    Điều khiển. Khi bài phát biểu được tạo, bạn có thể kiểm soát sắc thái của giọng nói như âm sắc, độ uốn, âm vang cảm xúc, độ dài âm vị, trọng âm, v.v.
  • Nội địa hóa. Cho phép dịch hộp thoại sang bất kỳ ngôn ngữ nào và nói bằng cùng một giọng nói. Các công ty như lồng tiếng sâu được tập trung đặc biệt vào niche này.

MỤC LỤC

NPC hoặc nhân vật người chơi

Nhiều công ty khởi nghiệp đang xem xét việc sử dụng AI tổng hợp để tạo ra các nhân vật đáng tin cậy mà bạn có thể tương tác, một phần vì đây là thị trường có khả năng ứng dụng rộng rãi ngoài trò chơi, chẳng hạn như trợ lý ảo hoặc lễ tân.

Những nỗ lực để tạo ra các nhân vật đáng tin cậy bắt đầu từ những ngày đầu nghiên cứu AI. Trên thực tế, định nghĩa của “Thử nghiệm Turing” cổ điển dành cho trí tuệ nhân tạo là con người không thể phân biệt giữa cuộc trò chuyện giữa AI với con người.

Tại thời điểm này, có hàng trăm công ty đang xây dựng các chatbot có mục đích chung, nhiều công ty trong số đó được hỗ trợ bởi các mô hình ngôn ngữ giống như GPT-3. Một số nhỏ hơn đang cố gắng xây dựng chatbot cho mục đích giải trí, chẳng hạn như Trả lờiAnima những người đang cố gắng xây dựng những người bạn ảo. Khái niệm hẹn hò với bạn gái ảo, như được khám phá trong phim Her, có thể gần gũi hơn bạn nghĩ.

Chúng tôi hiện đang chứng kiến ​​sự lặp lại tiếp theo của các nền tảng chatbot này, chẳng hạn như uy tín.ai, convai.com, hoặc là thế giới.ai, có nghĩa là cung cấp năng lượng cho các nhân vật 3D được kết xuất đầy đủ, có cảm xúc và quyền tự quyết, với các công cụ cho phép người tạo đưa ra các mục tiêu cho các nhân vật này. Điều này rất quan trọng nếu chúng sẽ phù hợp với một trò chơi hoặc có một vị trí tường thuật trong việc thúc đẩy cốt truyện về phía trước, thay vì chỉ đơn thuần là thay đồ cho cửa sổ.

MỤC LỤC

Nền tảng tất cả trong một

Một trong những công cụ AI tổng hợp thành công nhất nói chung là Runwayml.com, vì nó tập hợp nhiều bộ công cụ dành cho người sáng tạo trong một gói duy nhất. Hiện tại không có nền tảng nào như vậy phục vụ trò chơi điện tử và chúng tôi nghĩ rằng đây là một cơ hội bị bỏ qua. Chúng tôi rất muốn đầu tư vào một giải pháp có tính năng:

  • Toàn bộ các công cụ AI tổng quát bao gồm toàn bộ quy trình sản xuất. (mã, tạo nội dung, kết cấu, âm thanh, mô tả, v.v.)
  • Tích hợp chặt chẽ với các công cụ trò chơi phổ biến như Unreal và Unity.
  • Được thiết kế để phù hợp với quy trình sản xuất trò chơi điển hình.

MỤC LỤC

Kết luận

Đây là thời điểm tuyệt vời để trở thành người sáng tạo trò chơi! Một phần nhờ vào các công cụ được mô tả trong bài đăng trên blog này, việc tạo nội dung cần thiết để xây dựng trò chơi chưa bao giờ dễ dàng hơn thế – ngay cả khi trò chơi của bạn lớn bằng toàn bộ hành tinh!

Thậm chí có thể tưởng tượng một ngày nào đó toàn bộ trò chơi được cá nhân hóa, được tạo riêng cho người chơi, dựa trên chính xác những gì người chơi muốn. Điều này đã có từ lâu trong khoa học viễn tưởng – như “Trò chơi tư duy trí tuệ nhân tạo” trong Trò chơi của Ender, hay boong tàu ba chiều trong Star Trek. Nhưng với các công cụ được mô tả trong bài đăng trên blog này đang phát triển nhanh chóng như hiện tại, không khó để tưởng tượng rằng thực tế này sắp xảy ra.

Nếu bạn là người sáng lập hoặc người sáng lập tiềm năng, quan tâm đến việc xây dựng công ty AI cho Trò chơi, vui lòng liên hệ! Chúng tôi muốn nghe từ bạn!

***

Các quan điểm được thể hiện ở đây là quan điểm của từng nhân viên AH Capital Management, LLC (“a16z”) được trích dẫn và không phải là quan điểm của a16z hoặc các chi nhánh của nó. Một số thông tin nhất định trong đây đã được lấy từ các nguồn của bên thứ ba, bao gồm từ các công ty danh mục đầu tư của các quỹ do a16z quản lý. Mặc dù được lấy từ các nguồn được cho là đáng tin cậy, a16z đã không xác minh độc lập thông tin đó và không đưa ra tuyên bố về tính chính xác hiện tại hoặc lâu dài của thông tin hoặc sự phù hợp của nó đối với một tình huống nhất định. Ngoài ra, nội dung này có thể bao gồm các quảng cáo của bên thứ ba; a16z đã không xem xét các quảng cáo đó và không xác nhận bất kỳ nội dung quảng cáo nào có trong đó.

Nội dung này chỉ được cung cấp cho mục đích thông tin và không được dựa vào như lời khuyên về pháp lý, kinh doanh, đầu tư hoặc thuế. Bạn nên tham khảo ý kiến ​​của các cố vấn của riêng mình về những vấn đề đó. Các tham chiếu đến bất kỳ chứng khoán hoặc tài sản kỹ thuật số nào chỉ dành cho mục đích minh họa và không cấu thành khuyến nghị đầu tư hoặc đề nghị cung cấp dịch vụ tư vấn đầu tư. Hơn nữa, nội dung này không hướng đến cũng như không nhằm mục đích sử dụng cho bất kỳ nhà đầu tư hoặc nhà đầu tư tiềm năng nào và không được dựa vào bất kỳ trường hợp nào khi đưa ra quyết định đầu tư vào bất kỳ quỹ nào do a16z quản lý. (Đề nghị đầu tư vào quỹ a16z sẽ chỉ được thực hiện bởi bản ghi nhớ phát hành riêng lẻ, thỏa thuận đăng ký và các tài liệu liên quan khác về bất kỳ quỹ nào như vậy và phải được đọc toàn bộ.) Bất kỳ khoản đầu tư hoặc công ty danh mục đầu tư nào được đề cập, đề cập đến, hoặc được mô tả không phải là đại diện cho tất cả các khoản đầu tư vào xe do a16z quản lý và không thể đảm bảo rằng các khoản đầu tư sẽ sinh lời hoặc các khoản đầu tư khác được thực hiện trong tương lai sẽ có các đặc điểm hoặc kết quả tương tự. Danh sách các khoản đầu tư được thực hiện bởi các quỹ do Andreessen Horowitz quản lý (không bao gồm các khoản đầu tư mà tổ chức phát hành không cho phép a16z tiết lộ công khai cũng như các khoản đầu tư không thông báo vào tài sản kỹ thuật số được giao dịch công khai) có tại https://a16z.com/investments /.

Các biểu đồ và đồ thị được cung cấp bên trong chỉ nhằm mục đích cung cấp thông tin và không nên dựa vào khi đưa ra bất kỳ quyết định đầu tư nào. Hiệu suất trong quá khứ không cho thấy kết quả trong tương lai. Nội dung chỉ nói kể từ ngày được chỉ định. Mọi dự đoán, ước tính, dự báo, mục tiêu, triển vọng và / hoặc ý kiến ​​thể hiện trong các tài liệu này có thể thay đổi mà không cần báo trước và có thể khác hoặc trái ngược với ý kiến ​​của người khác. Vui lòng xem https://a16z.com/disclosures để biết thêm thông tin quan trọng.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img