Logo Zephyrnet

Khoa học sâu: Cuộc phiêu lưu của AI trong nghệ thuật và chữ cái

Ngày:

Có thêm tin tức về AI ngoài đó hơn bất kỳ ai có thể theo kịp. Nhưng bạn có thể cập nhật liên tục về những phát triển thú vị nhất với cột này, chuyên mục này thu thập những tiến bộ về AI và máy học từ khắp nơi trên thế giới và giải thích tại sao chúng có thể quan trọng đối với công nghệ, khởi nghiệp hoặc nền văn minh.

Để bắt đầu bằng một lưu ý thú vị: Những cách mà các nhà nghiên cứu tìm ra để áp dụng học máy vào nghệ thuật luôn thú vị — mặc dù không phải lúc nào cũng thực tế. Một nhóm từ Đại học Washington muốn xem liệu hệ thống thị giác máy tính có thể học cách cho biết nội dung đang được chơi trên đàn piano chỉ từ góc nhìn từ trên cao của các phím và tay của người chơi hay không.

âm thanh, hệ thống do Eli Shlizerman, Kun Su và Xiulong Liu đào tạo, xem video chơi đàn piano và lần đầu tiên trích xuất một chuỗi các lần nhấn phím đơn giản giống như cuộn đàn piano. Sau đó, nó thêm biểu thức ở dạng độ dài và độ mạnh của lực nhấn, và cuối cùng đánh bóng nó để nhập vào bộ tổng hợp MIDI cho đầu ra. Kết quả hơi lỏng lẻo nhưng chắc chắn có thể nhận ra.

Sơ đồ hiển thị cách chuyển video bàn tay của người chơi đàn piano trên các phím thành chuỗi MIDI.

Tín dụng hình ảnh: Shlizerman, v.v. tất cả

Shlizerman cho biết: “Để tạo ra thứ âm nhạc giống như có thể chơi trong một buổi biểu diễn âm nhạc trước đây được cho là không thể. “Thuật toán cần tìm ra các tín hiệu hoặc 'đặc điểm' trong khung hình video có liên quan đến việc tạo nhạc và nó cần 'tưởng tượng' âm thanh diễn ra giữa các khung hình video. Nó đòi hỏi một hệ thống vừa chính xác vừa giàu trí tưởng tượng. Việc chúng tôi đạt được thứ âm nhạc nghe khá hay là một điều bất ngờ.”

Một lĩnh vực khác từ lĩnh vực nghệ thuật và thư từ là nghiên cứu cực kỳ hấp dẫn này về mở rộng tính toán của các chữ cái cổ quá tinh tế để xử lý. Nhóm MIT đang xem xét các bức thư “bị khóa” từ thế kỷ 17 được gấp lại và niêm phong phức tạp đến mức nếu gỡ bức thư ra và làm phẳng nó có thể làm hỏng chúng vĩnh viễn. Cách tiếp cận của họ là chụp X-quang các chữ cái và thiết lập một thuật toán mới, tiên tiến để giải mã hình ảnh thu được.

Sơ đồ hiển thị hình ảnh tia X của một chữ cái và cách nó được phân tích để mở nó ra một cách ảo.

Sơ đồ hiển thị hình ảnh X-quang của một chữ cái và cách nó được phân tích để mở nó ra một cách ảo. Tín dụng hình ảnh: MIT

Erik Demaine của MIT cho biết: “Thuật toán cuối cùng đã thực hiện một công việc ấn tượng trong việc tách các lớp giấy, mặc dù chúng cực kỳ mỏng và khoảng cách rất nhỏ giữa chúng, đôi khi nhỏ hơn độ phân giải của bản quét,” Erik Demaine của MIT cho biết. “Chúng tôi không chắc nó có thể thực hiện được.” Công việc này có thể được áp dụng cho nhiều loại tài liệu mà các kỹ thuật X-quang đơn giản khó có thể làm sáng tỏ. Có một chút khó khăn khi phân loại điều này là “máy học”, nhưng thật thú vị nếu không đưa vào. Đọc toàn văn tại Nature Communications.

Biểu đồ hiển thị các đánh giá về điểm sạc ô tô điện được phân tích và biến thành dữ liệu hữu ích.

Tín dụng hình ảnh: Asensio, v.v. tất cả

Bạn đến một điểm sạc cho ô tô điện của mình và thấy rằng nó đã hết dịch vụ. Bạn thậm chí có thể để lại một đánh giá xấu trực tuyến. Trên thực tế, hàng nghìn bài đánh giá như vậy tồn tại và tạo thành một bản đồ tiềm năng rất hữu ích cho các thành phố đang tìm cách mở rộng cơ sở hạ tầng cho xe điện.

Omar Asensio của Georgia Tech đào tạo một mô hình xử lý ngôn ngữ tự nhiên về những đánh giá như vậy và nó nhanh chóng trở thành một chuyên gia trong việc phân tích chúng theo hàng nghìn và đưa ra những hiểu biết sâu sắc như nơi thường xảy ra tình trạng mất điện, chi phí so sánh và các yếu tố khác.

Thanh toán PrimeXBT
Giao dịch với các Đối tác CFD chính thức của AC Milan
Cách dễ nhất để giao dịch tiền điện tử.
Nguồn: https://techcrunch.com/2021/03/05/deep-science-ai-adventures-in-arts-and-letters/

tại chỗ_img

Tin tức mới nhất

tại chỗ_img

Trò chuyện trực tiếp với chúng tôi (chat)

Chào bạn! Làm thế nào để tôi giúp bạn?