ゼファーネットのロゴ

ディープサイエンス:芸術と手紙におけるAIの冒険

日付:

AIニュースはまだまだあります 誰もがおそらく追いつくことができるよりもそこに。 しかし、このコラムでは、世界中からAIと機械学習の進歩を収集し、それらがテクノロジー、スタートアップ、または文明にとって重要である理由を説明する、最も興味深い開発について、許容範囲内で最新の状態を保つことができます。

気楽なメモから始める:研究者が機械学習を芸術に適用する方法は常に興味深いものですが、常に実用的であるとは限りません。 ワシントン大学のチームは、コンピュータービジョンシステムが、鍵盤とプレーヤーの手の俯瞰図から、ピアノで何が演奏されているかを知ることができるかどうかを確認したいと考えていました。

オーデオ、Eli Shlizerman、Kun Su、Xiulong Liuによってトレーニングされたシステムは、ピアノ演奏のビデオを視聴し、最初にピアノロールのような単純なキー押下のシーケンスを抽出します。 次に、プレスの長さと強さの形で表現を追加し、最後にそれを研磨してMIDIシンセサイザーに入力して出力します。 結果は少し緩いですが、間違いなく認識できます。

ピアノ奏者が鍵盤を握っているビデオがMIDIシーケンスに変換される様子を示す図。

画像のクレジット: シュライザーマン他al

「音楽演奏で演奏できるように聞こえる音楽を作成することは、以前は不可能であると信じられていました」とShlizerman氏は述べています。 「アルゴリズムは、音楽の生成に関連するビデオフレームの手がかり、つまり「機能」を把握する必要があり、ビデオフレーム間で発生する音を「想像」する必要があります。 それには、正確で想像力に富んだシステムが必要です。 かなりいい音の音楽を実現できたのは驚きでした。」

芸術と手紙の分野からのもう一つは、この非常に魅力的な研究です 計算による展開 繊細すぎて扱えない古代の手紙の。 MITチームは、17世紀の「ロックされた」文字を調べていました。これらの文字は非常に複雑に折りたたまれて密封されているため、文字を取り外して平らにすると、永久に損傷する可能性があります。 彼らのアプローチは、文字をX線撮影し、結果の画像を解読するための新しい高度なアルゴリズムを設定することでした。

手紙のX線写真と、それを分析して仮想的に展開する方法を示す図。

手紙のX線ビューと、それを分析して仮想的に展開する方法を示す図。 画像のクレジット: マサチューセッツ工科大学(MIT)

「アルゴリズムは、紙の層を分離するという印象的な仕事をすることになりますが、それらの極端な薄さとそれらの間の小さなギャップにもかかわらず、スキャンの解像度よりも低い場合があります」とMITのエリック・デメインは言いました。 「それが可能かどうかはわかりませんでした。」 この作業は、単純なX線技術では解明が難しい多くの種類の文書に適用できる可能性があります。 これを「機械学習」として分類するのは少し難しいですが、含めないのは面白すぎました。 で完全な論文を読む ネイチャー·コミュニケーションズ.

電気自動車の充電ポイントのレビューを示す図が分析され、有用なデータになります。

画像のクレジット: アセンシオ他al

電気自動車の充電ポイントに到着し、使用できなくなっていることがわかりました。 あなたも悪いレビューをオンラインに残すかもしれません。 実際、そのようなレビューは何千も存在し、電気自動車のインフラストラクチャを拡張しようとしている自治体にとって潜在的に非常に有用なマップを構成しています。

ジョージア工科大学のオマールアセンシオ 自然言語処理モデルのトレーニング そのようなレビューについて、そしてそれはすぐに何千ものそれらを解析し、停止が一般的であった場所、比較コストおよび他の要因のような洞察を絞り出すことの専門家になりました。

PrimeXBTをチェックアウト
ACミランの公式CFDパートナーとの取引
暗号を取引する最も簡単な方法。
出典:https://techcrunch.com/2021/03/05/deep-science-ai-adventures-in-arts-and-letters/

スポット画像

最新のインテリジェンス

スポット画像

私たちとチャット

やあ! どんな御用でしょうか?