和風網標誌

樂於助人的助手、浪漫的伴侶,還是騙子?第二部分 » CCC 博客

日期:

CCC 在今年的 AAAS 年會上支持了三場科學會議,如果您無法親自參加,我們將回顧每場會議。今天,我們將總結本次會議問答部分的亮點,“大型語言模式:樂於助人的助手、浪漫的伴侶還是騙子?” 該小組由 瑪麗亞·基尼博士, CCC 理事會成員、明尼蘇達大學電腦科學與工程教授,特色 埃斯·卡馬爾博士,微軟研究院人工智慧前沿董事總經理, 哈爾·道梅三世博士,馬裡蘭大學計算機科學教授, 喬納森·梅博士,南加州大學資訊科學研究所電腦科學教授。

以下是問答部分的精彩摘要 大型語言模式:樂於助人的助手、浪漫的伴侶還是騙子?控制板。 AI有愛的能力嗎?這些模型可能會對孩子產生什麼樣的影響?美國的人工智慧能力如何?請了解以下內容:

Q:在多語言、多文化環境下部署人工智慧語言模型時,我們應該採取哪些做法?

梅博士:在發展技術和降低障礙的過程中,應該讓人們更容易做他們想做的事情。每個人都想做的事情,而不僅僅是我。感謝人工智慧,很高興關注我,但我們應該關注世界其他地方。

Q:其中一些普遍性問題——這並不是第一次被提出。看來社區不會自己解決這些問題。我想知道你們是否都對如何將這些對話付諸行動有想法?

卡馬爾博士:許多不同的團體可以扮演不同的角色。評估對於代表不同文化和人群非常重要。當資料集在世界代表性方面不具多樣性時,生成的系統就不具代表性。在形成評估最佳實踐、法規和合規措施方面需要做大量工作。白宮已經做出了承諾,人工智慧權利法案藍圖正在啟動。整個產業已經實施了一些流程,許多偉大的思想家一起工作(並不完美,但跨產業推廣是有潛力的)。正在召開一些會議,以就目前開始的標準達成一致;可能在未來的監管中。我們如何進行評估、安全分析等?這些對話都不具備房間內所需的多樣性。考慮一下做出決定時誰需要在場。

Daumé 博士:我認為當人們談論監管時,尤其是在人工智慧領域,每個人都會想到懲罰性監管。但這也可以激勵監管。資助政策制定者和國家科學基金會可以促進發展有助於我們國家和世界的工具。

Q:與世界其他地方相比,美國對人工智慧的資助遠遠落後。 NSF的新投資約為20萬美元,與產業投資相比,這只是微不足道的。聯邦政府多年來一直發布研究報告,結論是美國必須採取行動。我喜歡 Ece 的相變類比。數字的熱力學極限正在成長。我們想要開放的人工智慧,誰來買單?錢不夠。您有什麼建議?開放人工智慧?但我們甚至沒有開放取用出版。您會建議總統不要立法嗎?

梅博士:我認為有錢;有人對我說,你已經成功說服政府旋轉粒子,但未能將其轉移給我們。

卡馬爾博士:建構這些模型的公司之所以獲得這些輸出,就是透過資源的集中化。從規模中你可以得到很多東西。應該考慮如何集中對學術界的投資,以便我們獲得共享資源,而不是擁有許多不同的模型。我們看到這不僅僅是規模的問題。這不是我們現在必須做的事情,但目前的架構並不好。擁有良好的人工智慧能力不應該只是意味著更多的錢和更多的權力。

Q:答案中存在過度代表性偏差。我們知道它從哪裡來嗎?我是數學專家,我的想法是捨入誤差的複合會增加偏差?如果平等代表,我想它會輸出平等代表,或者它仍然存在嗎?

May 博士:很大程度取決於尖峰函數。軟最大值是訓練的重要組成部分。最高的人想成為#1。這並不是說有一些完美的語言輸出,但我們希望有一些偏見」。我們只是想盡量減少對人們的傷害,但很多時候我們並沒有意識到這些。不理解的部署是一個問題。 

Daumé 博士:這些模型面臨的挑戰之一是不再有狹隘的人工智慧模型。他們說他們可以做任何事情,所以很難測試所有事情。

Q:您提到人工智慧是一種工具還是替代品,您認為它會朝哪個方向發展?

Daumé 博士:有更多的錢用於更換。

Q:標題提到了浪漫的AI。我想了解更多。

梅博士:模型沒有足夠的意圖讓它們成為可行的浪漫替代品,但它們與人類一樣善於識別模式,即使它們不存在。

Kamar 博士:我建議你不要像現在這樣思考人工智慧。試著展望未來—想像幾年後,這些系統將為您量身訂做。您與該系統有何關係?

梅博士:但它會愛你嗎?

卡瑪博士:它會告訴你它愛你。

May博士:但這就夠了嗎?

Q:我想聽聽非人工智慧領域人士的建議。我們如何使用這些工具?我們應該知道什麼?

Daumé 博士:在馬裡蘭大學,我們經常進行此類對話。我可以很容易地說新聞業將在五年內發生變化,其他領域也是如此。說教授的角色在 5 年後將會發生變化,這讓人感到不舒服,但它確實會發生變化。我的一些同事在提案和論文中使用不同的 LLM 外掛程式;這已經發生了。我經常有工具寫的考試題,但我必須檢查準確性。寫考試題並不能給我帶來快樂,所以人工智慧可以幫我解決這個問題。在高等教育中,我們必須多思考這一點。它如何改變我們的工作?大學裡正在進行很多討論,但沒有大量的資源共享。

Q:未來在考慮軍事應用時,人工智慧的評價有多受歡迎?本次會議沒有提及軍事應用——我知道如果我對人們的理解不正確,那麼在這個主題上就會存在意見分歧。

梅博士:軍事領域很廣泛,我的許多工作都是由國防部贊助的。很難具體回答,總的來說,國防部(不代表他們說話)似乎優先考慮美國的安全和保障,並將繼續這樣做,並利用法學碩士和人工智慧來幫助美國安全。

卡馬爾博士:我們還需要談談雙重用途。如果你在生物學或網路安全領域進行軍事工作,我們可以利用我們現在擁有的非常有前途的工具並使用它們,因為我們需要安全的系統和新藥物。但每一次好的使用都會有一個糟糕的使用。我們不希望在哪些用例中使用人工智慧?在開源應用程式中,人們可以複製這些模型。在這些情況下,我們如何防止人們造成傷害?

Q:當與語言模型互動時,成年人知道它不是活著的/自我意識的,但幾代人之後呢?自從他們記得社交以來就一直有這種情況的孩子嗎?他們有一個完全人工智慧的導師或老師;該系統嵌入了一名講師。他們可以與指示建立聯繫,認為他們有很好的關係,然後程式就會被刪除。與非人實體的社會情感連結的兒童心理學是什麼?

卡馬爾博士:我們需要研究,跨學科研究,而且我們需要盡快完成。 5年後,我們可能會得到這些答案,但那時人工智慧可能會成為我10歲孩子生活中的重要部分。你的問題非常重要。有研究表明,即使是無辜的系統也可能有後門。我們今天需要安全專家和兒童發展專家進行這些對話。

Daumé 博士:我不知道是否有人還記得監視芭比娃娃——這裡有很大的隱私問題。這是一個更有趣的社會問題。反應被調整為過於積極。孩子們會說「我很生氣,因為莎莉沒有和我一起玩」之類的話,而且它沒有給出適合社交的建議。我擔心非常積極的代理人,因為積極並不總是正確的答案。

非常感謝您的閱讀,請繼續關注 AAAS 2024 年第三次也是最後一次小組討論的回顧。

現貨圖片

最新情報

現貨圖片