和风网标志

乐于助人的助手、浪漫的伴侣,还是骗子?第二部分 » CCC 博客

日期:

CCC 在今年的 AAAS 年会上支持了三场科学会议,如果您无法亲自参加,我们将回顾每场会议。今天,我们将总结本次会议问答部分的亮点,“大型语言模型:乐于助人的助手、浪漫的伴侣还是骗子?” 该小组由 玛丽亚·基尼博士, CCC 理事会成员、明尼苏达大学计算机科学与工程教授,特色 埃斯·卡马尔博士,微软研究院人工智能前沿董事总经理, 哈尔·道梅三世博士,马里兰大学计算机科学教授, 乔纳森·梅博士,南加州大学信息科学研究所计算机科学教授。

以下是问答部分的精彩摘要 大型语言模型:乐于助人的助手、浪漫的伴侣还是骗子?=控制板。 AI有爱的能力吗?这些模型可能会对孩子产生什么样的影响?美国的人工智能能力如何?请了解以下内容:

问:在多语言、多文化环境下部署人工智能语言模型时,我们应该采取哪些做法?

梅博士:在发展技术和降低壁垒的过程中,应该让人们更容易做他们想做的事情。每个人都想做的事情,而不仅仅是我。感谢人工智能,很高兴关注我,但我们应该关注世界其他地方。

问:其中一些普遍性问题——这并不是第一次被提出。看来社区不会自己解决这些问题。我想知道你们是否都对如何将这些对话付诸行动有想法?

卡马尔博士:许多不同的团体都可以扮演不同的角色。评估对于代表不同文化和人群非常重要。当数据集在世界代表性方面不具有多样性时,生成的系统就不具有代表性。在形成评估最佳实践、法规和合规措施方面需要做大量工作。白宫已经做出了承诺,人工智能权利法案蓝图正在启动。整个行业已经实施了一些流程,许多伟大的思想家一起工作(并不完美,但跨行业推广是有潜力的)。正在召开一些会议,以就当前开始的标准达成一致;可能在未来的监管中。我们如何进行评估、安全分析等?这些对话都不具备房间内所需的多样性。考虑一下做出决定时谁需要在场。

Daumé 博士:我认为当人们谈论监管时,尤其是在人工智能领域,每个人都会想到惩罚性监管。但这也可以激励监管。资助政策制定者和国家科学基金会可以促进开发有助于我们国家和世界的工具。

问:与世界其他地方相比,美国对人工智能的资助远远落后。 NSF的新投资约为20万美元,与行业投资相比,这只是微不足道的。联邦政府多年来一直发布研究报告,结论是美国必须行动起来。我喜欢 Ece 的相变类比。数字的热力学极限正在增长。我们想要开放的人工智能,谁来为此买单?钱不够。您有什么建议?开放人工智能?但我们甚至没有开放获取出版。您会建议总统不要立法吗?

梅博士:我认为有钱;有人对我说,你已经成功说服政府旋转粒子,但未能将其转移给我们。

卡马尔博士:构建这些模型的公司之所以获得这些输出,是通过资源的集中化。从规模中你可以得到很多东西。应该考虑如何集中对学术界的投资,以便我们获得共享资源,而不是拥有许多不同的模型。我们看到这不仅仅是规模的问题。这不是我们现在必须做的事情,但当前的架构并不好。拥有良好的人工智能能力不应该仅仅意味着更多的钱和更多的权力。

问:答案中存在过度代表性偏差。我们知道它从哪里来吗?我是一个数学专家,我的想法是舍入误差的复合会增加偏差?如果平等代表,我想它会输出平等代表,或者它仍然存在吗?

May 博士:很大程度上取决于尖峰函数。软最大值是训练的重要组成部分。最高的人想成为#1。这并不是说有一些完美的语言输出,但我们希望有一些偏见”。我们只是想尽量减少对人们的伤害,但很多时候我们并没有意识到这些。不理解的部署是一个问题。 

Daumé 博士:这些模型面临的挑战之一是不再有狭隘的人工智能模型。他们说他们可以做任何事情,所以很难测试所有事情。

问:您提到人工智能是一种工具还是替代品,您认为它会朝哪个方向发展?

Daumé 博士:有更多的钱用于更换。

Q:标题提到了浪漫的AI。我想了解更多。

梅博士:模型没有足够的意图让它们成为可行的浪漫替代品,但它们与人类一样善于识别模式,即使它们不存在。

Kamar 博士:我建议你不要像现在这样思考人工智能。尝试展望未来——想象几年后,这些系统将为您量身定制。您与该系统有何关系?

梅博士:但它会爱你吗?

卡玛博士:它会告诉你它爱你。

May博士:但这就足够了吗?

问:我想听听非人工智能领域人士的建议。我们如何使用这些工具?我们应该知道什么?

Daumé 博士:在马里兰大学,我们经常进行此类对话。我可以很容易地说新闻业将在五年内发生变化,其他领域也是如此。说教授的角色在 5 年后将会发生变化,这让人感到不舒服,但它确实会发生变化。我的一些同事在提案和论文中使用不同的 LLM 插件;这已经发生了。我经常有工具写的考试题,但我必须检查准确性。写考试题并不能给我带来快乐,所以人工智能可以帮我解决这个问题。在高等教育中,我们必须更多地思考这一点。它如何改变我们的工作?大学里正在进行很多讨论,但没有大量的资源共享。

问:未来在考虑军事应用时,人工智能的评价有多受欢迎?本次会议没有提及军事应用——我知道如果我对人们的理解不正确,那么在这个话题上就会存在意见分歧。

梅博士:军事领域很广泛,我的很多工作都是由国防部赞助的。很难具体回答,总的来说,国防部(不代表他们说话)似乎优先考虑美国的安全和保障,并将继续这样做,并利用法学硕士和人工智能来帮助美国安全。

卡马尔博士:我们还需要谈谈双重用途。如果你在生物学或网络安全领域进行军事工作,我们可以利用我们现在拥有的非常有前途的工具并使用它们,因为我们需要安全的系统和新药物。但每一次良好的使用都会有一个糟糕的使用。我们不希望在哪些用例中使用人工智能?在开源应用程序中,人们可以复制这些模型。在这些情况下,我们如何防止人们造成伤害?

问:当与语言模型交互时,成年人知道它不是活着的/自我意识的,但几代人之后呢?自从他们记得社交以来就一直有这种情况的孩子吗?他们有一个完全人工智能的导师或老师;该系统嵌入了一名讲师。他们可以与指令建立联系,认为他们有很好的关系,然后程序就会被删除。与非人实体的社会情感联系的儿童心理学是什么?

卡马尔博士:我们需要研究,跨学科研究,而且我们需要尽快完成。 5年后,我们可能会得到这些答案,但那时人工智能可能会成为我10岁孩子生活的重要组成部分。你的问题非常重要。有研究表明,即使是无辜的系统也可能有后门。我们今天需要安全专家和儿童发展专家进行这些对话。

Daumé 博士:我不知道是否有人还记得监视芭比娃娃——这里存在很大的隐私问题。这是一个更有趣的社会问题。反应被调整为过于积极。孩子们会说“我很生气,因为莎莉没有和我一起玩”之类的话,而且它没有给出适合社交的建议。我担心非常积极的代理人,因为积极并不总是正确的答案。

非常感谢您的阅读,请继续关注 AAAS 2024 年第三次也是最后一次小组讨论的回顾。

现货图片

最新情报

现货图片