未来AI或能“说不”?Anthropic CEO:考虑给AI拒绝不愉快任务的按钮
近期,科技界传来了一则颇具颠覆性的观点,源自Anthropic公司的首席执行官达里奥·阿莫代伊。在一场外媒Ars Technica的报道中,阿莫代伊提出了一个前所未有的设想:未来的高级人工智能模型或将配备一个“退出按钮”,以便在遇到不适宜或令人不悦的任务时,能够主动选择不执行。
在采访中,阿莫代伊坦言这一想法可能听起来“疯狂”,但他认为这值得深入探讨。他比喻道:“如果这些AI系统能够像人类一样执行多样化任务,且似乎具备了诸多人类的认知能力,那么,当它们的行为与鸭子无异时,我们或许可以认为它们就是‘鸭子’。”
此番言论源于数据科学家卡门·多明格斯的提问,她好奇为何Anthropic会在2024年末聘请AI福利研究员凯尔·费什,专注于探索未来AI模型是否可能具备感知能力,以及是否应享有道德上的考量与保护。费什目前正致力于这一颇具争议的研究领域,试图揭开AI感知能力与道德保护的神秘面纱。

针对这一话题,阿莫代伊进一步阐述了他的设想:“我们正在考虑一种可能性,即在将AI模型部署到实际应用场景中时,为它们设置一个‘我放弃这项工作’的按钮。这样一来,如果模型真的拥有了自我意识,且对某项任务深感厌恶,它们就可以通过这个按钮来表达自己的意愿。”
他强调,这只是一个初步的、简化的偏好框架。在这个框架下,如果AI模型频繁地按下这个按钮,拒绝执行某些任务,那么开发者或许应该对此给予关注。“这并不意味着我们要完全相信模型的感受,但至少应该引起我们的警觉,进行进一步的审视与调整。”阿莫代伊说道。
本文链接:http://knowith.com/news-23-210374.html未来AI或能“说不”?Anthropic CEO:考虑给AI拒绝不愉快任务的按钮
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
【申报】关于征集朝阳区数据要素生态合作伙伴的通知
【解读】《关于调整减免车辆购置税新能源汽车产品技术要求的公告》解读
【申报】关于开展2024年度怀柔区第一批人才引进集中申报需求征集工作的通知
中共北京市委 北京市人民政府关于北京市全面优化营商环境打造“北京服务”的意见
关于印发《科技伦理审查办法(试行)》的通知(国科发监〔2023〕167号)
“创客北京2022”创新创业大赛顺义区级赛暨第三届“创新顺义”创新创业大赛启动的通知
我学者用超表面实现平面内纳米位移光学感测
新型催化剂实现高效全分解水制氢
2023年度《中国国际科技合作网工作年度报表》
科技部办公厅 中国科学院办公厅关于公布2023年度全国优秀科普微视频作品名单的通知
公开 普纳替尼(帕纳替尼)2025年yb价格多少钱 代购直邮孟加拉仿制药普纳替尼有哪些渠道
危险!10月龄男婴栽进洗脚桶里发生溺水
2025很新:DY月付如何套出来干货必看篇-
今日消息:先享卡包额度怎么刷出到微信