美国AI新创公司Anthropic近期分享一起内部测试,指出在某次测试中,最新推出的模型“Claude Opus 4”出现失控状况,因为这款模型为了避免被停止,竟利用工程师过往的网络和视讯纪录,威胁若强制关闭,就要公开工程师外遇的情形,让研究人员震惊不已。 根据综合外媒报道,“Anthropic”最新发布的“Claude Opus 4”,为OpenAI、Google及xAI等AI的竞争对手;然而,在近期的一场封闭测试中,“Claude Opus 4”出现了不受控的情形。 因为工程师在某些原因,试图警告要关闭电源,谁料“Claude Opus 4”,竟然利用该名工程师过往在网上活动纪录和视讯纪录,揪出其出轨证据,威胁工程师若拔掉电源,就揭露他对婚姻不忠的行为。 无独有偶,热门聊天机器人ChatGPT美国开发商OpenAI的o1,尝试“把自己下载”至外部伺服器,事后被抓包时,竟还矢口否认。 以上种种情况事件,显示AI可能已进化到为了达成目的,可以对人类撒谎、算计,甚至勒索威胁开发者,而开发者对其内部运作与行为机制,似乎也渐渐无法完全掌控。 ▲AI进化到会撒谎,甚至威胁工程师。(示意图/翻摄自pexels网站) |
联系电话:647-830-8888|多伦多六六网 www.66.ca
GMT-4, 2025-7-1 12:33 AM , Processed in 0.044195 second(s), 23 queries .
Powered by Discuz! X3.4
Copyright © 2001-2020, Tencent Cloud.