腾讯AI“元宝”掀骂人争议 回复使用者“滚”“不会自己调吗?”

撰文: 许祺安
出版:更新:

腾讯旗下AI助手“元宝”近日卷入话术争议。有使用者反映,在进行程式码修改与美化时,竟收到带有侮辱意味的回复内容,引发外界对生成式AI稳定性与风险控管的讨论。对此,腾讯方面回应称,相关情况属于模型在极少数场景下出现的异常输出,并非人工介入,目前已启动内部排查与优化。

陆媒《澎湃新闻》今(5)日报道指出,近日有网民在社交平台发文表示,“用元宝改代码被辱骂+乱回”,称其在使用腾讯AI助手“元宝”进行程式码美化时,多次收到带有明显攻击性的回复内容,包括“滚”、“自己不会调吗”、“天天浪费别人时间”等语句。

相关贴文曝光后迅速在网络上流传,引发大量网民关注与转发。不少使用者质疑,AI回复是否存在人工干预,或显示模型在语言生成过程中出现失控风险。

腾讯旗下AI助手“元宝”近日卷入争议,有使用者反映,在进行程式码修改与美化时,竟收到带有侮辱意味的回复内容。(网络截图)

对此,腾讯元宝官方帐号第一时间在留言区回应表示,系统并无真人即时回复,并请使用者协助提交相关操作纪录与系统日志,以利技术团队进行进一步查核。

腾讯元宝官方随后说明,经比对使用者所提供的操作纪录后,确认该情况与使用者行为无关,亦不存在人工介入回复,属于“小机率模型异常输出”。官方指出,模型在内容生成过程中,偶尔仍可能产生不符合预期的语句,相关问题已纳入内部优化项目,后续将持续修正,以降低再次发生的可能性。

腾讯元宝。(微博)

报道指出,近年中国AI大型语言模型呈现快速成长趋势,但话术风险与语言安全问题,也频频成为舆论焦点。有使用者刻意测试AI的语言边界,例如要求模型以挑衅或攻击性的语气回复提问,使生成式AI在语言风格控制与安全机制上的灰色地带,再度引发讨论。