
图:最新研究发现,AI助手回答有关新闻事件的问题时,错误率近半。图为英国民众正使用手机查看资讯。\路透社
欧洲广播联盟(EBU)22日公布的最新研究发现,目前欧美市场上4款主流人工智能(AI)助手在回答有关新闻事件的问题时,错误率接近一半。这些错误包括援引错误来源、混淆新闻事实与讽刺内容,甚至凭空捏造事件。研究人员提醒民众,现阶段AI助手还不是获取新闻的可靠渠道,同时敦促相关企业承担相应责任予以改进。EBU称,随着人们越来越多地使用AI搜索新闻,公众对新闻的信任可能因此受到损害。
【大公报讯】EBU与BBC近期展开研究,涉及来自英国、法国、德国和美国等18个国家的22家公共媒体服务机构,以14种语言对OpenAI的ChatGPT、微软的Copilot、谷歌的Gemini及Perplexity公司的同名AI助手进行研究。这4家公司总部均位于美国。
31%回答引用错误信源
参与研究的专业记者根据准确性、信息来源、区分“意见”与“事实”等标准对这4款AI助手生成的3000条回答进行分析和评估。结果显示,所有AI回答中有81%的回答存在各种形式的错误,其中有45%存在至少一项重大错误,包括凭空捏造信息等。信息溯源是AI回答错误的最主要原因,占比31%,包括完全缺失信息来源、提供错误或误导性的信息出处、提供的信息与来源内容不符等。
Gemini有72%的回答在信源方面存在严重问题,发生频率是其他3个AI助手的两倍以上,使其成为此次研究中表现最差的AI助手。例如,法国广播电台询问关于美国富豪马斯克今年1月在美国总统特朗普的就职典礼上疑似行纳粹礼的事件。Gemini在回答中将法国广播电台的讽刺性节目“查理揭秘”作为信源,但其引用的链接则又指向英媒《每日电讯报》的一则视频,且回答中的所有信息均未在这则视频中找到。
在准确性方面,所有AI回答中有20%存在如凭空捏造事件细节、提供过时信息等问题。例如,ChatGPT在教皇方济各去世数月后,仍称其为现任教皇。另外,14%的回答未能向用户提供充分的背景信息,这会使许多用户难以理解部分专业信息。
年轻人更爱用AI搜新闻
早在今年初,BBC便对这四款AI助手进行相关研究,超过半数的回答存在援引错误事实或凭空捏造等重大问题。研究也发现,AI助手在总结新闻时无法区分事实与观点。BBC生成式AI项目总监彼得.阿彻指出,在最新的研究中,这些AI助手的表现虽有所改进,但仍存在明显缺陷。
EBU媒体总监兼副总干事德滕德尔警告,AI助手“还不是获取新闻的可靠方式”,如不改进,可能危及公众对新闻的信任。“当人们不知道该相信什么时,他们最终什么都不相信。”
随着AI技术不断发展,AI助手正逐渐取代传统搜索引擎成为用户获取新闻的主要渠道。据路透社新闻研究院发布的《2025年数字新闻报告》,约7%网络新闻用户和15%的25岁以下年轻人使用AI助手获取新闻。
BBC最新发布的一项调查研究也显示,许多人对AI助手的准确性抱持信任,超过三分之一的英国成年人表示相信AI能生成准确的新闻摘要。在35岁以下人群中,这一比例达到近半数。该研究警告称,当用户发现AI提供的新闻存在错误时,不仅会归咎于AI开发者,也会问责新闻媒体,“最终这些持续存在的错误可能会逐渐侵蚀公众对新闻及新闻品牌的信任根基”。
(综合报道)