审稿人或难识别AI撰写的论文摘要
发布时间:2023-01-17 来源:科技日报
据近日发表在预印本服务器bioRxiv上的一项研究,人工智能(AI)聊天机器人ChatGPT已可写出令人信服的假研究论文摘要,甚至连审稿科学家也无法发现。
聊天机器人ChatGPT会根据用户提示创建逼真文本,它通过消化大量现有的人类生成文本来学习执行任务。美国的软件公司OpenAI于去年11月发布了该工具,并供用户免费使用。
自发布以来,研究人员一直在努力解决相关伦理道德问题,因为它大部分输出可能很难与人类撰写的文本区分开来。近日美国西北大学的一个研究小组使用ChatGPT生成人工研究论文摘要,以测试科学家是否可辨别它们。
研究人员要求机器人基于发表在《美国医学会杂志》《新英格兰医学杂志》《英国医学杂志》《柳叶刀》和《自然·医学》上的50篇研究编写摘要。然后,他们通过抄袭检测器和AI输出检测器将这些摘要与原始摘要进行比较,并要求一组医学研究人员找出编造的摘要。
结果,ChatGPT生成的摘要通过了抄袭检查器,原创性得分中位数为100%,表明没有检测到抄袭。人工智能输出检测器发现了66%的生成摘要,但人工审稿人只正确识别了68%的生成摘要和86%的真实摘要,他们错误地将生成摘要中的32%识别为真实,将14%的真实摘要识别为编造。
研究人员称,ChatGPT写出了能骗过人类的科学摘要,如果科学家无法确定研究是否属实,或会产生“可怕的后果”。
研究人员表示,在虚假信息会危及人们生命安全的医学等领域,期刊需要采取更严格的方法来验证信息的准确性。而这些问题的解决方案,不应集中在机器人本身,“而是导致这种行为的不正当激励措施,例如通过论文数量进行招聘和晋升审查,而不考虑其质量或影响”。