Copyright 2011-2025 看报纸 版权所有 京ICP备2012156892号
是AI生成的?近日,AI检测工具屡屡爆出“翻车”的新闻,如《荷塘月色》被标注“62.88%AI率”,《三体》片段被标红警示,引发公众对AI检测工具科学性的热议。
为探究AI检测工具的识别能力与技术原理,南方都市报、南都大数据研究院选取了国内10款热门的文本、图片AIGC检测工具进行了抽样测评。结果显示:文本检测工具中,检测标准参差不齐,明显误判、漏检、乱检的情况均有存在。而图片检测工具中,均对PS后的摄影图片难以识别。
当AI检测被用于高校毕业的“门槛”、期刊评审的“硬指标”,一度引发了困惑质疑。在专家看来,当前AI检测技术尚处于探索阶段,误判或是技术演进的必经过程,强行将不稳定的技术跟学术诚信关联不可取。但长远来看,技术迭代与合规框架构建仍需“双轨并行”。
AI文本检测
存误判、漏检、乱检“难题”
AI检测工具靠谱吗?南都大数据研究院本次测评样本为知网、PaperPass、万方、维普、朱雀大模型检测、挖错网、大雅、PaperYY、团象、茅茅虫共10款国内热门的文本、图片AIGC检测工具。
首先是文本类检测,尝试使用四类文章来测试对真实文章、以及不同程度AI生成内容的识别率。四篇文章分别是:老舍原著《林海》(含AI率0)、人工撰写的某学科论文(含AI率0)、使用AI编写的假新闻(含AI率20%)、AI生成的散文《林海》(含AI率100%)。10款测评样本工具均有文本AIGC检测功能,将文章上传后,几分钟内便能得到检测结果。
进行了40次测试后,从结果来看,工具对不同类型文本的识别有精准性差异,AI文本检测仍面临3类待解“难题”:一是将真实文章误判为AI创作比较常见;其次,近半数工具对AI生成内容的敏感度较低,未能准确检测出文章中含有的AI内容;第三,检测缺乏区分度,对无论是真实还是AI生成文章“一视同仁”,存在“乱检”现象。
茅茅虫检测老舍《林海》99.9%是AI
知网、挖错网、团象等放过真“AI”
面对老舍经典文学作品《林海》,有7款工具(知网、PaperPass、维普、朱雀、大雅、PaperYY、挖错网)达到了准确检测,AI检测率为0或趋近于0,而茅茅虫的检测误判率最高,为99.9%,万方将1300余字中的近500字标注为“AI生成”,误判比例达35.6%。对于人工撰写的某学科论文,有4款工具(知网、朱雀、PaperYY、团象)的AI检测率为0,茅茅虫、维普的检测误判率最高,均超过了九成。