AI检测怎么做？实测十款工具，这几个把老舍原作误判为AI

是AI生成的？近日，AI检测工具屡屡爆出“翻车”的新闻，如《荷塘月色》被标注“62.88%AI率”，《三体》片段被标红警示，引发公众对AI检测工具科学性的热议。

为探究AI检测工具的识别能力与技术原理，南方都市报、南都大数据研究院选取了国内10款热门的文本、图片AIGC检测工具进行了抽样测评。结果显示：文本检测工具中，检测标准参差不齐，明显误判、漏检、乱检的情况均有存在。而图片检测工具中，均对PS后的摄影图片难以识别。

当AI检测被用于高校毕业的“门槛”、期刊评审的“硬指标”，一度引发了困惑质疑。在专家看来，当前AI检测技术尚处于探索阶段，误判或是技术演进的必经过程，强行将不稳定的技术跟学术诚信关联不可取。但长远来看，技术迭代与合规框架构建仍需“双轨并行”。

AI文本检测

存误判、漏检、乱检“难题”

AI检测工具靠谱吗？南都大数据研究院本次测评样本为知网、PaperPass、万方、维普、朱雀大模型检测、挖错网、大雅、PaperYY、团象、茅茅虫共10款国内热门的文本、图片AIGC检测工具。

首先是文本类检测，尝试使用四类文章来测试对真实文章、以及不同程度AI生成内容的识别率。四篇文章分别是：老舍原著《林海》（含AI率0）、人工撰写的某学科论文（含AI率0）、使用AI编写的假新闻（含AI率20%）、AI生成的散文《林海》（含AI率100%）。10款测评样本工具均有文本AIGC检测功能，将文章上传后，几分钟内便能得到检测结果。

进行了40次测试后，从结果来看，工具对不同类型文本的识别有精准性差异，AI文本检测仍面临3类待解“难题”：一是将真实文章误判为AI创作比较常见；其次，近半数工具对AI生成内容的敏感度较低，未能准确检测出文章中含有的AI内容；第三，检测缺乏区分度，对无论是真实还是AI生成文章“一视同仁”，存在“乱检”现象。

茅茅虫检测老舍《林海》99.9%是AI

知网、挖错网、团象等放过真“AI”

面对老舍经典文学作品《林海》，有7款工具（知网、PaperPass、维普、朱雀、大雅、PaperYY、挖错网）达到了准确检测，AI检测率为0或趋近于0，而茅茅虫的检测误判率最高，为99.9%，万方将1300余字中的近500字标注为“AI生成”，误判比例达35.6%。对于人工撰写的某学科论文，有4款工具（知网、朱雀、PaperYY、团象）的AI检测率为0，茅茅虫、维普的检测误判率最高，均超过了九成。

AI检测怎么做？实测十款工具，这几个把老舍原作误判为AI

媒体报道更多>>

每日读书更多>>

写作分享更多>>

原创笔记更多>>

阅读交流更多>>

学习知识更多>>