公众号
“医学论文与统计分析”公众号
扫码关注公众号

统计咨询
“公共数据库与孟德尔随机化”公众号
扫码关注公众号

意见反馈
邮箱:17357190071@163.com
微信:aq566665

25年来,中国17.79万篇癌症论文产自“论文工厂”,占比高达35%

Administrator
发布于 2025-09-10 / 12 阅读
0
0

近日,一项研究在bioRxiv发表未经同行评审的预印本,题为:揭示“论文工厂”冰山:基于人工智能的癌症研究文献筛查。

“论文工厂“(Paper Mills)是专门炮制、代写假论文牟利的欺诈组织,正在成为学术界的一大毒瘤。它们不仅污染了科学的正确性,更可能误导未来的研究方向,特别是像癌症这样的重大疾病领域。

这项研究利用机器学习模型对过去25年的癌症研究文献进行了一次“大扫描”,结果显示,截止至 2025 年 3 月,中国累计发表 17.8 万篇癌症方面的研究论文,但其中高达 35%可能来自于论文工厂。

在癌症研究文献中已发现论文工厂的论文,其中一些论文表现出模板化使用的特征,句子似乎是事先预制的。

在这项研究中,研究者使用因论文工厂撤稿的癌症论文作为训练集,用于训练一个 AI 工具,以检查癌症论文的标题和摘要,判断至今已发表的癌症论文是否存在论文工厂的痕迹,模型的预测准确率达 0.91,展现出强大的判别能力

接着,应用模型对1999年至2024年的癌症研究进行筛查后发现:

1.整体比例惊人

在所有癌症研究论文中,有 9.87%(约 26.1万篇)被模型标记为“疑似论文工厂出品”(95% CI 9.83-9.90)。

2.数量呈指数级增长

在2020年代初后,每年新发表的癌症论文中,有超过15% 是可疑论文。

  • 1999-2022年,每年被标记的论文数量呈指数级增长;

  • 2022年,被标记论文数量达到顶峰,16.6%;

  • 2023-2024年,出现小幅度回落。

3.中国作者被标记论文占比最高,数量最多

每个国家被标记论文的百分比显示,来自中国的论文最常被标记,占癌症论文的35%,有177,907篇被标记,其次是伊朗(20%)、沙特阿拉伯(16%)、埃及(15%)、巴基斯坦(14%)和马来西亚(13%)。

就被标记论文的数量而言,美国是第二大国家,有10,511篇被标记的论文,但仅占美国癌症研究论文的2%。

4. 高影响因子期刊同样沦陷

论文工厂并非只活跃于低影响力期刊。在影响力排名前10%的期刊中,被标记的论文比例也在持续上升,到2022年已约占10%

5. 特定癌症类型是重灾区

被标记的比例最高的癌症包括胃癌、骨癌、肝癌(分别占22%21%19%)。

老郑小评

这项研究发现了一个多么吓人的趋势:连那些最难发的顶级期刊里,”论文工厂“的论文也越来越多了!

这些“论文工厂”也在卷,学术野心日益膨胀。所以,期刊、审稿人和搞科研的,真的得打起精神,多留个心眼了。

总之!这样的结果触目惊心!癌症研究领域居然也成重灾区。

参考文献:Scancar B, Byrne J A, Causeur D, et al. Revealing the Paper Mill Iceberg: AI-Based Screening of Cancer Research Publications[J]. bioRxiv, 2025: 2025.08. 29.673016.
doi: https://doi.org/10.1101/2025.08.29.673016


评论

收银台

订单信息

应付金额 积分

模块介绍

请加我们助教二维码或加入Zstats使用群
Zstats交流群

Zstats交流群

助教二维码

联系助教

选择支付方式

请输入助教告诉您的积分券

如果不填写积分券,将直接使用当前余额支付

正在创建订单...

请稍候,正在为您生成支付订单

支付二维码

请使用扫描二维码完成支付

等待支付中...

二维码获取失败

支付二维码获取失败,请点击重新获取

正在处理余额支付...

请稍候,正在为您完成支付

正在处理充值并支付...

正在使用积分券兑换,然后完成支付 正在使用当前余额完成支付

支付成功!

您的订单已支付完成,页面将在 秒后自动关闭

支付失败

支付过程中出现错误,请重新选择支付方式

平台说明