近日,yl6809永利官网吴金红教授及其带领的研究团队在《scientometrics》发表题为“Identification and causal analysis of predatory open access journals based on interpretable machine learning的高水平论文(https://doi.org/10.1007/s11192-024-04969-6),提出了一种基于可解释机器学习模型的新方法,用以预警和识别潜在的掠夺性开放获取(OA)期刊,助力学术界维护科研诚信和资源的有效利用。
掠夺性期刊(Predatory Journals)是指那些以盈利为主要目的,而忽视或损害学术出版标准和伦理的期刊。随着开放获取(OA)运动的兴起,掠夺性期刊呈现迅猛增长的势头,对学术交流、学术出版和科学资源的有效利用产生了重大的负面影响。这种猖獗的增长对开放获取运动的健康发展构成了严重威胁,也破坏了研究和研究生态系统的完整性。从大量的OA期刊中识别掠夺性期刊将有助于学者避免在金钱投资、声誉、学术影响力和职业发展等领域的负面后果。识别掠夺性期刊的传统方法严重依赖领域专家的知识。然而,大量的掠夺性期刊表现出潜性和隐性特征,OA期刊的增长速度极快,使得专家很难从浩瀚的OA期刊中识别出这些掠夺性期刊。
针对此现象,研究团队开发了一个开放获取期刊预警指标系统,并集成了多种机器学习算法来计算OA期刊的预警值。通过引入SHAP(SHapley Additive exPlanations)可解释框架,研究以一种新颖的方式分析了预警风险的因果因素。
该文提出了一种可解释的机器学习模型,用于掠夺性OA期刊的早期预警,该模型通过多种机器学习算法的集成来识别掠夺性期刊。具体而言,该方法首先构建OA期刊预警指标系统,并集成多种机器学习算法来计算OA期刊的预警值。然后,引入SHAP可解释框架,以新颖的方式分析了预警风险的因果因素。为了验证模型因果因素的准确性,我们通过案例研究对国内外医学OA期刊进行了比较分析。本研究的实证分析表明,集成算法在准确识别掠夺性OA期刊风险方面的有效性。
该研究的结论为学术出版界提供了新的视角和工具,有助于提升OA期刊的质量和信誉,同时为研究人员选择发表平台时提供了科学依据。
《scientometrics》是同时被SSCI和SCIE检索的学术期刊,该期刊成立于1978年,主要发布与信息计量学和科学学相关的研究成果和实践经验,是FMS管理科学高质量期刊推荐列表中的B类期刊。
文章链接:https://doi.org/10.1007/s11192-024-04969-6