此次发布的清华大学2023年国际发文大数据分析报告是利用同舟云学术的AI清洗技术对清华大学2023年国际发文进行采集、清洗和分析得到的。经过前期复杂的数据处理,统计出清华大学2023年国际发文共计17161篇,该统计能够做到相对的完整、全面和精准,是因为同舟云学术在数据采集清洗和分析方面积累了十几年的经验,利用众多优势技术和算法,对学者名称进行规范处理和归一化,并将论文自动认领到其作者名下,算法不仅能够区分同名同机构同专业的不同学者,还可以将同一学者的不同学习或迁徙地址的论文进行合并。同时为了满足机构数据清洗的需求,我们还会以论文为目标,将每篇论文的重要署名作者与现实中的学者进行匹配(例如,#各主题领域高价值国际论文、#全国大三甲医院发表的国际论文分析均采用此方式)。
为了整理清洗和储备更多的中国作者国际发文基础数据,我们将以中国高等院校、科研院所为对象,筛选各机构最近一年的全部论文,将论文的署名作者与机构官网及互联网采集的学者进行匹配,并对学者以第一或通讯作者(包括共同)身份发表的论文进行统计分析,从而得到各高校高产学者的排名。我们希望这份排名及论文分析结果能够帮助读者了解兄弟机构及行业科研发展的最新进展,促进更多的交流与学习。
数据筛选:2023年清华大学参与的总论文数(Journal article 和review)为17161。
数据标注:通过对论文中的重要署名作者进行标注(如Luo, J对应雒建斌教授,Chen, X对应陈新春教授),按照学者以第一作者或通讯作者身份发表的论文数排序,得到学者产出贡献排名结果。
→ 高产学者统计排名如下:
数据统计:在17161篇论文中,第一位作者的第一个署名地址(不计算其他共同第一作者)为清华大学的共计7492篇,包含共同第一作者署名单位为清华大学(按作者全部署名)的共计8645篇。第一作者或通讯作者署名单位为清华大学的按照作者第一个署名地址计算共计10058篇,按照作者全部署名计算共计11365篇。
数据分析:对第一位作者的第一个署名地址(不计算其他共同第一作者)为清华大学的共计7492篇论文进行分析,得到以下结果↓↓↓
说明:高产学者对17161篇论文进行了分析统计,而其他结果则从7492篇论文中进行了统计分析。以上论文数据全部来自于学术期刊网站,学者信息来自于机构官网及互联网公开信息。本文内容仅供科研行业专业人士参考阅读使用。
北京同舟云网络信息技术有限公司的核心技术优势在于数据处理与分析。公司的核心产品包括同舟云学术®、NewPubMed®文献分析系统、机构知识库平台、机构学者库平台、学者论文他引数据平台、学科领域专题特色数据库、机构/学者间学术竞争力对标分析评价系统等。这些产品能为用户提供个性化和定制化的学者、机构、学科、论文评价分析服务;机构学术成果典藏服务;机构学者揭示与评价服务;机构学者间对标评价服务等。