【摘 要】由于科学研究的复杂性和全球科学技术的快速发展,科研合作成为科学研究的发展趋势,合著论文是科研合作的重要内容。本文采用社会网络分析方法,以人工智能研究领域为例,基于CNKI和WOS论文数据库,应用社会网络分析方法,对合著论文的合作发展趋势进行比较分析,并提出促进合作网络的每个节点科研产出的建议和措施。
【关键词】合作网络;对比分析;科研合作
一、研究背景
科学研究是一项复杂性系统工程,科研工作者之间的相互作用直接影响着科研协作和科研计划的完成。在人类文明进步的历程中,科学研究在相当长的历史都处于相对分散、缺乏组织的状态中,呈现以个体为特征的“自由研究”,科研成果依赖于“大师”和“发明家”的贡献。随着现代科学研究的深入,科研合作的重要性越来越突出,科研合作成为攻克科学难关、促进科技进步重要组织模式。1954年美国政府通过了合作研究法,其是第一个促进教育科研的法令,通过提供财政资助开展教育学科的研究、调查和示范。第三次工业革命以来,科学研究的复杂性加速了科研合作的发展,合作已成为科学研究主流趋势,备受学者们的重视,合著论文已成为是科研合作最显著的表现形式。
我国政府十分重视国际合作开展科学研究,国家自然科学基金每年都专项资助重点国际(地区)合作研究项目,据统计2017年度我国重点合作研究项目申请609项,资助107项(资助率为17.57%),资助金额达2.55亿元。
随着科学技术的快速发展,跨学科科研人员之间的合作成为趋势,表现为科学成果中合著论文逐渐增多,合著规模逐渐增大。近年来,人工智能不仅是学术研究的热点并且是产业推广和行业应用的重点,本文通过对人工智能相关合著论文的研究,可以为人工智能合作研究的绩效分析提供参考。
二、相关研究
科研合作的研究方法主要包括聚类(cluster)、图谱(mapping)和网络分析(network analysis)等。社会网络分析(social network analysis,SNA)是一种社会学研究方法并备受社会学家们的关注,社会网络中的各个复杂特征反映实际生活中社会网络的复杂性,使社会行动者之间抽象的、不可测量的关系实现可视化,因此广泛运用于社会学、管理学、经济学、人类学以及心理学等领域。
在国际合作方面,孙海生(2014)以WOS(Web of science)数据库的相关数据为研究背景,采用加权网络分析方法,构建了国际科学合作网络。牛奉高和邱均平(2015)应用UCINET和NetDraw软件分析中国科研国际合作网络图,解析国际合作的重点学科领域。鲁晶晶等(2015)针对低维碳材料研究为例,探讨国际合作中国家主导的合作研究网络的构建方法。曾静婷和王雯婧(2020)围绕科研竞争力的提升,分析中亚五国的科技合作研究情况。
在区域合作方面,刘芳芳(2016)基于社会网络分析视角,以我国区域为单元,通过分析不同省市的专利数据构建产学研合作网络关系。汪伟全和郑容坤(2019)利用社会网络分析软件对CSSCI数据库文献研究主题进行分析,揭示地方政府合作领域的知识演进和结构关系。周弘(2017)应用CiteSpace分析两岸高等教育合作交流特征及发展趋势。张军亮(2016)通过分析我国自然科学奖项目合作研究情况,构建了自然科学机构合作网络。
在产学研合作方面,蒋勋等(2014)针对国内外官产学研合作研究情况,通过关键词词频聚类分析有关产学研合作的政策措施。牛奉高和李志欣(2019)应用社会网络分析软件Ucinet和聚类分析软件gCLUTO分析高校与企业间的合著论文,建立校企合作网络,分析校企合作机制。占侃和孙俊华(2016)利用社会网络分析江苏省全部高校的校企合作关系,分析高校与各类企业在技术、科研、共建实验室等方面的合作情况。
合作研究可以构建成一个社会网络。社会网络的形式化表示为点和线,通过应用社会网络关系模型来描述合作研究中的结构,表现合作研究信息与知识处理实体的关系和流动的映射与测量,进而分析网络结构对群体功能所产生的影响。
三、科研合作关联性分析
本文应用社会网络集成软件UCINET进行合作研究的社会网络分析。本文选择CNKI数据库作为我国国内研究学术文献的数据来源。数据的检索方式是高级检索,检索策略是主题=“人工智能”,时间跨度为2017—2019年的核心期刊文献。共检索得到文献6889篇,年度发文量逐年上升并广泛被引用,如表1、2所示。
表1 我国人工智能文献数量(2017—2019)
年份 | 2017 | 2018 | 2019 |
发文(篇) | 1490 | 2454 | 2945 |
表2 我国人工智能高被引论文(2017—2019)
序号 | 作者 | 篇名 | 刊名 | 发表年份 | 被引频次 |
1 | 周飞燕,金林鹏,董军 | 卷积神经网络研究综述 | 计算机学报 | 2017 | 1060 |
2 | 吴汉东 | 人工智能时代的制度安排与法律规制 | 法律科学(西北政法大学学报) | 2017 | 586 |
3 | 熊琦 | 人工智能生成内容的著作权认定 | 知识产权 | 2017 | 267 |
4 | 王坤峰,苟超,段艳杰,林懿伦,郑心湖,王飞跃 | 生成式对抗网络GAN的研究进展与展望 | 自动化学报 | 2017 | 262 |
5 | 司晓,曹建峰 | 论人工智能的民事责任:以自动驾驶汽车和智能机器人为切入点 | 法律科学(西北政法大学学报) | 2017 | 249 |
6 | 王迁 | 论人工智能生成的内容在著作权法中的定性 | 法律科学(西北政法大学学报) | 2017 | 241 |
7 | 易继明 | 人工智能创作物是作品吗? | 法律科学(西北政法大学学报) | 2017 | 229 |
8 | 梁志文 | 论人工智能创造物的法律保护 | 法律科学(西北政法大学学报) | 2017 | 181 |
9 | 郑戈 | 人工智能与法律的未来 | 探索与争鸣 | 2017 | 176 |
10 | 刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进 | 深度强化学习综述 | 计算机学报 | 2018 | 171 |
为了有效对比全球科研合作情况,本文以美国科学信息研究所(Institute for Science Information,ISI)出版的Web of Science(WOS)数据库,通过检索主题=“artificial intelligence”,时间跨度为2017—2019年的期刊文献。检索得到文献4618篇,其中高被引的前10篇文献如表3所示。
表3 全球人工智能高被引论文(2017—2019)
序号 | 作者 | 文献标题 | 出版来源 | 发表年份 | 被引频次 |
1 | Esteva, Andre; Kuprel, Brett; Novoa, Roberto A.; Ko, Justin; Swetter, Susan M.; Blau, Helen M.; Thrun, Sebastian | Dermatologist-level classification of skin cancer with deep neural networks | NATURE | 2017 | 1875 |
2 | Litjens, Geert; Kooi, Thijs; Bejnordi, Babak Ehteshami; Setio, Arnaud Arindra Adiyoso; Ciompi, Francesco; Ghafoorian, Mohsen; van der Laak, Jeroen A. W. M.; van Ginneken, Bram; Sanchez, Clara I. | A survey on deep learning in medical image analysis | MEDICAL IMAGE ANALYSIS | 2017 | 1379 |
3 | Shelhamer, Evan; Long, Jonathan; Darrell, Trevor | Fully Convolutional Networks for Semantic Segmentation | IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE | 2017 | 1312 |
4 | Chen, Liang-Chieh; Papandreou, George; Kokkinos, Iasonas; Murphy, Kevin; Yuille, Alan L. | DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs | IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE | 2018 | 1309 |
5 | Badrinarayanan, Vijay; Kendall, Alex; Cipolla, Roberto | SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation | IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE | 2017 | 1260 |
6 | Silver, David; Schrittwieser, Julian; Simonyan, Karen; Antonoglou, Ioannis; Huang, Aja; Guez, Arthur; Hubert, Thomas; Baker, Lucas; Lai, Matthew; Bolton, Adrian; Chen, Yutian; Lillicrap, Timothy; Hui, Fan; Sifre, Laurent; van den Driessche, George; Graepel, Thore; Hassabis, Demis | Mastering the game of Go without human knowledge | NATURE | 2017 | 1013 |
7 | Zhang, Kai; Zuo, Wangmeng; Chen, Yunjin; Meng, Deyu; Zhang, Lei | Beyond a Gaussian Denoiser: Residual Learning of Deep CNN for Image Denoising | IEEE TRANSACTIONS ON IMAGE PROCESSING | 2017 | 766 |
8 | Ott, Patrick A.; Hu, Zhuting; Keskin, Derin B.; Shukla, Sachet A.; Sun, Jing; Bozym, David J.; Zhang, Wandi; Luoma, Adrienne; Giobbie-Hurder, Anita; Peter, Lauren; Chen, Christina; Olive, Oriol; Carter, Todd A.; Li, Shuqiang; Lieb, David J.; Eisenhaure, Thomas; Gjini, Evisa; Stevens, Jonathan; Lane, William J.; Javeri, Indu; Nellaiappan, Kaliappanadar; Salazar, Andres M.; Daley, Heather; Seaman, Michael; Buchbinder, Elizabeth I.; Yoon, Charles H.; Harden, Maegan; Lennon, Niall; Gabriel, Stacey; Rodig, Scott J.; Barouch, Dan H.; Aster, Jon C.; Getz, Gad; Wucherpfennig, Kai; Neuberg, Donna; Ritz, Jerome; Lander, Eric S.; Fritsch, Edward F.; Hacohen, Nir; Wu, Catherine J. | An immunogenic personal neoantigen vaccine for patients with melanoma | NATURE | 2017 | 649 |
9 | Kamnitsas, Konstantinos; Ledig, Christian; Newcombe, Virginia F. J.; Sirnpson, Joanna P.; Kane, Andrew D.; Menon, David K.; Rueckert, Daniel; Glocker, Ben | Efficient multi-scale 3D CNN with fully connected CRF for accurate brain lesion segmentation | MEDICAL IMAGE ANALYSIS | 2017 | 587 |
10 | Greff, Klaus; Srivastava, Rupesh K.; Koutnik, Jan; Steunebrink, Bas R.; Schmidhuber, Juergen | LSTM: A Search Space Odyssey | IEEE TRANSACTIONS ON NEURAL NETWORKS AND LEARNING SYSTEMS | 2017 | 578 |
(一)作者合作对比分析
为了分析人工智能领域国内以及国际合作研究情况,本文对国际与国内的高被引论文的作者合作关系进行了分析。
从计算结果中选择被引频次在25次以上的297篇国内论文。去除作者和机构信息不全的8篇文献,对剩下的289篇文献进行社会网络分析。其中,文献来源最多的是《法律科学(西北政法大学学报)》,共刊载12篇;其次是《东方法学》《电化教育研究》《远程教育杂志》,分别刊载11篇、10篇、10篇。对289篇高被引文献进行作者合作的社会网络分析,每篇文章的合著作者数量不一,共有155篇合著文章,占比53.63%。其中,合著作者数5人及以上的有35篇,作者最多的文献有19位合著作者,为了着重分析对文章有主要贡献的学者,我们仅对每篇文献的排序前4的作者进行分析。
为了对比国内学者的合作情况,本文从WOS检索到的4618篇文献中,选取被引频次最高的50篇进行分析。每篇文献的合著作者数不一,仅有一篇文献是独立完成的,合著论文占比98%。和国内论文处理相同,我们仅对每篇文献的排序前4的作者进行分析。
对筛选后的519位论文建立作者*作者合作矩阵。矩阵的行和列分别代表作者合作网络中的科学家个体,矩阵中的数值则代表作者间合作论文的篇数,该矩阵为对称矩阵,对角线上的值代表着该作者发表的论文总量。在网络图中,每个节点代表了合作网络中的合作者,节点之间的连线代表了合作者之间的合作关系。
我国人工智能算领域合作研究较为密切,合作网络图如图1所示,其中节点的大小表示某一科学家发表论文数量的多少,而节点之间连线的粗细表示两位科学家合作论文数量的多少,图中主要的合作群体共61个,仍有独立研究个体即孤立点共有109个。最大的合作研究群体是以北京师范大学的喻国明和中国科学院自动化研究所的王晓为核心的合作群体,该群体有33位合作者;其次是以国防科学技术大学刘丽为核心的群体。

图1 论文作者国内合作网络图
在社会网络中,度中心性(Degree)反映节点的重要性,一个节点的节点度越大就意味着这个节点的度中心性越高。中介中心性(Betweenness)反映两个结点之间最短路的桥梁的次数,一个结点充当“中介”的次数越高,它的中介中心度就越大。接近中心性(Closeness)反映每个结点到其他结点的最短路的平均长度,因此对于一个结点而言,距离其他结点越近,那么它的中心度越高。本文对合作作者的中心性做进一步分析,如表4所示。其中,王飞跃、林懿伦、王晓、喻国明和郑南宁在合作网络中起重要角色。
表4 人工智能高被引论文作者中心性分析(2017—2019)
作者 | 度中心性 | 中介中心性 | 接近中心性 |
王飞跃 | 1.028 | 0.093 | 0.205 |
林懿伦 | 0.835 | 0.073 | 0.205 |
王晓 | 0.771 | 0.226 | 0.205 |
喻国明 | 0.771 | 0.161 | 0.205 |
刘丽 | 0.642 | 0.038 | 0.197 |
王坤 | 0.578 | 0.024 | 0.205 |
郑南宁 | 0.514 | 0.083 | 0.205 |
王坤峰 | 0.514 | 0.001 | 0.205 |
李力 | 0.514 | 0.027 | 0.205 |
刘威 | 0.45 | 0.022 | 0.197 |
王成山 | 0.45 | 0.009 | 0.195 |
郭绍青 | 0.385 | 0 | 0.194 |
李扬 | 0.385 | 0.005 | 0.195 |
张进良 | 0.385 | 0 | 0.194 |
贺相春 | 0.385 | 0 | 0.194 |
陈维江 | 0.321 | 0 | 0.195 |
吴晓如 | 0.321 | 0.003 | 0.194 |
苟超 | 0.321 | 0 | 0.205 |
鞠平 | 0.321 | 0 | 0.195 |
杨俊 | 0.321 | 0.004 | 0.194 |
对国际论文和作者合著进行分析,如图2所示。图中仅存在一个孤立的点,合作群体的大小规模不一,其中最大的一个群体是以哈尔滨工业大学Zhang、Kai为核心的16人的合作群体。

图2 论文作者国际合作网络图
(二)机构合作对比分析
通过建立机构合作网络图分析我国科研机构之间的合作关系,如图3所示。我国在人工智能领域的高被引文章中,作者的所在机构有197个,其中参与机构之间合作的有120个,以及独立研究个体即77个孤立点。图中共有16个机构合作群体,其中最大的一个合作群体是以清华大学为中心的红点所构成,该群体共有60个机构或组织,以及中国科学院、华东师范大学以及中国教育学会、国防科技大学、天津大学等合作群体表现较突出。

图3 论文机构国内合作网络图
本文对合作作者的中心性做进一步分析,如表5所示。其中,中国科学院、清华大学在网络中承担起了主导角色,中科院的发文量最多,而清华大学的中介作用最强。由于合作网络较为紧密,主要机构的接近中心性较为一致。中国电力科学研究院等虽然也参与到合作网络中,但是由于同合作机构的地位对等,并未形成中介作用。
表5 人工智能高被引论文机构中心性分析(2017—2019)
机构 | 度中心性 | 中介中心性 | 接近中心性 |
中国科学院 | 1.809 | 2.943 | 0.76 |
国防科技大学 | 1.299 | 0.931 | 0.759 |
清华大学 | 1.206 | 6.221 | 0.76 |
中国科学院大学 | 1.16 | 0.152 | 0.759 |
华东师范大学 | 0.974 | 1.702 | 0.759 |
中国教育学会 | 0.835 | 0.702 | 0.759 |
青岛智能产业技术研究院 | 0.788 | 0.044 | 0.759 |
天津大学 | 0.742 | 2.219 | 0.757 |
国家电网 | 0.603 | 4.835 | 0.758 |
山东大学 | 0.464 | 0.848 | 0.757 |
中国电力科学研究院 | 0.464 | 0 | 0.757 |
友成企业家扶贫基金会 | 0.464 | 0 | 0.758 |
奇点大学 | 0.464 | 0 | 0.758 |
沪江网 | 0.464 | 0 | 0.758 |
国务院 | 0.464 | 0 | 0.758 |
宽资本 | 0.464 | 0 | 0.758 |
睿易研究院 | 0.464 | 0 | 0.758 |
美国计算机协会 | 0.464 | 0 | 0.758 |
南京师范大学 | 0.464 | 0 | 0.758 |
中国电机工程学会 | 0.417 | 0 | 0.757 |
对论文的国际合作进行分析,如图4所示,共有14个合作群体。

图4 论文机构国际合作网络图
(三)区域合作对比分析
本文对CNKI数据进一步分析高被引论文在我国区域上的特征,如表6所示。其中,北京和江苏在我国合作研究网络中承担起重要角色,而湖南、山东和上海虽然在网络中发文较多,但是并未承担起“连接”的中间作用,相反天津虽然发文量较少,但是在网络中却承担起“沟通”的桥梁作用。
表6 人工智能高被引论文所在地区中心性分析(2017—2019)
地区 | 度中心性 | 中介中心性 | 接近中心性 |
北京 | 22 | 39.167 | 16.026 |
江苏 | 9 | 10.556 | 15.337 |
湖南 | 7.5 | 0.556 | 14.62 |
山东 | 5.5 | 0.333 | 14.706 |
上海 | 5 | 0.833 | 14.793 |
天津 | 5 | 12.778 | 15.152 |
广东 | 4 | 6.333 | 14.97 |
陕西 | 3.5 | 1.278 | 15.06 |
浙江 | 3 | 0.167 | 14.62 |
辽宁 | 2 | 6.333 | 14.451 |
安徽 | 2 | 0 | 14.535 |
重庆 | 1.5 | 0 | 14.535 |
四川 | 1 | 6.333 | 14.451 |
云南 | 0.5 | 0 | 14.286 |
吉林 | 0.5 | 0 | 13.021 |
福建 | 0.5 | 0 | 13.587 |
广西 | 0.5 | 0 | 13.441 |
湖北 | 0.5 | 0 | 13.736 |
河北 | 0.5 | 0 | 14.286 |
新疆 | 0.5 | 0 | 13.587 |
甘肃 | 0.5 | 0 | 13.021 |
本文根据论文作者的地址中提取国内的省市信息和合作国信息,构建人工智能领域国内论文的区域合作网络图,如图5所示。合作网络以北京为中心,上海、江苏、山东、陕西、湖南等传统沿海发达省份和内陆的科技强省在合作网络中处于次中心的位置。而江西、海南、河南、内蒙古、西藏还没有参与人工智能领域研究的合作网络中。可以看出,东部发达地区和内陆科技强省之间的合作较为密切,而内陆其他省份合作相对较弱。

图5 国内论文的区域合作网络
本文在国际论文数据的基础上,利用Bibexcel的网络分析功能,建立国家与国家合作矩阵。从图6所示,共有13个国家参与了人工智能领域的全球科学合作网络。网络图以美国为中心,其中,英国和美国的合作关系最为密切,共同发表了4篇论文。在国际合作中,仅有日本、美国、英国等3个国家参与了我国人工智能领域的科学合作网络。

图6 论文区域国际合作网络图
四、结论
由于科学研究的复杂性和全球化发展趋势,科研合作有助于研究人员加强学术交流与合作,进一步促进科学研究成果质量和数量的提高,合著论文是科研合作的重要内容,是科研项目合作、科学实验合作和学术交流等的重要结果。
本文以人工智能研究领域为例,基于WOS、CNKI论文数据库,应用社会网络分析方法我国合著论文全球作者、机构、区域间合作情况进行比较分析,揭示该领域科研合作中我国作者以小群体合作为主,形成以北京为中心,上海、江苏等沿海地区为次中心的合作网络。在国际合作中我国和日本、美国、英国的合作关系较为密切,并提出了促进合作网络的每个节点科研产出的建议和措施。
参考文献
[1]蒋勋,潘云涛,苏新宁.基于科学计量学的官产学研合作研究[J].图书与情报,2014(5):42-52.
[2]刘芳芳.社会网络视角下的跨区域产学研合作研究[D].合肥:中国科学技术大学,2016.
[3]鲁晶晶,谭宗颖,刘小玲,等.国际合作中国家主导合作研究的网络构建与分析[J].情报杂志,2015(12):60-66.
[4]牛奉高,李志欣.基于论文合著的校企合作研究——以机器学习领域为例[J].情报工程,2019(2):49-57.
[5]牛奉高,邱均平.基于国家、学科合作网络和期刊分布的中国科研国际合作研究[J].情报科学,2015(5):111-118.
[6]孙海生.基于加权网络模型的国际科学合作研究[J].情报杂志,2014(7):91-96.
[7]汪伟全,郑容坤.地方政府合作研究的特征述评与未来展望——基于CSSCI(2003-2017)文献计量分析[J].上海行政学院学报,2019(4):96-104.
[8]曾静婷,王雯婧.科研竞争力视角下中国与中亚五国的科技合作研究[J].科技管理研究,2020(4):48-59.
[9]占侃,孙俊华.江苏高校校企合作研究——基于社会网络分析的视角[J].科研管理,2016(10):146-152.
[10]张军亮.我国自然科学领域的合作研究分析——以2008-2013年国家自然科学奖为例[J].科技管理研究,2016(5):248-253.
[11]周弘.基于知识图谱的两岸高等教育交流合作研究[D].厦门:厦门大学,2017.