业内信息

中国思想史专题数据库产品开发探析

2020-11-17 来源:《科技与出版》
  【作 者】朱亮亮、佟雪萌:中国人民大学出版社

  【摘 要】思想史研究一直是我国学术界备受关注的领域,而相关专题数据库产品的开发也是学科发展的迫切需要。文章简述当前中国思想史专题数据库产品开发的情况,并从内容、功能、团队、应用等方面探究此领域知识服务的需求。

  【关键词】中国思想史;专题数据库产品;知识服务;数字人文

  近年来,中国思想史研究颇为活跃,相关学术著作大量涌现,但相较之下,学术资料的搜集整理却明显滞后,许多文献分散于各处,存世版本的质量也良莠不齐,极大制约了学术研究的进一步深入和提高。通过建设思想史专题数据库产品,借助先进的计算机技术对分散、凌乱的内容资源进行筛选与整合,不但可以有效地解决以上问题,提高研究效率,而且还有助于突破传统思想史研究以代表人物或著作为分析依据的局限,可极大拓展研究者的视野和思路,从而促进思想史学科的发展。

  1 当前中国思想史专题数据库产品开发情况

  目前,国内外的思想史相关数据库产品开发均取得了一定成果。从内容来看,思想史专题数据库主要可分为人物数据库和文献数据库两大类。

  人物数据库是“对在某一方面乃至多个方面,对人类社会做出特殊贡献的典型人物相关信息的集中收录、组织和展示,一般具有较强的学术性、纪念性、史料性和观赏性”[1]。若从收录对象进一步细分,人物数据库可分为单一人物数据库和群体人物数据库。所谓单一人物数据库,即围绕某一特定历史人物,收集整理与其生平相关各种资源的数据库,如“袁世凯全集数据库”“姚际恒著作集”等。单一人物数据库通过对单一人物的著作成果、传记资料、档案资料等内容的整合与梳理,呈现其人生、思想历程以及历史地位。群体人物数据库一般是将收录范围扩展至某一群体,通过对群体传记、著作等进行分析,从而发掘其所共有的思想或背景特征,并探寻个体处于一定社会团体中的个性特点,[2]例如,哈佛大学的“中国历代人物传记资料库”(CBDB)、麦吉尔大学的“明清妇女著作库”(Ming Qing Women's Writings)、台湾“中研院”近代史研究所的“近现代人物资讯整合系统”等。不同的群体人物数据库在收录范围、资料来源以及具体内容上各有侧重。

  除人物数据库外,围绕古籍文献和档案资料所建立的文献数据库也不胜枚举,例如,中国基本古籍库、瀚堂典藏数据库、大成老旧刊数据库等。文献数据库对大量古籍文献进行了数字化处理,形成原版图像与数字化文本的对照,使用户可进行多方式、多层级的检索及浏览,同时此类数据库一般体量较大,内容涵盖各个学科,为学术研究提供了极大便利。

  随着思想史学者们研究需求的增长、相关文献的积累以及数字化实践的成熟,一些以思想史学科为核心、综合以上两种数据库内容特点的思想史专题数据库也涌现出来。例如,香港中文大学与台湾政治大学合作开发的“中国近现代思想及文学史专业数据库(1830—1930)”,涵盖了报刊、档案、经世文编、经典论著、来华外人中文译著、晚清西学教科书等中国近代思想文化相关的重要原始文献,以反映中国近现代观念起源、变迁及形成。北京大学出版社的“二十世纪中国文化史数据库”收录多种近代重要报刊以及刘半农、严复等多位文化巨擘的个人著述和相关研究资料。中国人民大学出版社的“中国思想与文化名家数据库”围绕中国历代影响最为深远的思想与文化名家,汇聚丰富的人物百科、经典著作以及研究文献,立体呈现中国思想文化史的全貌。

  2 思想史专题数据库产品开发应考虑的4个维度

  传统方法下的思想史研究往往专注于某一人物、某种观念或某一流派,“从微观的定性视野出发,去勾勒观念转型的点状或线性发展”[3]。计算机技术的应用无疑为研究者带来更多可能性,使其可以突破阅读量的限制,不再拘泥于单一的研究对象,而得以将视野投向更为广阔的文献史料,发现从前被忽略的重要问题,挖掘经典文本的全新内涵,或从整体上把握思想观念传承流变的趋势历程。然而想要达到这样的目的,思想史专题数据库产品的定位就不应仅局限于将现有的资源数字化,而应切合思想史的学科特点,开发出真正能为研究者提供便利的数字人文工具。

  2.1 资料的客观完备

  对于人文学科研究来说,关键材料的缺失极易导致研究结果的偏颇,因此资料收集是至关重要的一环,思想史学科自然也不例外。但前文也曾提及,目前思想史学科的学术资料尚处于比较分散的状态,因而在开发思想史专题数据库时应在保证内容可靠性的前提下,尽力汇集专题相关的所有资源,以保证内容资料的完备性。思想史研究常常涉及的资料除人物著作和后世研究外,还有报刊、书信、回忆录、方志、年谱、公文、档案以及音像资料等。数据库研发者可与有关的研究机构、图书馆、博物馆、档案馆等单位进行多方面的合作,对于暂时难以取得的资料,也应尽可能收集较为详尽的题录数据,并在未来的建设中不断补充。

  此外,思想史研究对于研究资料的来源也有很高的要求。经过后人整理、编辑的二手资料往往带有一定的主观性,可能会影响学者在研究过程中的判断。因此,思想史专题数据库需要对一些二手资料进行溯源,尽可能收录原始资料的影印图像,与数字化文本形成对照,以便研究者选择使用。

  2.2 功能的专业科学

  随着“数字人文”概念的兴起,数据库产品开发的思路实现了从数据化到文本挖掘的演进[4]。若想使数据库成为更加有效的数字人文工具,需要充分利用计算机技术对文献资料进行检索筛选、挖掘分析等。

  首先,思想史研究经常围绕一定人物、事件等展开,而这些人物和事件的名称在文献资料中往往以不同形式出现,以人物名称为例,可能有字、号、谥号、斋名、籍贯、郡望、官名、爵位、任职地等多种称谓方式,这为检索带来一定的麻烦。解决这一问题,需要思想史专题数据库研发者建立一个较为完备的专有名词表,尽量将各种名称变体囊括其中,从而使研究者可以更便捷、准确地检索到所需要的全部资料。

  其次,研究者在使用数据库检索资料时,通常会设定一些主题性的关键词进行检索。思想史专题数据库研发者可以利用计算机的词频统计等自然语言处理技术进行关键词丛的撷取。以关键词“女性解放”为例,其相关词丛可能包括“女性主义”“女性意识”“女权主义”“男女平等”等。通过提取关键词丛,数据库可帮助研究者突破主观限制,获取更为全面客观的研究资料。

  再次,20世纪后期,随着人文理论“空间转向”的发生,信息和数据的可视化逐渐成为数字人文的一个主要面向。[5]对于思想史学科来说,人物的社会关系网络、思想观念的历时性流变趋势,以及移动传播轨迹等问题,都需要通过数据的可视化进行分析阐释。例如,魏希德(Hilde De Weerdt)等学者在一项元代历史研究中,利用CBDB、GIS以及相关的标引工具,对数百封书信作者、收信人、地名、官职等信息进行标引以及频率分析,形成这些士人的移动路线、升迁轨迹、社会关系网络,从而探寻元代北方汉族文人的政治生活状况。[6]由此,思想史专题数据库可以通过对内容数据中人名、地域、历史事件等信息的标引,并进行一定程度的可视化统计与分析,从而深度挖掘内容数据,展示文本中隐含的关联,为研究者提供更为有效的知识服务。

  2.3 团队的多元融合

  数字人文将计算机技术等现代科技融入传统人文学科中,因而其本身就具有跨学科的特性。所以,开发思想史专题数据库这样的数字人文工具,自然也需要思想史学者、语言学学者、计算机工程师等不同学科人才协力完成。同时,思想史研究本身也与文学、历史、哲学、社会学、心理学、传播学等多种学科密不可分,故而思想史专题数据库研发团队需要囊括多元化人才,以跨学科的思维进行内容组织、功能设计以及平台构建等工作。

  2.4 应用的高效灵活

  正如葛兆光教授所言,思想史对于社会政治、文化的变迁所带来的思想世界混杂,东洋和西洋各种蜂拥而入的新理论、新方法,以及各种新史料的发现等问题都能够有所回应[7]。通过探寻古今名家的思想结晶,追溯思想脉络,不仅可对中华文化精神内核有更为透彻的理解,还有助于对当代社会的各种问题进行全面而深入的反思。这要求思想史专题数据库研发者具有一定的敏感度,能结合现实社会问题灵活地整合库内资源。例如,2020年新冠疫情肆虐全球,德国马普科学史研究所在其“History of Science ON CALL”平台上整合了瘟疫相关的学术研究成果,为人们提供从科学史学家和知识社会学家的角度看待疫情和灾难的视角[8]。通过这种方式,有利于思想史专题数据库创造良好的社会效益,实现产品价值更大化。

  3 结语

  千里始足下,高山起微尘。开发一个满足用户需求的数据库产品,需要经历漫长的市场调研、需求评估、资源整合、产品落地等阶段。并且,随着技术的进步,新技术的应用,运营管理中用户需求意见的反馈,以及知识服务层次的不断深入,数据库产品开发必须及时迭代升级。当前国内思想史专题数据库已经取得了一定成果,但仍有需要不断提升及完善之处。我们期待未来能够涌现出更多在国际上具有领先地位的专题数据库产品,继承和弘扬中华优秀传统文化,以现代化的技术方式让中华优秀传统文化的思想魅力和精神力量得到更加广泛、深刻的传播,从而助力中国哲学与社会科学发展,进一步推动中国文化“走出去”。

  参考文献

  [1]蔡璐.浅谈人物数据库网站的核心表现:以湖南近代人物资源库建设为例[J].图书馆,2010(3):107-108.

  [2]Anne Gerritsen.Prosopography and its potential for middle period research[J].Journal of Song-Yuan Studies,2008(38):161-201.

  [3]邱伟云,金观涛,刘青峰,等.中国近代平等观念形成之数字人文研究:以报刊为中心[J].清华大学学报(哲学社会科学版),2018,33(6):1-33,192.

  [4]赵思渊.地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例[J].清史研究,2016(4):26-35.

  [5]赵薇.网络分析与人物理论[J].文艺理论与批评,2020(2):38-46.

  [6]HILDE D W,CHU M K,HO H I.Chinese empires in comparative perspective:a digital approach[J].Verge:Studies in Global Asias,2016,2(2):58-69.

  [7]葛兆光.再谈思想史在当代中国的重要性[J].书城,2019(1):7-17.

  [8]施庆华.专访德国汉学家薛凤:当历史学家和计算机工程师同桌思考[EB/OL].(2020-05-17)[2020-07-24]..

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号