业内信息

法律专业知识服务的智能化探索

2018-04-08 来源:出版商务周报 孟晋
  编者按:在日前召开的“2018全国新闻出版单位数字出版工作交流会”上,人民法院电子音像出版社副社长孟晋作了“法律专业知识服务的智能化探索”的主题分享,介绍了该社在法律专业知识服务以及法律专业知识服务的智能化探索两方面的内容。

  自2015年以来,在总局推广知识服务工程的大力扶持下,人民法院电子音像出版社法信团队从最初的七八个成员,成长为现在拥有近百人的法律知识专业服务团队。

  目前,人民法院电子音像出版社拥有两大数字产品,一是中国法律应用数字网络服务平台(简称“法信”),二是最高人民法院数字图书馆,三是法信国际版。今年“两会”上,最高人民法院周强院长做最近五年工作报告时,首次提及法信App和最高人民法院数字图书馆,认为它们是审判领域人工智能研发的重要成果,为法官提供了办案参照和文书纠错等诸多服务。

  一纲六库,提供一站式法律专业知识服务

  在法律专业知识服务方面,我们取得的一个代表性成果就是打造了法信平台。法信是基于一纲六库,提供的一站式法律专业知识的解决方案。法信平台有效解决了法律人在工作中通常会遇到的检索条目越多、得到有效信息越少的困惑。

  其中,“一纲”指的是法信大纲,搭建和串联了法律专业知识体系和数据元,是法律专业知识服务的“枝干”;“六库”指的是法律文件库、案例要旨库、裁判文书库、法律观点库、法律图书库、法律期刊库6个数据库,共包含4000万篇法律文献,总字数215亿字,编辑团队日更新文献量近万篇,这是法律知识资源的汇聚和加工成果,可看作法律专业知识服务的“树叶”。

  在法律知识体系的搭建串联方面,基于现在的中国法律体系,我们搭建了一套符合中国法律实际的知识体系,即法信大纲。截止目前,法信大纲是中国最大的法律知识与案例导航体系,法律条目总数大约15万条,涵盖了主要的7大部门法。在法信大纲的逻辑引导下,法律人对信息的查询和检索变得更为简洁。

  以离婚财产分割问题为例,它首先属于法信大纲第一层民商法类目下,通过法律关系的分析,逐层深入,最后可以达到最底层的财产分割的知识点和知识元。对这个问题的解答只需要几个法条和案例,但是层层之间的深入都离不开法信大纲的链接,所以整个检索过程变得更有针对性。

  我们可以再举一个目前关注度比较高的网络电信诈骗问题。通过法信大纲层层深入,最后相关链接的条数会越来越少,对于电信诈骗的认定只需要5个法条、21个裁判观点、25个典型的案例就可以把这个问题搞清楚。

  在法律知识数据加工方面,我们主要打造了六大基础数据库,具体做法是将一些公开的数据、法律和裁判文书以及出版社的大量案例、图书版权资源注入数据库。六大数据库的内容在收集和加工方式上都有所不同,下面以法律文件库、案例要旨库、法律观点库为例,简要解析。

  法律文件库中包含了130万件中央和地方的法律案件,因为法律是不断更迭和修正的,所以每次修正后,我们都将相关专家学者对法条的深度解读和理解串联在该法条之下,以帮助法律界人士更准确地认识新法条。

  案例要旨库最能体现我们的核心价值,因为市面上所有的抓取技术都无法代替我们专业编辑的专业解析,即以法律专业视角提取案例的裁判要旨。目前,该数据库的文献总量达到8.8万篇,日更新量达到上千篇。

  法律观点库里大约有1.1万篇专业的法律观点。这些法律观点不是断章取义式的观点的提取,也是根据既有的图书资源做了深入提取和加工,每个观点的篇幅不超过1000字,但是要保证观点的逻辑自洽、论证体系完整,也都需要专业的编辑才能做到。

  目前,法信平台专业版已在全国25个省的法院部署使用,注册用户63万人,预计今年年底可以覆盖全国所有的法院。

  优化用户体验,探索法律知识服务的智能化

  在知识服务领域,智能化是一个永恒的追求。那么法律知识服务智能化该如何理解呢?我们认为,法律知识服务的智能化在于传统出版社知识数据的供给和终端用户检索需求之间的高度匹配。

  目前,我们的法律专业知识服务工作主要集中在供给端的数据积累,在与终端用户需求的匹配,即入口设计和场景对接方面,相对薄弱,这正是传统出版机构做知识服务的一大短板。我们没有互联网专业人才,在打造互联网产品的过程中,思维相对狭窄,不能充分优化用户体验。如果可以把入口设计和场景对接设计得更好,哪怕只是一点点的优化,也会让用户感觉到更加智能,从而大幅提升对产品的好感度。

  这三年,我们在积累法律专业知识服务数据基础的同时,也在同步探索法律专业知识服务的智能化。主要有以下几个方面的探索:

  首先,资源积累方面的智能化探索。传统出版社若想做智能化大数据,仅靠自有的版权资源是远远不够的,还要结合相关领域的资源。以法律行业为例,目前法院系统已实现了全国四级法院案件数据的实时报送,其中99.6%的案件审理数据可以实现实时报送,且每5分钟刷新一次。因此要实现法律知识服务的大数据智能化建设,就必须依托和充分利用这些案件资源。此外,由最高人民法院建设的人民法院大数据管理和服务平台,目前累计的案件量有1.3亿件,裁判文书有将近8000万件。由最高人民法院主办的裁判文书公开网在互联网端免费向全世界开放的裁判文书数量已达到4300万件,总访问量136亿次,这些也是下一步知识服务、大数据探索中的重要基础数据。

  法信平台在资源积累的智能化方面做了积极探索。我们通过与国内一流的技术公司合作,同时投入大量的编辑力量,对法信大纲进行改造,并逐渐向知识图谱的方向做迁移。完成了裁判文书库的剖析引擎。即通过大数据的算法,对海量裁判文书实现案情、说理、裁判结果等各要素的剖析提取。

  其次,实现同案智推。法官将专业的裁判文书和专业的法律术语输入法信平台的搜索页面,通过底层的大数据资源池,结合裁判文书的剖析引擎和同案智推的引擎,即可获取同类案件的裁判结论。此外,普通社会大众也可在法信平台上通过自然语义的口述表达找到相应的案件。例如,你可以在上面输入“我家前面有人盖房子,挡住了窗户,现在没有阳光进来”此类口语,同样可以通过底层自然语义的分析,找到相应的法律关系,给你推送相应的案例。

  最后,入口设计和场景对接实现定制化。法信平台目前已针对各地法院的不同需求开发了不同的版本,除了法信网页版和App,我们还为各地法院安装了法信内网版,此外,我们还为最高法院的保密内网和审判委员会各设计了一个版本。

  除此之外,法信的底层数据也开放了端口,和不同的用户场景做结合、嵌入和推送。例如,我们与潍坊法院合作开发的执行工作平台中,法信完全隐末在后台,用户看不到它,但是该平台推送的所有内容和知识都是法信提供的。

  另外,法信也可以与其他的应用实现链接。例如,在线调解平台和陕西法院诉讼服务应用平台,都是各地法院根据他们的需要和场景设计,把法信嵌入其中,用户在平台提出疑问,我们可以做出解答。

  在此类开放数据端口给其他合作单位的合作中,产品的应用和接口的设计均由合作单位负责,我们只需做我们专业的法律知识服务。同时,通过上述需求而调取法信平台的数据资源,那么,我们则可以获取知识服务的第二轮收益。

  (本文根据人民法院电子音像出版社副社孟晋演讲整理而成,经本人确认后发稿)































国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号