业内信息

技术视角下网络文学版权保护问题研究

2021-01-17 来源:《新媒体研究》
  【作 者】程美华、李美莹:上海理工大学

  【摘 要】文章从技术的视角,对网络文学的版权困境与版权保护的技术探索进行阐述与分析,并提出完善法律体系、推进技术监管等措施,使网络文学版权保护技术得以落地,以期能够为网络文学的版权保护实践提供新的思路。

  【关键词】网络文学;版权保护;文字指纹识别系统;区块链

  随着技术的不断发展与普及,以及互联网产业的成熟化,网络文学逐渐从早期BBS上的免费模式发展到以平台为载体的付费模式。起点中文网、晋江文学城、榕树下等一系列网络小说平台借助商业资本的力量,走向了一条以市场为导向的产业化的道路[1],付费阅读模式逐渐被读者接受。但由于技术门槛较低、部分读者付费意愿不强以及在法律上难以取证等原因,网络文学盗版现象屡见不鲜,成为其发展过程中的“阿喀琉斯之踵”。

  笔者对国内网络文学相关的研究进行梳理时发现,目前已经有许多学者对于网络文学版权保护的问题进行了探讨。荆琦从网络文学版权保护在法律层面上的不足进行探析,并提出完善著作权惩罚性赔偿的构想[2]。田常清、孟鑫从网络文学侵权的特征、成因等方面进行分析,并提出了增强国民版权保护意识、优化组织管理等对策[3]。肖海、江舒通过对于日本动漫版权保护体系的研究,提出对于中国网络文学版权保护的启示[4]。这些成果主要从法律层面或版权意识等方面提出建设性意见,但尚未有学者从技术层面对网络文学版权保护问题进行详细的分析。本文拟从技术的视角,对网络文学版权保护问题进行探析。

  1 网络文学版权困境

  根据艾瑞咨询中国网络文学盗版损失模型最新核算数据,2019年中国网络文学总体盗版损失规模为56.4亿元,其中移动端盗版损失规模为39.3亿元,同比增长了10.4%。如此大规模的网络文学盗版损失,不仅分流了网络文学网站与读者的主要利润来源,也在一定程度上打击了作者的创作积极性。网络文学版权的困境主要表现在以下几个方面。

  1.1 盗版网站门槛较低

  1.1.1 准入门槛低

  与数字音乐的mp3、wav、wam格式或网络视频的mov、avi等格式的大体积储存空间不同,网络文学主要以txt、epub等格式为主,是PC端及大多数移动终端的文本通用格式,体积相对较小,存储更加方便。对于盗文网站来讲,文本格式较小的存储空间极大地弱化了网站对服务器带宽的压力,因此也降低了网站的准入门槛。也正是这种体量较轻的运营模式和成本较低的准入门槛,使网络文学盗版网站能够不断涌入市场。

  1.1.2 技术门槛低

  网络文学盗版网站泛滥的另一原因即技术门槛较低。头部盗文网站通过订阅VIP渠道自动采集所需要内容,在相对较短的时间内便可实时抓取更新章节,而更多的小平台是通过盗取头部盗文网站资源。如果说之前的盗文还要通过写Python程序对内容按章节进行抓取,有一定的技术门槛与人力成本,那么现在利用采集器自动抓取正版网站内容,就是“傻瓜式”的操作模式。目前盗版网站常用的关关采集器就是这种针对小说网站专门设计的程序,很大程度上降低了盗版网站所需要的技术门槛。

  1.1.3 运营门槛低

  网络文学的盗版网站主要运营模式是利用免费小说来吸引用户点击,进而将用户的注意力贩卖给广告商,在整个运营的闭环中,网站收入来源主要是广告,贩售的核心产品则是用户的点击与注意力。因此,在网站的运营过程中主要的是引入用户流量,即盗取并发布内容后,由负责SEO(搜索引擎优化)的编辑提升该网站在搜索引擎上的综合排名,更容易被用户点击。与正版网络文学网站需要对接作者、吸引读者、榜单奖励等诸多运营机制相比,盗版网站的运营门槛相对较低。

  1.2 侵权行为成本较低

  1.2.1 相关法律的滞后性

  目前已经制定了一系列如《中华人民共和国著作权法》《信息网络传播保护条例》《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》等关于知识产权的法律法规、司法解释,对于著作权保护方面确实产生了一定成果[5]。但由于法律的滞后性,面对互联网时代由新技术引发的网络文学作品著作权问题,无法给予有效的保障与及时的救济[6],对于侵权者也没能及时给予相关的判罚与赔偿,由此便使侵权行为愈演愈烈。

  1.2.2 行为主体判定复杂

  在网络文学侵权行为中,行为主体的判定是十分复杂的。第一,盗版网站一般将服务器设立在海外,且频繁更换域名及网站名称,加大了技术追踪的难度,使版权方在追溯责任的时候十分困难。第二,盗版网站经常依据“避风港原则”,逃避可能存在的追责。例如盗文的头部网站“笔趣阁”就在网站底部标注“本站所有小说为转载作品,所有章节均由网友上传”,以技术中立为借口免除侵权的责任。第三,由于网民的付费意识不强,许多用户偏向主动选择免费的盗版小说,但很难追溯用户来源,版权方无法对看盗版小说的用户进行有效追责。

  1.2.3 诉讼过程繁琐

  由于版权方提出诉讼的过程中程序较为繁琐,成本较高,但获赔金额却相对较少,不足以弥补版权方的损失,也无法给侵权方带来压力和警示。这就使版权方疲于诉讼,而侵权方在关站后往往另起炉灶,以“一库多站”的模式继续存在。

  2 版权保护的技术探索

  网络文学因盗版问题损失较大,且由于判定复杂、诉讼繁琐等原因,很难通过法律手段对于侵权行为进行精准打击。面对网络文学版权问题现存的诸多困境,很多网络文学平台不断升级平台的版权保护技术,从源头上遏制盗版行为。

  2.1 文字指纹识别系统

  2.1.1 系统结构(图1)



图1 文字指纹识别系统结构

  在文字指纹识别系统的整个结构中,主要可以概括为爬取内容、编码指纹、库内对比与数据分析这几个步骤。

  爬虫系统的主要目的是从网络文学的盗版网站中抓取网页内容,为整个大的文字指纹识别系统提供待检测的内容,是原始数据的来源。在抓取完原始数据后,再对海量数据进行编码,这一步骤就是通过Simhash算法生成二进制字符串作为指纹,为后续的比对工作做好前期工作。

  通过算法生成的指纹是确定的,而相同文本的指纹也是相同的,指纹特征越相似,文本内容也就越相似。比对的过程就是将新生成的指纹与版权方的库内指纹进行对比,迅速判断新文本与库内文本是否有重复,最后由数据分析系统对大量文本的指纹比对结果进行统计与分析,最后生成报告并进行追踪。

  2.1.2 算法适用性

  文字指纹识别系统本质上是模仿生物学的指纹,将文本哈希成数字指纹的技术,以对比文本指纹间的相似度。其中Simhash算法因其检测较为准确,且检测速度较快,而得到广泛使用[7]。

  有研究结果显示,在应用过程中,Simhash具有无法识别由同义词产生重复等问题,但是在网络小说的侵权过程中,盗版网站为了节约时间成本与人力成本,往往直接对正版网站内容进行抓取,不存在对内容进行同义词替换等问题,因此Simhash算法在网络文学的版权保护过程中是更加适用的。

  2.1.3 现实应用

  由盛大文学开发并投入使用的防盗版软件核心就是文字指纹识别系统,主要通过计算机程序提取盗版网站文本特征后,与数据库内文本特征进行比对,进而对盗版网站进行实时监控并取得侵权证据。该系统上线后,不仅在网站内容抄袭判定上卓有成效,对于盗版网站也有不小的打击。

  除了应用在网络文学的版权保护中,文字指纹识别系统的思路还应用在了段视频侵权内容打击上面,字节跳动自主研发的视频版权保护系统“灵识系统”就是利用相同的思路将每一个段视频指纹进行比对,以此快速发现侵权内容。

  2.2 区块链技术

  区块链技术实质上是一种分布式记账系统,由于其具有的去中心化、防篡改以及共识信任等特征[8],可以用于解决数字作品的版权问题。目前在国外,已经有Monegraph、Blockai等项目专门利用区块链技术去保护艺术家的数字资产。

  2.2.1 系统结构(图2)



图2 区块链版权保护系统结构

  在区块链应用于版权保护的过程中,首先是作者注册后,上传自有版权内容[8],而后通过时间戳和哈希树根值进行版权的登记,将版权的信息登记在区块链中,生成无法篡改的分布式账本,并使之能够随时调阅[9]。

  将作品进行上传、登记后,由作者自行设置授权模式或分销渠道,给作者较强的自主性,最后由平台对于作者身份真实性、版权及作品证明进行审核,确认区块链中数据的准确性。

  2.2.2 版权登记适用性

  在区块链中进行版权登记时,主要是应用时间戳和哈希树根值,其中哈希树根值主要是对作者的身份、上传的时间、具体表现形式等内容进行登记,但是对于作品的独创性是无法进行确认的。

  因此,区块链技术在网络文学版权的应用中,尚难以对抄袭等涉及作品独创性的侵权行为进行判定,但是对于其他网站的“盗文”行为则能够高效地判定并对于证据进行有效留存。

  2.2.3 现实应用

  目前利用区块链进行版权保护的尝试已经开启,国内的纸贵、亿书等公司就是以区块链保护版权为主要项目方向。

  其中纸贵科技就是通过“区块链+版权保护”,实现侵权取证、版权存症的一站式版权保护服务,平台对于侵权的页面进行实时保存的同时将取证上传至杭州之江公证处进行公正,形成具备法律效力的电子证据并上传至区块链中,供日后第三方检验使用。

  3 推进版权保护的有效策略

  如果认为仅仅依靠技术的进步就能够铸成网络文学版权保护的护城河,那么无疑是陷入了技术决定论的巢窠,我们无法忽视技术所带来的变革,但也同样不能盲目地崇拜技术。在推进网络文学版权保护技术落地的过程中,同样也要从法律保障与技术监管等方面进一步推进版权的保护进程。

  3.1 完善法律体系

  无论是文字指纹识别系统还是区块链技术,目前在版权保护中所扮演的角色主要还是集中在取证与存证上,如何打击网络文学盗版网站并保护版权方利益,则是由法律体系来进行保障。

  于2018年通过的《最高人民法院关于互联网法院审理案件若干问题的规定》,在第十一条中就提到了电子数据的确认问题——“当事人提交的电子数据,通过电子签名、可信时间戳、哈希值校验、区块链等证据收集、固定和防篡改的技术手段或者通过电子取证存证平台认证,能够证明其真实性的,互联网法院应当确认。”[10]

  该规定在一方面承认了区块链保存电子证据的方式,另一方面也规定了如何审查新出现的电子数据真实性,是一种面向新的版权保护技术,不断对法律法规进行完善和补充的思路的体现。

  3.2 推进技术监管

  有关部门应该对新出现的网络文学盗版现象加大监管力度,并针对技术造成的盗版现象进行专项的监管行动,打击技术侵权问题。国家版权局、工业和信息化部、公安部、国家互联网信息办公室联合启动的“2020剑网”就是针对网络的盗版侵权行为展开的专项行动,其中强调了要继续巩固网络文学、网盘等领域取得的工作成果,持续打击网络文学侵权问题[11]。

  除了对于盗版技术的监管,也应该加强对于新出现的版权保护技术的监管——目前区块链技术在版权方面的应用仍然存在着缺乏行业自律、外界监管等问题。在对于新出现的版权保护技术监管的过程中,也应该在鼓励行业内部加强自律,建立自律制度与行业准则的同时,加强相关部门与社会公众的有效监督,促进行业有效健康发展。

  4 结语

  网络文学的版权保护并非学界新提出的问题,但在业界却对于盗版侵权现象屡禁不止,虽然从技术方面来看,已经出现了较为有效的新技术,能够迅速对于盗版网站进行分析、追踪、取证与存证,对于推动网络文学版权保护有一定的保护作用的同时,也存在着一些适用性难题[12]。因此,在不断推进版权保护的技术革新的同时,还应该在法律体系、行业自律与外部监管等方面不断完善,共同推动网络文学版权保护的进步。

  参考文献

  [1]茅硕.商业化背景下的网络文学发展现状与前景[J].科技与出版,2016(10):108-111.

  [2]荆琦.对我国网络文学作品侵权惩罚性赔偿制度的分析[J].法制博览,2019(21):90-91.

  [3]田常清,孟鑫.我国网络文学著作权侵权成因及对策分析[J].出版与印刷,2020(1):55-61.

  [4]肖海,江舒.日本动漫版权保护对中国网络文学版权保护的启示[J].大庆师范学院学报,2020,40(2):58-66.

  [5]王伟亮.常见“似是而非”著作权问题例析[J].青年记者,2017(6):22-24.

  [6]贾淑华.网络文学作品的著作权保护:困境、根源及突破路径[J].戏剧之家,2020(6):186-188.

  [7]姜雪,万正景,梁燕,陶以政.基于语义指纹的海量文本快速相似检测算法研究[J].电脑知识与技术,2016,12(36):175-177.

  [8]聂静.基于区块链的数字出版版权保护[J].出版发行研究,2017(9):33-36.

  [9]贾引狮.基于区块链技术的网络版权交易问题研究[J].科技与出版,2018(7):90-98.

  [10]胡仕浩.《最高人民法院关于互联网法院审理案件若干问题的规定》的理解与适用[N].人民法院报,2018-09-08(004).

  [11]“剑网2020”专项行动启动聚焦5大重点领域[J].新闻世界,2020(7):36.

  [12]党玺,王万玉.数字音乐版权区块链技术保护的相关法律问题研究[J].电子知识产权,2020(4):28-42.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号