业内信息

有声读物行业标准化现状与问题

2020-12-10 来源:《科技与出版》
  【作 者】陈磊:中国新闻出版研究院

  【摘 要】从喜马拉雅等主要的有声读物平台抽样下载有声读物并进行标准符合性测试,对有声读物行业的标准化现状进行定量定性的详细剖析,发现有声读物行业存在的标准化意识低、采标率低、现有标准不够完备等各种问题,结合有声读物行业的标准化发展特征,针对该行业发展所呈现的产业标准化短板给出相应的对策和建议。

  【关键词】有声读物;标准符合性检测;标准化现状;问题;对策

  我国有声读物市场发展势头迅猛,iiMedia Research数据显示,2018年有声读物用户达3.85亿,预计到2020年可达5.62亿,年复合增长率近30%。对于这个日新月异的出版行业新分支的标准化应用及行业内在发展状况,当前业内普遍缺乏充分了解,相关标准化研究也处于空白状态。本文尝试通过对有声读物产品的标准符合性检测,分析该行业的标准化应用状况,查摆既有问题,为该行业发展理清思路。

  1 分析方法简介

  首先,本文选取知名有声读物网站平台作为抽样检测对象。有声读物网站除畅听网可通过PC下载外,其余网站均只能采取手机App模式下载,然而多数App均采取了一定的版权保护方式,下载后经尝试各种方式均无法在手机缓存文件夹内找到相应音频,因此按照可找到原始文件的标准,最终从知名有声读物网站中确定4个网站作为抽样对象,即畅听网、喜马拉雅、天方听书、懒人听书。每个有声读物网站抽样50个音频文件,共200个音频文件。

  其次,采用客观数据作为检测指标。根据已颁布的国家标准,目前对于音频质量的检测有两种方式。一种为主观检测评价,依据的标准分别为GB/T 35784-2017 《视听设备 音频系统小损伤的主观评价方法》和GB/T 16463-1996 《广播节目声音质量主观评价方法和技术指标要求》。一种为客观检测评价,依据的标准为GB/T 33665-2017 《声像节目数字出版物技术要求及检测方法》。主观性检测评价对于听音场地和听音设备要求较高,难以齐备,且这种方法即便推广到全社会,对于很多有声读物网站而言,囿于客观条件限制也难以实现以此方法的自查自纠,行业实用性有限,因此,笔者决定采用GB/T 33665-2017号国家标准的方法进行检测并与标准数据指标进行对照,对有声读物行业的标准化运营情况进行分析研判。

  2 有声读物行业标准化现状分析

  2.1 自主知识产权的国家标准采标率较低

  数字内容编解码技术,贯穿音频全产业链,属于音频领域的核心技术。2018年前,声音编码技术主要掌握在美国杜比手中。我国则因自主研发且拥有知识产权的声音编码国家标准的缺失,中国企业在该领域不得不面临技术专利、著作权等知识产权等带来的髙额专利费和版权交易费的困扰。至2018年,我国完全自主知识产权的AVS音频编解码核心技术进入了国际标准三大先进编解码行列,形成了国家标准GB/T 33475.3—2018 《信息技术 高效多媒体编码 第3部分:音频》。

  从抽样采集测试结果看,主要有声读物平台使用的音频编解码技术主要为美国主导的MP3、DTS、AAC等国际标准,而我国主导研制的AVS音频标准技术基本没有被应用于市场。标准应用偏好也体现出我国主流有声读物平台没能及时跟踪国内最新标准进展。在当今中美科技热战的大背景下,中国数字编解码核心技术与标准的市场地位缺失,意味着国内企业只能充当“制造商”的角色,大部分利润将被美国拥有专利权的组织攫取,更重要的是,我国企业可能因此而丢掉有声读物产业未来发展的主动权。有声读物平台对国家标准动态不够敏感,侧面折射出我国有声读物行业的国内标准化普及和应用程度还较低。

  2.2 行业标准化整体水平偏低

  本文对每个有声读物网站抽样50个声频文件,进行声音指标测量。从检测结果分析,畅听网、天方听书网、懒人听书3个有声读物平台抽样的150个音频文件,即便按照数字声像最低质量的数据指标检测,也没有一个音频文件符合标准规定,标准达标率为0。喜马拉雅作为目前最知名的有声读物制作和分发平台,其产品质量明显高于行业平均水平,从其平台抽样检测的50个音频文件中,仅有“7b1674090cf260f704d18a799ed814d750.mp3”与“d98c611ad919c6de6e9104ddd517afc5.mp3”两个音频文件不符合标准指标,其余文件均符合标准指标要求,达标率为96%。4个平台有声读物的总体达标率为24%。天方听书网抽样得到的50个音频文件全部为单声道,而单声道因水平太低,早已从国家标准中淘汰,当前国标中对于声道的规定分为双声道和环绕声伴音(多声道、环绕声或全景声)。

  我国《标准化法》规定:企业应当按照标准组织生产经营活动。法律条款清楚明确表明,数字音频产品提供商有义务对用户提供质量保证,尤其付费用户更应获得符合标准的相应产品。而从标准符合性检测结果看,有声读物行业的标准化应用程度、社会责任感均有待提高。

  2.3 低位标准运行现象凸显

  从此次有声读物的标准符合性检测过程看,当前有声读物行业的标准化低水平运营现象较为突出,主要表现于音频压缩方面。为节省带宽,方便用户在线收听,有声读物均采取了音频压缩技术。本次检测显示,有声读物产品大部分采用MP3编码。但从音频编码角度看,无压缩的WAV格式才是业内公认的音频编码最佳标准格式,该格式直接存储来自模数转换器(ADC)的信号,被广泛应用于音频制作公司的原始母带录制。压缩算法主要针对时间域冗余、频率域冗余及听觉冗余进行的统计学声音重建,但是所有压缩因为用到解码芯片计算力,对比WAV格式都会有一定的时延,所以虽然压缩分为有损伤压缩与无损伤压缩,但从主观听感看都会受到不同程度的影响。即便是有损压缩,也有不同的优劣等级。MP3采用的是MPEG Audio LayerIII标准技术,压缩比能够达到12:1,现在AAC国际标准技术采用了利用听觉系统掩蔽特性来压缩声音的数据量,同等质量条件下压缩后文件容量仅为MP3的70%,是更先进的压缩方式,特别是我国自主研发且拥有知识产权的AVS音频编码,可以实现与AAC同等水平的高质量压缩,更应为有声读物网站所重视。但在包含音乐、曲艺、小说等多种表达形式和题材的有声读物网站里,所抽查的4家有声读物平台只有喜马拉雅采用了这种最新的音频压缩方式。由此可见,行业整体标准新技术应用水平仍然偏低。

  3 有声读物行业标准化问题分析

  3.1 有声读物行业标准化服务意识集体低下

  有声读物市场需求近几年飞速膨胀,用户数量不断增长,但从此次检测结果看,有声读物厂商在行业宏观面不断向好的氛围下整体缺乏忧患意识,服务水平较为低下。

  按照标准声音指标测量结果,有声读物市场的总体标准符合率不到50%,已检测的4家有声读物平台,3家达标率为0,即便总体达标的喜马拉雅,其音频产品比特率也严重偏低:所抽检的50个音频文件中,44个比特率为64kbps,4个比特率为24kbps左右,距离可满足正常听感的比特率差距比较大。根据行业标准CY/T 183.1—2019 《有声读物 第1部分 出版的相关要求》,有声读物比特率应不低于128kbps。虽然根据不同编码格式,比特率不能做单一比较,比如喜马拉雅采用了压缩率更好的AAC格式,但AAC与MP3之间的压缩率之比远大于1∶2,因此可以断定,喜马拉雅提供的产品比特率仍然较低。

  另外的检测统计结果更清晰地表明,服务水平低的根本原因在于有声读物企业主观上根本不想提供更高水准的产品服务。如畅听网、天方听书网和懒人听书3家服务平台产品的取样精度均近似为0,前两者的取样频率为22.05kHz,只达到标准规定最低取样频率的一半,天方听书网更是所有产品均为单声道,而单声道的声音节目除了非立体声广播、声道定位等少数特定场合外,现在已经几乎为行业所摒弃。如此大规模违背常识,偏离标准规定,大幅降低服务品质的主要原因是在大好的市场形势下,企业即便大幅降低成本服务缩水也不影响其生存。通常情况下,取样频率、取样精度越低,文件体积越小,声道数越少体积也相应越小。以天方听书网的文件“001红事会 高晓攀 陈曦.mp3”为例,12.2m的文件容积,却有26.5分钟的时长,且为单声道,经精细计算其实际取样精度仅0.000937bit,和国家标准中标准质量声音节目最低16bit的规定相去甚远。

  3家有声读物平台整齐划一的取样精度表明,这样的行为系有意为之。这样的低劣付费产品不但触犯了标准化的相关法律规定,也对行业未来发展带来巨大的不利影响。这种集体恶意识不消除,将成为未来阻碍有声读物发展的最大障碍。

  3.2 有声读物行业标准观念整体淡薄

  在抽样研究的过程中,笔者发现众多有声读物平台完全各自为战,自定标准,对于国家标准的内容几乎不了解。实际上,按照GB/T 33665-2017号国家标准的规定,音频产品应分为高质量声音节目和标准质量声音节目。而有声读物厂家给出的产品服务分类却是五花八门,有的标识高品质,有的甚至采用视频评价规则标识高清品质,如图1、图2所示。



图1   氧气听书声频质量分类


图2   企鹅FM声频质量分类

  在此次标准符合性检测中,没有一家有声读物网站产品质量完全达标。同时此次抽样检测中,有声读物产品呈现出千奇百怪的自定义分类,折射出当前众多有声读物平台的标准观念相当淡薄。

  3.3 现有标准已不能充分满足行业需求

  虽然GB/T 33665-2017 《声像节目数字出版物技术要求及检测方法》于2017年颁布并实施,但其前身为CY/T 100-2013 《声像节目数字出版制作技术要求及检测方法》,系由行业标准升级而来,基本内容均承继前身行业标准,且基本原样延续,除删除声像节目制作流程部分外,未发生重大改版变化。但是在这3年间,有声读物行业已发生巨大改变,如原来的MP3国际标准工作组已经解散,继而代之的是AAC国际标准工作组。

  标准化测试的实践表明,必须用更加丰富的手段、数据对有声读物进行分析,才能满足音频质量检测的需要。当前的有声读物普遍使用压缩技术,然而因压缩格式的不同,其相关指标也有很大差别,如作为主要压缩技术的MP3和AAC,两者的判定数据差别很大。而这些在现有的国家标准里都没有体现或提及。因此,现有国家标准亟待修订,以满足有声读物行业的快速发展需求。

  4 对策建议

  4.1 全面加强标准宣贯工作力度

  针对行业普遍存在的问题,必须全面加强标准宣贯力度。扩大标准宣贯的范围和层面,从以往单纯针对出版单位为培训对象,转变为全面面向相关产业、交叉领域进行拉网式培训,把产业上下游相关单位、机构、组织也纳入标准培训的对象范围。近几年,有声读物产品所属的新闻出版业各标委会在开展的数字出版相关行业标准培训时,发函针对出版单位居多,遗漏了数量更大的具有数字出版资质或尚无数字出版资质但已事实上从事网络数字出版业务的有声读物加工制作及分发机构。今后新闻出版业的有关标委会应加强对行业的认识,扩大标准培训对象范围,对有声读物行业整体开展普惠型宣贯培训,促使音频相关企业多参与,多互动,多交流,全面提高音频标准意识。

  同时,还应想方设法增加标准供给方式和手段,有效满足行业获取标准的迫切需求,实际提升标准宣贯后的行业使用效率。国务院标准化协调推进部际联席会议办公室已于2017年印发《推进国家标准公开工作实施方案》的通知,明确到2020年基本实现国家标准全部免费公开的工作目标。当下,全部强制性国家标准已实现网络系统公开,而众多新闻出版行业标准目前只能通过从出版社购买获取,有关出版社也往往采取按需印刷的标准供给方式,客观上造成了标准在行业流通不畅的现象。建议有关标委会能够在相关行业行政管理机构的直接指导下,依照《推进国家标准公开工作实施方案》的精神要求尽快建设起完整的相关标准数据库,允许通过互联网的方式实现标准的免费、公开下载获取。

  4.2 尽快补齐标准符合性检测行业短板

  标准符合性检测是推动标准化工作不断前进的重要安排和有效手段,能够检验评估标准在行业的推广实效,切实加强行业标准工作力度,是带动行业升级进步的重要抓手。建议由有关政府市场管理机构牵头,尽快增加音频产品标准符合性检测这一行业环节,有效填补管理空白,解决因缺乏标准硬性监督而出现的自建标准、有标不依、各自为战乃至无标生产的行业乱象。推动标准检测工作应该首先解决广大受众和用户最关心、最迫切的问题,特别强化对质量、安全、性能等影响用户健康和产品体验方面的标准符合性检测,使标准检测工作做到抓铁留痕、落地有声,得到全社会的有力支持和响应。

  数字化技术发展对音频产品标准符合性检测的条件要求越来越高,不仅需要相关专业人才,还需要专门购置的硬件、软件并开展有关环境建设,筹备工作较为复杂。为尽快推动这一工作展开,可考虑以中国新闻出版研究院作为这一建议依托,使之成为标准符合性检测工作的行业试点单位。中国新闻出版研究院承担了新闻出版标准化技术委员会秘书处工作,于2014年申请筹建北京市科委重点实验室,并于2017年获得了考核通过。数年间,中国新闻出版研究院积极推进实验室能力建设,搭建了标准测试平台,研制了“内容标准符合性测试工具集”“标准间的标准符合性测试工具”等6套测试工具,标准符合性检测工作支撑能力得到了进一步增强。有声读物为代表的数字出版行业已经完全具备独立开展第三方大规模专业检测的能力和实力。

  4.3 加强行业综合治理,防微杜渐

  加强行业综治水准,做到防微杜渐。首先要继续强化版权管理能力,提升版权监察硬度,建立起严格的版权审查机制,从源头上卡住不达标版权产品的来源,杜绝市场流通渠道。要大力推动DCI版权标识符在数字音频产品版权交易流程中的应用,条件具备时,可考虑由有关标委会牵头组织相关版权保护机构,共同推进针对版权和技术双重指标认定的标准化联合行动,确保标准检测常抓不懈,止住行业赚一把就走的歪风,弘扬行业正气。针对音频产品领域里版权归属复杂的问题,可考虑引入ISLI等可追溯、可检索的相关标识符,对词曲创作者、录制作者、后期调音作者、发行权人等进行个体标记,确保所有检测不达标的环节可定位,确立完善的标准责任追索机制。

  在全民狂欢的市场下,不加强管控,很容易滋生各种社会问题。要强化网络技术监测能力,建立网络巡查机制,针对有声读物普遍的UGC(User Generated Content)用户创作内容产生方式,定期抽样检测。不符合标准的,可以上线但不能收费;不符合内容规定的,坚决下线,追究责任。要通过不间断的标准符合性检测,逐步提升整个行业采标、用标的服务意识和大局意识,规范行业秩序,建立行业规则,形成依标自检、出错自纠的行业风气。逐步培养行业树立标准理念,建立以标准指引产品品质的业态思考习惯。

  4.4 加快完善标准体系建设

  从此次抽样检测的标准实际应用情况看,现有标准已经暴露出了落后于行业实践的问题。而音频领域这几年发展迅速,技术引领下的数字音频亟待更新标准规范。目前,我国互联网上各种可下载有版权的有声读物产品超过100万件,作品数量庞大,增长迅猛。仅有一个GB/T 33665-2017号国标,虽然已不能满足行业需求。要想改变这一状况,就必须尽快在现有国标的基础上加快建立并完善音频产品标准体系,形成未来音频标准的明确发展规划,有序引领未来音频标准的研制和修订工作。

  首先,要对现有国家标准加以修订。在质量检测方面,增补对音频本地噪声、声道相位、响度等指标的要求。要注意吸收最新的标准研制成果,使标准更加完善、实用,如应参考最新的标准编码技术GB/T 33475.3-2018 《信息技术 高效多媒体编码 第3部分:音频》,将AVS音频编码增补修订进GB/T 33665-2017 《声像节目数字出版物技术要求及检测方法》的基本技术要求中。

  其次,要结合并伴随科技进步发展,有计划、有步骤地平稳推进对周边领域相关标准的研制工作,逐步形成全面的音频产品标准系统。如针对单一声源的模拟全景声规范研制,针对更多种类音频产品的相关标准研制,针对周边软件、硬件和有关环境条件的标准研制工作等。通过上述工作,逐步缓解因标准缺位而引起的行业产品制作加工、流通发行、质量检测评估等规则混乱问题,整体提升行业标准化运维和服务水平。

  最后,在组织关系上要清晰,做到问责有人。可考虑由GB/T 33665-2017号国标的组织实施机构全国新闻出版标准化技术委员会牵头,先期尽快组织有关业内专家对于编制音频产品体系表的工作展开预研究,并尽快在此基础上正式全面展开音频产品标准体系的研制工作。

  5 结语

  本文通过对有声读物样品进行标准符合性检测,从标准化角度对有声读物行业进行分析,为行业研究提供一种新的思路和视角,是标准化行业应用的一次有益尝试。限于篇幅,不能把全部抽检结果一一展现解析,权当抛砖引玉,希望大方之家批评指正。

  参考文献

  [1]卢官明,宗昉.数字音频原理及应用[M].2版.北京:机械工业出版社,2012.

  [2]张大陆,沈斌,胡治国,等.丢包对音频流体验质量的影响分析[J].计算机应用,2009(1):16-17,31.

  [3]李慧文,邱小军.对扬声器主观音质进行客观音频质量感知评价[J].电声技术,2010(5):27-31.

  [4]倪萍,魏芳.基于PESQ算法的彩铃铃音质量评估系统[J].计算机应用于软件,2012(10):145-147.

  [5]薛殿玉.数字节目音频质量监测[J].现代电影技术,2013(3):34-41.

  [6]薛殿玉.数字节目音频质量监测(二)[J].现代电影技术,2013(5):10-18.

  [7]李佳霄.数字音频质量监测方法研究[J].科技传播,2015(4上):70-71.

  [8]徐晓娜,张雪,赵艳明,等.压缩域音频质量客观评价算法研究[J].数字信号处理,2010(4):75-78.

  [9]王蓓蓓,唐猛,甘萍.一个高质量额数字音频压缩算法[J].西南交通大学学报,2000(4):179-182.

国家广播电视总局 | 湖北省人民政府 | 中国邮政集团公司 | 武汉市人民政府 | 中国期刊协会 | 中国图书进出口(集团)总公司 | 中国邮政集团公司报刊发行局 | 湖北省广播电视局 | 湖北日报传媒集团 | 长江广电传媒集团 | 长江日报报业集团 | 知音传媒集团 | | 湖北中图长江文化传媒有限公司 | 决策信息网 | 湖北新闻出版广电传媒周

copyright(c) 2013 湖北省新闻出版局 版权所有 技术支持

鄂ICP备19004605号-4  鄂公网安备 42010602004016号