再现、表现与实现：有声出版发展中的技术赋能_中国（武汉）期刊交易博览会（刊博会）

　　【作　者】李芳馨：华中师范大学文学院

　　【摘　要】技术是推动有声出版发展的重要赋能手段。在有声出版领域，声音留存技术的再现功能使声音获得独立的可能性；声音编辑技术的表现功能使声音组合摆脱时间性转向艺术性；声音载体技术的实现功能使声音存储载体虚拟化，收听设备私密化。对有声出版技术的功能性进行梳理，集中思考有声出版技术赋能的产业价值及社会价值，并对未来有声出版的技术赋权进行展望。

　　【关键词】有声出版；技术赋能；出版技术；声音技术

　　声音作为一种古老的媒介，一直被视觉文字的霸权占领了生存空间。直到有声出版领域的开拓，声音技术的发展才真正进入大众视野。有声出版既成为新兴的出版形态，也是声音技术发展和赋能的必然产物。

　　有声出版的概念随声音技术的发展而不断深化和完善，尽管目前学界对其并无统一定义，但通过其外延的研究对象，不难看出有声出版的发展始终与载体、技术和符号性紧密相连。国内学者较多沿用美国音频出版商协会的相关定义，即“其中包含不低于51%的文字内容，复制和包装成盒装磁带、高密度光盘或单纯数字文件等形式进行销售的录音产品”。[1]实际上，这个较早的定义已经无法满足并描述有声出版领域的新形态。有声出版是基于出版符号、出版载体和出版技术为一体的新型出版形态。声音作为一种出版符号，尽管并不鲜见，却经历了漫长而缓慢的发展；声音作为一种出版载体，其附属地位长期变动不居，在过去没能取得相对独立的“一席之地”；声音作为一种技术手段的突出因素，技术赋能在其发展中发挥着关键作用。“赋能”一词源自心理学概念，指的是“个体或者组织对客观环境与条件拥有更强的控制能力来取代无力感的过程”。[2]而技术作为一种赋能手段，是强调技术作为一种行动方式所能产生的能力和影响。有声出版相关技术的赋能行为贯穿整个有声出版领域的发展进路，在声音的留存技术、编辑技术、载体技术等方面影响深远，三者都是呼应有声出版内涵的重要组成部分。

　　1 再现：有声出版中的声音留存技术赋能

　　声音留存技术作为有声出版的基础型技术，其产生奠定了有声出版的可能，声音摆脱了必须“在场”的桎梏，获得了“再现”的可能性，成为正式的出版符号。根据声音留存技术发展和演变，大致可将其分为以下3个阶段。

　　1.1 机械复制时期：声音摆脱“在场”

　　1877年，爱迪生发明的留声机使声音的留存成为可能，通过机械方法解决了声音留存播放问题。在原始机械时期，留声机作为留存声音的载体实现了声音符号的转化，突破了声音留存的技术难题。尽管这个时期的声音留存效果粗糙，且反复播放耗损大，但为日后有声出版技术提供了重要可能性。声音复制技术使声音摆脱了必须与发声体同时“在场”的困扰。按照谢弗的“声音分裂”[3]观点，大自然的声音都是一次性的，声音录制技术的出现，才使大自然的声音与经过复制加工的声音分离开来。技术的赋能不仅实现了声音与物理场域的“分离”，而且让声音获得一定的技术独立性和声音控制权，让人类对声音的把控也成了可能。

　　1.2 模拟技术时期：声音成为出版符号

　　模拟技术时期以20世纪电子音像出版物的诞生为开端，由此，声音成为真正的出版符号。电子学的发展使大量有声出版物得以实现商业化量产，因此这个时期解决了机械复制时期声音损耗大、保真难的问题，并以模拟技术为主要的技术手段。实际上，直到1979年，我国才开始发展音像出版业，1983—1989年，我国成立了818家音像出版社，此外还有92家出版社兼出音像制品。[4]在这个阶段，技术带动了产业的发展，市场与产业化发展初现端倪，有声出版获得大量的技术指导与政策支持。技术哲学家兰登•温纳提出“技术命令”的概念，即“技术是一系列的结构，技术的运行要求重新构建自己的环境”[5]。同样，在有声出版历经原始机械时期的技术自主性后，技术命令开始作用于声音模拟技术时期的各个环节。这个时期，不仅声音留存技术在迅速发展，多媒体融合技术也在稳步前行。技术的发明创造不再只是个别发明家的意愿，而成了整个领域的共同要求。

　　1.3 数字出版时期：声音获得独立地位

　　20世纪90年代后期，传统的有声出版物受到互联网技术的冲击，传统音像出版物的销量受到影响，由此，数字出版开始登上舞台，有声出版技术迎来新的技术革命。首先是有声出版物摆脱了储存体量的制约，实现了留存音质的高保真化，扩展了有声出版物的载体形式。物理属性的“虚化”和“消失”，让声音实现了真正意义上的“独立”，并真正破解了有声出版“文字语音化”的困局。其次是有声出版的直接内容创作。在过去，有声出版的内容生产往往离不开纸质出版，声音技术仅作为一种中介手段来实现两者之间的转化；而数字技术时期则直接实现了两者间的跨越关系，通过互联网技术直接进行有声内容的创作。如《罗辑思维》等有声出版物，形成了以移动音频平台为依托，以知识分享为目标，先输出语音内容再进行纸质出版的有声出版新形态。在数字技术的关照下，有声出版领域开辟了专属的空间场域。简而言之，数字出版时期的有声出版真正实现了“离场”后的独立。

　　2 表现：有声出版中的声音编辑技术赋能

　　声音的留存技术保证了声音的“离场”，并再现了声音的“真实”。而有声出版中的编辑技术则以表现“真实”为目标。在有声出版的声音编辑技术中，技术赋能给予创作者更多的自主性，这使编辑技术的艺术化和专业化得到了保证。

　　2.1 非线性编辑阶段：声音表现的专业化

　　传统的声音编辑技术单一，只能用于简单的衔接与转场，几乎没有艺术性可言，本研究并未将其视为能动的编辑创作。从某种意义上说，非线性编辑技术的出现才能被称为“编辑”。非线性编辑技术的主要特征在于：一是在编辑过程中不以时间为序，同视频编辑技术一样，采用点对点编辑的方式；二是随同数字技术而产生的数字信息储存形式。相较于传统线性编辑方式而言，非线性编辑技术让有声出版的素材库的检索更加便捷，同时保证了各类素材的融合并用。传统的线性编辑技术以线性时序为创作的基本标准，声音的留存方式是线性的、连续的，因而声音缺乏一定的艺术性和表征性。更重要的是，非线性编辑技术通过技术的变革为有声出版提供了新的技术思维。古往今来，声音一直被视作最具连贯性的介质，非线性编辑技术不止突破了原有的技术屏障，更摆脱了原有创作思维的束缚。正如苏珊•朗格所言，“技术是创造表现形式的手段、创造感觉符号的手段”[6]。非线性编辑技术的表现力使音频编辑这个岗位的专业性要求水涨船高，编辑需要运用专业化手段，掌握交叉、嵌套等基本的方式和编辑技巧不断增强声音表现的艺术性。

　　2.2 移动编辑阶段：声音表现的自由化

　　非线性编辑技术的产生提高了有声出版的从业门槛，因此创作者须具备一定的技术素养，运用专业技术思维进行创作，但移动编辑阶段的新特征则是对技术专业化的要求开始部分让渡于鼓励创作的现实需求。

　　移动编辑阶段出现大量的“准专业”人员，移动音频平台降低了有声出版的创作门槛，并试图通过平台自身的UGC（用户生产内容）最大限度地激发创作活力。在这个阶段，声音编辑技术开始进行有效简化，以期解放更多的内容生产力。由此，技术赋能的关注焦点从声音表现的艺术性转向声音表现的风格化。为了适应当下有声出版物的风格化需求，内容生产分化为两种模式：一种是实力雄厚的出版社自行组建专业团队，团队人员包括专业的主播、音频编辑、技术人员；另一种则是自助出版，这为出版社制作有声书提供了新的可能。出版社可以将文本上传至平台，同时附上对朗读者的要求，专业朗读者或者工作室可以搜索合适的题材，试音通过后将其录制为有声书[7]。简而言之，移动编辑阶段对于从业人员的要求从非线性编辑时期的专业性要求过渡到双线并行要求：一方面，专业编辑的素养仍是刚需性要求，这包括掌握传统的编辑技巧和移动时代的新要求，通过自身的专业能力与敏锐度不断捕捉和制作优秀的有声作品；另一方面，部分自助出版业态下的“准专业”人员也开始活跃起来，他们利用自身的个性特色创作风格化的有声作品。可以说，移动编辑技术拓宽了创作空间，鼓励更多的社会性参与，进而激发了有声出版行业的创造活力。

　　3 实现：有声出版中的声音载体技术赋能

　　随着声音载体技术的不断发展，有声出版的传播特征也在发生相应的变化，传播的载体从实体到虚拟，收听设备从公共到私人等，都呈现出有声出版领域的载体赋能特色。

　　3.1 存储载体的虚拟化：从实体到虚拟

　　有声出版物的载体类型随着声音载体技术的发展不断迭代。早期有声出版物的实体形式由唱片到盒式磁带，再到光盘，经历了一个音频载体的体积不断缩小、容量不断增大的过程。1997年，美国Audible网站推出世界第一款便携数字媒体播放器，数字有声书正式诞生。随着互联网和数字技术的飞速发展，有声阅读的内容存储载体逐步实现虚拟化和移动化，在智能移动载体的加持下，有声出版得以实现大范围的群体覆盖，随时随地可供收听，摆脱了声音转瞬即逝、无法反复收听的制约，开拓了广阔的市场和发展空间，出现了喜马拉雅、荔枝FM、懒人听书、蜻蜓FM等众多移动音频平台。

　　3.2 收听设备的私密化：从公共到私人

　　有声出版的虚拟化发展使智能收听设备的重要性不可小觑。其一，收听设备与技术改变了听众的收听习惯，从过去广播电视的公众播放转向当下私人移动设备的隐蔽聆听，收听设备的转变为听众提供了独立体验。由于声音的伴随性需求，智能收听设备需要满足真实感和空间感的技术要求，于是有声阅读开始与场景技术进行联结，通过无线蓝牙耳机营造属于有声出版物的特殊场域。AMSR（Autonomous Sensory Meridian Response）是通过特殊的声音制作搭配立体声耳机所形成的一种特殊现象，即通过声音的刺激诱发人脑对各种感觉的通感反应。在通感反应中，声音能够最大限度地营造和激发场景的真实感，有声出版运用AR/VR技术也是同理。在技术织就的有声阅读场景中，听众能够最大限度上地释放由听觉构建的想象空间。其二，播放和收听载体技术成为研究的重要转向。有研究者认为，个体可以通过智能移动设备获得一定程度的隐私和主体性，如保罗•杜盖伊等人关于索尼随身听的文化研究[8]。耳机设备使个体保有流动的私人听觉空间，声音播放设备加上便携耳机，可以打造最具现场感的“非场所”（non-place），即声音技术可以让声音“摆脱”场所和空间的限定，从而让人的身份、气息和光晕只凝聚为一个可以被不断叠加、编排和合成的新的场所空间幻觉。[9]可以说，便携耳机的发展使有声出版的接收方式实现了从“公共”到“私人”的转变，有声出版的声音载体技术实现了对听觉空间的赋能，至此人们开启了对声音载体技术的探索。在无线、降噪和场景的营造下，有声出版的内容因收听场景和收听目标不断分化，出现了各式无线蓝牙降噪耳机以及智能音箱等产品。不少音频平台借此研发并推出自己品牌的收听设备，比如，喜马拉雅于2017年推出的智能音响“小雅”，通过智能家居与收听平台的绑定，实现了收听空间的全覆盖。

　　4 思考与展望

　　从技术赋能的产业价值和社会价值出发，对有声出版现状进行思考，继而对技术赋能下的有声出版领域进行展望，笔者认为，未来有声出版领域有望从技术赋能过渡到技术赋权阶段。

　　4.1 思考：有声出版技术赋能的价值思考

　　从有声出版技术的赋能价值出发，重点关注技术赋能带来的产业价值和社会价值，通过赋能价值反思技术赋能的意义和可能存在的隐患。

　　4.1.1 有声出版技术赋能的产业价值

　　有声出版的发展与其技术链的形成息息相关。赋能的产业价值来源于每个阶段和层次的技术革新所带来的环环相扣的链式结构。随着有声出版技术的不断发展，技术对声音的把控力也在逐渐增强。“再现”“表现”“实现”既是有声出版不同发展阶段的技术赋能的具体表征，具有一定的前后承接关系，即一种技术的产生必须由另一种技术的产生和使用为前提，也是有声出版产品生产环节的特性归纳，存在一种上下游的链式关系。从赋能效果看，有声出版物从无到有，从有到美，从美到精；从产业形成来看，有声出版从单一独立到多元共生。在这样的技术产业链中，有声出版的产业价值通过技术手段相应的开发应用而由内向外地延伸开来。有声出版将声音留存、声音编辑、声音载体这3个看似独立实则相互联结的技术融为一体，将每一种技术的产业价值聚合在有声出版领域中，形成独特的商业价值。

　　4.1.2 有声出版技术赋能的社会价值

　　有声出版技术除去在产能上的贡献外，其所创造的社会价值同样深远。有声出版物作为有声技术下的产物，具有一定的社会互动性，有声出版技术的赋能参与到有声出版的秩序建构中，并成为重要角色。在技术创新所带来的外延反映中，有声技术重塑了人们的听觉习惯和听觉思维。

　　有声出版的技术主体性是首先需要思考的问题。从再现、表现、实现的赋能过程来看，有声出版显然已经从原来的被动等待，转变为现在依托技术创新而生成的技术自主性。在有声技术自主性发展的过程中，人作为社会的主体性存在，往往容易忽视新技术带来的异化问题。听觉思维和习惯的复归带来的是人对感官技术的重新适应。实际上，有声技术作为一种起源于感官的技术，从声音的留存技术开始，奉行的正是感官的替代和强化原则，正如美国的有声书起源于服务盲人的公益计划。从批判的角度来看，现代感官技术所追求的终极目标是从人的感官出发，经过替代、强化、省力的过程，最终彻底解放人体感官的功能性。但此时人类的主体性可能因感官的功能性消解而逐渐退化，由此，关于技术带来的主体性异化问题的讨论在所难免。有声技术的便利性和对现实需求的满足促成了人们对感官技术的依赖。但也正因如此，有声出版技术的出现让一些学者开始警惕和反思技术理性下的主体建构方式。“外部世界的声音环境呈现出某一时期的物质技术状况与权力关系；物质技术状况、权力关系以及它们参与形塑的声音环境，培养了相应的听觉方式，也由此塑造了主体经验的声音景观；这一声音景观与听觉方式又会反过来作用于外部声音环境的建构。”[10]在这样的互动下，声音技术塑造的“声景”具有丰富而又深刻的社会意义。学者们与对此类问题的警觉正是基于过去视觉霸权主义的窠臼，因此能够更审慎地看待有声出版技术赋能的正当性，破除原本视觉与听觉二元对立的观点。

　　其次是审视听觉的现代性问题。印刷术的发明让声音丧失其在口语传播时代的绝对优势，直至现代有声技术的出现，才让声音作为一种载体，听觉作为一种感受方式复归，从而显现出现代性的特征。之所以说声音具备现代性，是论及声音背后的“高效和支配力量”[11]，即在现代有声技术的加持下，形成有声景观，创造了声音景观的现代化。如韦尔施所言：“我们感官的重要性，总是超出它们自身的狭窄领域。如果说传统是视觉形象的一统天下，那么，这并不意味着来自视觉的信息是一切事物的定夺标准。不如说这是视觉的类型学被刻写进了我们的认知、我们的行为形式，我们的整个科学技术文明。”[12]听觉的现代性在于有了技术的赋能后，有声出版成为为声音“正名”的最佳文本样态，声音也将成为一种刻写进现代社会认知的重要方式。

　　4.2 展望：有声技术赋能活力与赋权潜力

　　不少学者将“技术赋权”和“技术赋能”两者混用。事实上，两者概念有偏重之差别。“赋能是赋权的特殊形式，也是赋权的张力所致，在抵达“话语”之前，赋能是赋权的一种基本面貌与回归。”[13]技术赋能重在展现技术作为一种行动要素的能力，而技术赋权则旨在强调技术作为一种权力关系所产生的影响。技术赋权的目标在于对权力的解放和强化，从当前有声出版的发展状况来看，有声出版的发展正处于“技术赋能”的阶段，并将在未来拥有更多“技术赋权”的潜力。

　　4.2.1 有声出版技术赋能活力：技术融合

　　面对当前有声出版领域的问题，技术赋能在解决问题和提供服务的同时，也在积极促进有声出版与其他领域的技术融合。

　　首先是有声出版的审核管理问题。国内的有声出版市场潜力巨大，2019年，中国有声书用户规模约4.78亿[14]，因此，有声平台对海量产品的审核也是困难重重，既要保证审核质量，也要保证审核的效率。目前，各大平台主要依靠人工编辑审核，效率较低，且依赖出版机构自律。[15]未来可通过语音识别和语义理解技术，通过智能算法对音频内容进行审查。同时，在海量的有声产品中搭建语音智能检索工具平台，进行产品快速分类整理，以解决出版物和出版人员的管理问题。

　　其次是有声出版物的版权问题。有声出版物的形式多样，且文字有声化转换所存在固有的版权困境，想要清晰判定并非易事。有声出版物的版权困局主要集中在对文字有声化转换行为的定性分歧上，有学者认定为，不论是复制、表演，还是演绎，都将导致不同的权利义务后果。[16]但随着5G技术的逐步普及，一些数字出版的版权技术公司开始利用5G技术下的智能云，生产内容可以进行实时的在线版权验证后再转为流式阅读和播放，以此规避离线下载的侵权风险。与此同时，有学者认为，利用区块链的“去中心化”技术，可以完善版权获取的合法渠道；利用区块链的“智能合约”，可以推动版权开发；利用发挥区块链的“时间戳”，可以优化版权保护。[17]

　　4.2.2 有声出版技术赋权潜力：感官平衡

　　技术凝结的社会资源将使声音和听觉成为重要的技术手段和赋权手段。针对有声出版技术的发展本身，如果能实现从“赋能”到“赋权”的过渡，那么不仅能够实现技术的价值最大化，而且能够将有声出版这一出版形态推向前所未有的重要地位。在技术的全方位赋能下，有声出版领域融合了众家技术之长。如果说出版行业的每一次技术变革都牵动着整个社会阅读方式和形态的变化，那么有声出版技术的发展和成熟则是与声音有关的各种技术联动融合效应下的结果。可以说，出版发展史就是出版功能的变迁史。[18]因此，只有在技术赋权的语境下，有声出版才能真正实现对原本弱势地位的改善和新地位的重塑。

　　可想而知，有声出版技术将原本单一的出版物的感受方式（视觉）进行权力性分流，以求平衡感官的各类诉求。有声出版通过有声技术的标准规范形成规划赋能，通过政府和社会层面的认同过渡到技术赋权。“声音、听觉和收听的技术及使用模式，变成了社会各行业和机构的标准的组成部分。”[19]现有研究对有声出版未来将会扮演的赋权角色寄予厚望，但并不是寄希望于通过有声出版彻底颠覆传统文字出版的力量，更多的是以有声出版技术赋权所获得的平衡力量来解决原有的视觉与听觉之间的“失重”问题。有声出版技术利用规划赋能形成合法赋权，对原有的“视觉中心主义”进行纠偏，在确立自己地位的同时均衡二者的相互发展。有声出版将通过有声技术的赋权，获得相应的合法认同，以更高的开放性服务社会大众。

　　5 结语

　　有声出版的发展经过了不同技术类型的不同表现，从声音留存技术的再现功能，到声音编辑技术的表现功能，再到声音载体技术的实现功能，是一个由技术要素重点驱动的过程。在未来，有声出版将会通过新技术的赋能不断完善自身和融合多领域发展。技术赋能在不断壮大的同时，也隐含着迈向技术赋权的转化趋势。有声出版的未来充满无限潜力，在新的技术赋能下将引发新的形态、新的地位、新的空间，以及新的权力关系等多维度的思考。有声出版的技术既是过往时期边缘生存的抑活剂，也是迎接当下主场的激活剂。

　　参考文献

　　[1]杨航.我国听书产业在网络下的发展和标杆性策略分析[J].编辑之友,2011(8):73.

　　[2]胡海波,卢海涛.企业商业生态系统演化中价值共创研究:数字化赋能视角[J].经济管理,2018(8):55-71.

　　[3]SCHAFER R M.The Soundscape: our sonic environment and the tuning of the world[M].Rochester:Destiny Books,1994:293.

　　[4]罗辛.中国音像业的调查剖析[J].中国出版,1991(Z1):66-68.

　　[5]WINNER L. Autonomous technology: technics-out-of-control as a theme in political thought[M].Cambridge:The MIT Press,1977:100.

　　[6]苏珊•朗格.情感与形式[M].刘大基,等,译.北京:中国社会科学出版社,1986:51.

　　[7]林丽萍.出版社视角中的有声书出版[J].出版参考,2018(10):43-45.

　　[8]保罗•杜盖伊,等.做文化研究:索尼随身听的故事[M].霍炜,译.北京:商务印书馆,2003:3.

　　[9]周志强.声音与“听觉中心主义”:三种声音景观的文化政治[J].文艺研究,2017(11):91-102.

　　[10]季凌霄.从“声景”思考传播:声音､空间与听觉感官文化[J].国际新闻界,2019(3):24-41.

　　[11]艾米丽•汤普森,王敦,张舒然.声音､现代性和历史[J].文学与文化,2016(2):95-99.

　　[12]沃尔夫冈•韦尔施.重构美学[M].陆扬,等,译.上海:上海译文出版社,2006:212.

　　[13]王建磊.APP:技术赋权的回归[J].新闻大学,2016(6):59-63,149.

　　[14]艾媒报告:2018-2019中国有声书市场专题研究报告[R/OL].(2019-01-23)[2020-04-10]..

　　[15]白林丰,杜恩龙.语音交互技术重构出版[J].科技与出版,2018(2):49-53.

　　[16]兰昊.有声出版中文字有声化的版权困局与定性探讨[J].电子知识产权,2019(11):19-28.

　　[17]刘一鸣,蒋欣羽.基于区块链技术的学术出版版权屏障研究[J].编辑之友,2018(8):95-99.

　　[18]周蔚华.从出版发展历程看出版功能转换[J].出版发行研究,2006(4):23-26.

　　[19]王敦.听觉的文化意义解读:过去和现在[J].中国图书评论,2012(5):41-44.

业内信息

再现、表现与实现：有声出版发展中的技术赋能