图书销量预测偏差与校正_中国（武汉）期刊交易博览会（刊博会）

　　【作　者】杨金花：河北大学新闻传播学院

　　【摘　要】本文借鉴认知心理学相关成果，从传统选题判断原理入手，探究图书销量预测偏差根源;通过引入销量预测校正程序，调控整合相关信息，用符合统计预测规则的方法进行销量预测，以期规范编辑预测行为，降低企业财务风险。

　　【关键词】选题判断；销量预测；偏差分析；校正程序

　　图书销量预测是出版企业经常面对的老问题与重要问题，因其既是企业选题决策的重要环节，也是落实执行选题的关键步骤，更是衡量选题最终成功与否的核心指标。本文借鉴认知心理学相关成果，在调研和文献研读基础上，从传统选题判断原理入手，探究图书销量预测偏差根源，并据此引入销量预测校正程序，用符合统计预测规则的方法进行销量预测，以期规范编辑预测行为，降低企业财务风险。

　　一、传统选题判断原理及销量预测偏差分析

　　认知心理学认为，人们的许多判断决策都是基于对不确定事件可能性的信念，是直觉预测与信心判断的结合，传统图书选题判断决策及其销量预测的本质亦如此，主要依赖于编辑在实践中积累的经验进行预测和判断。因此，我们有必要对影响编辑准确判断的因素进行分析，从而提升其预测质量。

　　（一）传统选题决策模式及其判断原理

　　传统出版企业图书选题决策模式，主要采用莱恩与彼得森（1982）总结的“技能与企业家精神”模式（编辑根据经验提出选题，决策者依据编辑已有信誉——业绩记录、发掘作者并签订作者的能力等，对其提出的选题进行判断）和“产品形象”模式（模仿社内外决策链中已通过的选题，特别是销量大的图书选题，更容易获得通过），依赖编辑经验、信誉和同行意见进行判断决策。[1]随着市场竞争加剧，一些出版企业虽然从内容价值、市场销路和可行性等方面细化了选题判断标准，但因有些编辑出版人员不了解其背后的机制和原理，[2]实际操作中仍然主要依靠经验进行判断。如约翰·B.汤姆森2005—2009年考察英美大众出版社时，发现这样的决策模式仍在沿用：编辑对图书类型的熟悉程度及由此做出的前景判断、社内外他人的评价；[3]国内出版企业也多如此沿用，如有的出版企业实行“首席编辑”制度，首席编辑可以自主研发、策划、组织实施品牌图书和重点项目。[4]

　　上述选题决策模式，本质上是依靠代表性启发式原则进行的判断决策。认知心理学研究表明，人类经常面对重要信息不确定、不可获得的状况，且没有无限的时间和精力，当其需要评测一个未知事件的概率或一个不确定数值的价值时，往往依赖数目有限的几种启发式，将评估概率和价值预测的复杂性降为较为简单的判断性操作。[5]“技能与企业家精神”与“产品形象”模式就使用了这样的启发式之一：代表性启发式，即通过“A代表B的程度或者A类似于B的程度，来评估概率”[6]，它评估的是一个事件与总体在基本特征或核心特征上的相似程度，因为在很多情境中，具有代表性的结果确实比其他结果更可能发生。现实中，出版企业根据各自规模和生产能力，每年推出少则几十种，多则成千上万种新书，读者随书随机聚散，企业没有更多时间与精力放到每个选题上，依靠编辑经验将选题与同类图书，特别是同类成功图书进行比较，然后根据相似度以及由此产生的信心进行预测和判断，这样的判断原则和方法比较实用，一些优秀编辑、出版人据此推出了很多既有社会效益又有经济效益的好书。

　　（二）销量预测偏差分析

　　事实上，影响人们判断准确性的，不只有代表性证据，还有结果的先验概率以及证据的可信度，忽视了这些因素，判断和预测会“系统地和根本地违背统计预测的规则”[7]，产生系统性偏差。一些编辑出版人员由于不了解上述心理认知过程以及缺乏相关统计预测知识，导致了系统性错误，造成很多选题几近随机决策：“我们每年出版的精装书，可能一半亏钱一半挣钱，仅有30%是真正高于我们预期的。”[8]表现在销量预测上，则为盲目乐观或过度自信，经常根据选题内容等特定证据预测一个较大的首印量（销量预测的一种形式），使一些本来能获得盈利的选题陷入亏损境地，浪费了大量资源，增加了企业财务风险。

　　传统选题判断中的销量预测主要涉及统计预测中的类别预测和数值预测，与三类信息和一个规则密切相关：先验信息或者是背景信息，个案的特定证据，预测的预期准确度；统计预测中的一个基本规则是，预期准确度控制着先验信息及特定证据的相对权重，即当预测的预期准确度降低时，预测应该更为回归，也就是更接近按先验信息做出的预测。[9]下面，我们通过传统选题判断情境中对选题特定（代表性）证据的处理，来探究销量预测偏差根源。

　　1.忽视分布性信息，利用单一性信息决策

　　编辑进行选题判断可利用的决策信息主要分为单一性信息和分布性信息。单一性信息即个案的特定证据，由有待论证选题的内部证据构成，如有关选题内容情节、作者知名度、写作风格等信息；分布性信息，包括在类似情境或案例中有关结果分布的信息，如有关该类图书选题实现率、成功率与各种销量的外部信息。

　　传统上，编辑可获得的分布性信息是稀缺的，因此主要依据部分单一性信息进行判断决策，而不是同类图书选题结果的实际分布情况。如一些编辑提出选题时，常常认为只要内容好、情节吸引人或作者名气大就能卖得好，然后预测一个较大的销量。这实则是过度关注内部证据，将该选题的基本特征或特定证据与同类选题基本特征或核心特征进行匹配比较后，过分强调其局部代表性，然后高估成功概率，盲目预测销量。有经验的编辑都知道，编、印、发不同阶段任何一个环节出了问题，都可能影响出版结果，上述选题判断不但没有意识到外部流程性复合概率评估难度，没有考虑该选题包含了太多的不同和太少的聚类，也没有考虑同类图书的分布性信息（如平均销量）或市场先验信息（如二八法则），导致预测时过度自信与乐观，大概率使选题陷入库存积压的尴尬境地。

　　2.忽视回归，在缺乏预期准确度的情况下做极端预测

　　数字出版环境下，编辑通常能同时掌握某个选题的单一性信息和同类图书市场的分布性信息，很多编辑因为缺乏相关统计预测知识，对选题判断与销量预测仍然依赖于主观印象。一些编辑在选题论证时，经常会说A是B（如这本书是本土版的《秘密花园》），从而很有信心地推断A（这个选题）也能畅销或卖得好，然后预测一个较大的销量。通过印象与成功案例简单匹配来进行判断和预测，显然是高估了此类选题的成功概率。这种情况下，最具代表性的估值应该是该类图书销量分布均值、众数或中位数。而且这种凭主观印象使用代表性启发式的预测方式，往往是在缺乏预期准确度的情况下做出的极端预测。现实中，一些编辑为了使选题容易通过，会有意无意地选择一本销量大的同类图书作参照，描述其内容价值与参照物的相似性，相当于用异常值作参照，极不合理——在可靠性和预测有效性程度都很低的信息基础上做极端预测。

　　有经验的编辑都知道，图书销量与其最初印象预测关系甚微，即不论编辑看好或不看好的选题，都有卖得好或卖得差的情况，这意味着图书销量的可预测性为零。在这种情况下，编辑对销量的最好预测应该是在该类图书销量的均值，而不是个人对该选题的主观印象。实践中更普遍的情况是，实际销量往往落在该类图书平均销量和编辑个人预测量之间，因为预测应该是回归的，且可预测性越低时，预测越应该与类别均值接近；同时又因每个编辑预测能力不同，现实中几乎没有一本书的销量正好等于其类别均值，因此编辑最好的销量预测应该是在编辑个人预测量与类别销售均值之间的某处取值。

　　二、销量预测校正程序引入

　　实践中如何利用单一性信息和分布性信息做正确的回归预测，即较为精准地预测销量呢？在此，我们引入认知心理学家、诺贝尔经济学奖得主丹尼尔·卡尼曼及其合作伙伴有关直觉预测的校正程序，[10]在遵循统计预测规则的前提下预测销量。这一程序共有五个步骤。

　　（一）选择一个参照类别

　　这一步骤的目标是为需要判断的选题筛选出一个合适的参照类别。筛选的条件是，参照类别的分布性信息是已知的或有把握做出合理推定。

　　通常情况下，编辑预测一个选题的销量，可以参照多个类别指标，如可以参考同一作者以往的图书销量、同一大类图书平均销量、同一主题图书平均销量，等等。同一作者的其他图书销量虽然提供了最容易的比较基础，但图书写作不是工业流水线生产，编辑手头的这个选题很可能是作者创作高峰后的作品，而且以往畅销还有可能是话题性畅销、平台的知名度和信誉背书等外部原因，因此其预期销量很有可能落在以往销量结果范围之外，实际更可能的结果是卖得极其一般；同一大类图书虽然最具包容性，且能较为容易地获得结果分布统计值，但有可能因为内容的异质性太强而妨碍与手头选题的可比性，如一部引进版推理小说的销量很难参照外国小说的平均销量进行预估，一部《诗经》学史书稿的销量也很难用人文社科类图书的平均销量进行预估；相对而言，同一主题图书这一参考类别最为恰当。因而在此阶段，编辑的任务就是要准确找出同一主题图书这样的参考类别。

　　（二）评估参照类别的分布性信息

　　编辑需要对确定下来的图书参考类别在一定时间段内（如三年、一年、近三个月等）的平均销量进行统计评估。数字环境下，这类数据相对容易获得，因为很多企业购买了业内第三方数据服务公司——“北京开卷”的相关服务，可以根据需要进行统计查看；一些企业还购买了当当、京东、淘宝、新华书店等大型销售商的数据；有些先进企业，如上海世纪出版集团、中国工信出版集团、浙江出版联合集团等，自主开发了经营管理系统，系统中有印数评估支持体系或库存测评体系，可以直接调用相关数据；小微企业虽然买不起相关数据，也没有专门的管理系统，但因绝大部分渠道都开放了客户图书销售数据服务，编辑依然可以自己动手利用Excel办公软件进行统计、估算。

　　现实中，不同企业的经营能力不同，如有些出版企业的图书销量远高于市场同类书平均销量，且根据自身选题情况，制定了S、A、B、C等不同级别的首印量标准。在这样的企业，上述方法仍然可以发挥作用，如可以统计本社同类图书销售均值，或进一步统计同类书中S、A、B、C级的比例，从而避免盲目定级。

　　（三）直觉预估销量

　　除了参考类别的分布性信息，编辑手里还会有不少该选题的单一性信息，正是这些单一性信息使编辑确信其符合该类图书，特别是成功图书的核心特征，同时又与同类其他选题区别开来，因此格外重视。此时可以要求编辑在单一性信息基础上，对选题销量做出直觉预测。这种直觉预测很可能是非回归性的，因为当编辑对选题内容详细了解（如与作者深入交流或被书稿内容吸引打动）或高度投入后（如提出修改意见并被作者采纳），很容易低估、忽视或掩盖相关分布性信息，过度强调其代表性和独特性，高估选题成功发生的概率和销量。

　　接下来的两个步骤，要纠正这个错误，使销量预测获得更加全面充分的评估。

　　（四）评估编辑预测准确性

　　这一阶段，决策者要对编辑预测结果的准确性进行检测，提升证据的可信度。在线性预测背景下，评估方法主要与预测值和结果值之间的积矩相关。如果企业有数据记录，编辑预测准确度系数依据皮尔逊积矩相关系数公式即可推知，此不赘述。

　　即使缺乏相关数据，也可以借助变通的方法进行主观评估。鉴于很多编辑缺乏统计经验，决策者可以借助某些非直接程序，如询问编辑类似问题：在社里同时出版的两本同类图书中，你有多少次在预测哪本会卖得更多时是准确的？关于预测和结果之间的序列相关性估计，卡尼曼等提供了一个经验公式：“如果ρ是结果被正确预测的案例占整个被预测案例的比例，则τ=2ρ-1提供了一个预测准确度的指标。τ的范围从0（预测处于随机水平）到1（预测得完美无缺）。在许多情况下，τ可以视为ρ的粗略估计。”[11]这个公式巧妙评估了编辑的预测能力：ρ应该在0.5和1之间才有意义和价值，等于或小于0.5意味着编辑的预测能力为零。这种变通的主观评估方法，实践中还有其他变体，如编辑提出新选题时往往会说“我有百分之X的信心能卖好”。

　　（五）校正直觉预估销量

　　根据统计预测规则，对非回归性进行校正，直觉预测应该向参考图书类别的平均值方向调整：一般情况下，直觉估计与类别均值之间的差距，应该用积矩相关系数来削减。卡尼曼等在此也提供了一种评估方法，转换成与本文相关的公式：预估销量=平均销量+编辑预测准确度系数×（编辑预估销量-平均销量）。如果没有相关记录，采用主观评估方法，如编辑预估销量为10000册，且此类图书平均销量为3000册，假设编辑对该销量有80%的信心和把握，须先转换求得编辑预测准确度系数，即τ=2×0.8-1=0.6，那么销量的回归估算就等于3000+0.6×（10000-3000）=7200。决策者可以据此帮助编辑决定是坚持原有估值，还是采用校正后的估值，亦或修正后取某个中间值。

　　需要说明的是，由于缺乏相关数据，步骤（四）、（五）使用了变通的主观评估方法——非常规线性模型，看似极简单，也极其倚重直觉，但20世纪70年代以来的认知心理学研究表明：“非常规线性模型是指模型中权数的选择根据一些非最优的方法。权数可以选择为等同的，也可以根据预测者的直觉来选择，或者随机的选择。但是，非常规模型可能具有重要的效用。”[12]在编辑预测准确度系数的主观评估法中就使用了这样的方法。之所以有效，因为“选择变量的总是个体的人，并且了解预测变量与兴趣标准之间的方向关系”[13]，就如同20世纪60年代将善于解决不确定性问题的贝叶斯范式引入认知心理学研究：“用贝叶斯路径来对主观概率进行分析和建模的有效性，很大程度上并不取决于主观估计的准确性，而是这一模型是否抓住了判断过程的主要决定因素。”[14]本文中的校正程序不但抓住了判断过程的主要决定因素，而且吸收了编辑经验的精髓：虽然没有量化的标准答案，但他们知道哪些因素与选题成功有直接关系。

　　三、价值与意义

　　（一）完善选题决策机制，规范编辑预测行为

　　如校正程序所展示的，编辑的预测能力实际是一种未经校准的主观概率评估，传统选题决策模式除了最终出版结果，没有相关方法对其预测能力进行评估，漏洞和风险不言而喻。实践中，企业不能因此简单地抱怨编辑或一味地向编辑施压，一方面这是人们普遍的认知偏差；另一方面每个编辑每年要做多个选题，不要说传统上难以获得分布性信息，即使现在信息就在手边，对编辑个体而言，也可能因为数量过于庞大或缺乏相关知识，很难在一次判断中适当地有效组织和使用。因而，出版企业从决策制度上引入上述校正程序，可以帮助编辑完善判断预测过程，不犯错或不重复犯错，整体提升其业务水平。

　　（二）简化选题决策流程，降低企业财务风险

　　选题论证是出版企业重要的管理决策之一，其中大量时间用在了对市场前景的预测上。由于不了解统计预测规则，很多企业的销量预测基本是在前三个步骤基础上直接调整，即未对编辑预测能力校准的情况下进行调整，虽然考虑了分布性信息，但并不科学。还有些企业为分散预测风险，要求编辑提出一个参考首印量，然后让发行部门征集渠道意见或订数，决定选题是否通过或进行销量调整，这实际是让同行对编辑预测能力进行判断。一般常规选题，这样的方法简单实用，但面对原创独创选题，编发人员往往难以达成共识；再者目前图书市场整体规模增长缓慢，渠道自身KPI考核压力较大，预订普遍保守，编发人员也多难以达成共识。重要的是，这些都是未经评估编辑预测准确性下的判断，调整后的印量不符合统计预测规则。引入上述校正程序，不但可以简化流程，还可以使财务关口前置，降低风险和试错成本。

　　参考文献

　　[1]丹尼斯•麦奎尔.麦奎尔大众传播理论[M].崔保国,李琨,译.北京:清华大学出版社,2010:271.

　　[2]通过决策漏斗,将流程性的复合概率评估降为较简单的判断性操作｡参见杨金花.简明图书选题决策模式[J].决策与信息,2019(10):108-114.

　　[3]约翰•B.汤姆森.文化商人[M].张志强,译.南京:译林出版社,2016:81,151-165.

　　[4]龚莉.“首席专家”制度与出版品质[J].中国编辑,2016(3):4-7.

　　[5][6]丹尼尔•卡尼曼,保罗•斯洛维奇,阿莫斯•特沃斯基.不确定状况下的判断:启发式和偏差[M].方文,吴新利,张擘,等,译.北京:中国人民大学出版社,2013:3,4.

　　[7][9]丹尼尔•卡尼曼,保罗•斯洛维奇,阿莫斯•特沃斯基.不确定状况下的判断:启发式和偏差[M].方文,吴新利,张擘,等,译.北京:中国人民大学出版社,2013:51,53.

　　[8]约翰•B.汤姆森.文化商人[M].张志强,译.南京:译林出版社,2016:165.

　　[10]丹尼尔•卡尼曼,保罗•斯洛维奇,阿莫斯•特沃斯.不确定状况下的判断:启发式和偏差[M].方文,吴新利,张擘,等,译.北京:中国人民大学出版社,2013:462-470.

　　[11][12][13][14]丹尼尔•卡尼曼,保罗•斯洛维奇,阿莫斯•特沃斯基.不确定状况下的判断:启发式和偏差[M].方文,吴新利,张擘,等,译.北京:中国人民大学出版社,2013:468,436,438,48.

业内信息

图书销量预测偏差与校正