ÈË ÖÇÄÜ Ô Ö°æò ÄÓ°Ïì °Ó ÔÇ Îö

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 4

特 / 别 / 策 / 划

SPECIAL

人工智能对出版业的影响及
思考 应对浅析
曹  沁  颖
中国人民大学出版社,100080,北京

摘  要 本文分析了人工智能这一新技术在出 深度学习是指建立多层人工神经网络,并且
版相关领域的发展,并从编辑职能、选题策划及传 训练它。一层神经网络会把大量矩阵数字作为输
播、供应链三个具体方面,提出了出版社应如何应 入,通过非线性激活方法取权重,再产生另一个数
对人工智能带来的变革,分析了要实现这三个应 据集合作为输出。这就像生物神经大脑的工作机
对必须解决的大数据痛点。在此基础上指出,要 理 一 样,通 过 合 适 的 矩 阵 数 量,多 层 组 织 链 接 一
真正面对技术挑战和社会变革,需要从长期角度 起,形成神经网络“大脑”进行精准复杂的处理。
改变产业格局,实现产业内和跨产业联盟。 深度学习技术在技术层面的运用,为其下一代
关键词 人工智能;深度学习;价值发现;大数 版本提供训练数据,此过程循环往复。长此以往,
据;联盟 建立在大数据和超强计算能力之上的人工智就能
形成类似人类直觉判断一样的准确性很高的判断。
出版业是一个古老的行业,在漫长的岁月中
推动人类知识、观点、文化的传播。近几十年来, 1  人工智能在出版相关领域的发展
互联网技术迅猛发展,其中,人工智能的发展尤为 人工智能对出版业的深刻影响主要在三个方面。
引人注目,大量资本涌入该行业,据统计,中国大 1.1  语言
陆 在 AI 领 域 共 涉 及 10 亿 美 元(约 合 人 民 币 68 亿 在人类探索人工智能的过程中,对语言的处
元)202 次的投资,规模很大。无数顶尖科学家和 理是一道难关。语言和创造力一样,是人类特有
技术专家在语言识别、自然语言处理等方面进行 的、最具有人类性的特征。人类的逻辑思维以语
深入研究,而与技术发展紧密相关的智能传播、智 言为形式,人类的绝大部分知识也是以语言文字
慧供应链等,又在商业和产业层面,给出版业带来 的形式记载和流传下来。
了诸多挑战。未来 10 年或者更长一些的时间,人 让人机之间可以直接用自然语言交互,是人
工智能将会对中国许多行业产生冲击和影响。 们长期以来所追求的。因为它既有明显的实际意
本文力图从几个方面,探讨人工智能对出版 义,同时也有重要的理论意义:人们可以用自己最
业的影响。 习惯的语言来使用计算机,而无须再花大量的时
人 工 智 能(Artificial Intelligence),英 文 缩 写 间和精力去学习不很自然和习惯的各种计算机语
为 AI。它是计算机科学的一个分支,在计算机技 言;同时,人们可通过它进一步了解人类的语言能
术突飞猛进的今天,人工智能的研究力图探寻“智 力和智能的机制。
能”的实质,并生产出一种新的、能以与人类智能 简单来说,人工智能要攻克语言难关,需要实
相似的方式做出反应的智能机器。 现:语音识别—让计算机听懂人说的话;语音合
人工智能的方向很多,比如深度学习,迁移学 成—让计算机能够用人类的语言反馈;自然语
习等,其中深度学习是非常重要的一个方面。它 言处理—让计算机能够阅读人写的文章;自然
的出现在 2001 年,时间虽然不长,但却获得了极 语言生成—让计算机生成文本。
大的进步。 实现自然语言理解和自然语言生成是十分困

2017年  科技与出版  第  11  期 7


特 / 别 / 策 / 划
SPECIAL

难的,造成困难的根本原因是自然语言文本和对 国 外,美 联 社 于 2014 年 7 月 开 始 采 用 Automa


话的各个层次上广泛存在的各种各样的歧义性或 tedInsights 公司的 Wordsmith 平台自动编写企业财
多义性(ambiguity)。形式上一样的一段字符串, 报,每季度可生成 4 000 份财报,相比此前编辑们每
在不同的场景或不同的语境下,可以理解成不同 季度的 400 份财报来说提升巨大。而这套人工智能
的 词 串、词 组 串,并 有 不 同 的 意 义。 为 了 消 解 歧 系统还拥有“自主学习”功能,在三个月内自主掌握
义,是需要极其大量的知识和推理作为背景的。 了新闻写作基本规范,错误率更低,文章质量进一
而目前,语言学家和计算机专家正在做的是: 步提高。
将成熟的语言学知识和规则通过标注输入计算 1.2  传播
机,让它归纳出其中规律,生成统计模型。然后将 根据中国互联网信息中心的数据,截至 2017
消除歧义的知识加以收集和整理,用适当的形式 年 6 月,中 国 网 民 规 模 达 到 7.51 亿 人,占 全 球 网
存入计算机系统,并有效利用它们来消除歧义。 民 总 数 的 五 分 之 一;互 联 网 普 及 率 为 54.3%,超
这曾经看起来是遥不可及的任务,但目前,此 过全球平均水平 4.6 个百分点。手机网民占比达
方面已经获得了长足的进展。 96.3%,移 动 互 联 网 主 导 地 位 强 化。 截 至 2017 年
1.1.1  翻译 6 月,我 国 IP 总 量 均 居 世 界 第 二;中 国 网 站 数 量
在全球化的今天,对于出版界来说,翻译显得 为 506 万 个,半 年 增 长 4.8%;国 际 出 口 带 宽 达 到
尤为重要。翻译界人士估计,目前全球翻译市场的 7 974 779Mbps,较 2016 年底增长 20.1%。
年规模达到 370 亿美元。
《乔布斯传》和《从 0 到 1》 用户的需求越来越个性化、定制化、精准化。
等新书被迅速本地化,;中国文化走出去战略,也产 在 传 统 媒 体 时 代,信 息 相 对 稀 缺,并 且 由 于 技 术
生了大量中国图书被翻译成各种文字的需求。 的限制,用户只能接受统一的、标准化的信息,但
美 国 科 学 家 Warren Weaver1947 年 提 出 了 利 是这种信息传播方式远远不能满足用户的实际需
用计算机进行语言自动翻译的想法。经过了几十 求。而在互联网时代,由于互联网技术的快速发
年 的 努 力、挫 折、沉 寂、复 苏,自 2011 年 开 始,伴 展,互联网媒体能够利用大数据技术更好地分析
随着语音识别、机器翻译技术、DNN(深度神经网 用户的潜在需求,也使得用户的信息需求越来越
络)技术的快速发展和经济全球化的需求,翻译研 个性化和定制化。
究成为当今信息处理领域新的研究热点。国外, 智能传播平台根据用户特征、场景和文章特
google、facebook 等企业在智能翻译上已经取得了 征 作 个 性 化 推 荐,实 现 真 正 的 千 人 千 面,有 效 解
巨大进展,而中国企业科大讯飞 2017 年推出了全 决信息过载与用户个性化、定制化的信息需求之
球首款实时中英互译便携式机器。 间 的 悖 论,进 而 有 效 地 沉 淀 用 户。 例 如,对 于 公
1.1.2  写作 务员会推送《人民日报》和央视的信息,对于农民
在国内,2015 年 9 月,腾讯财经一篇名为《8 月 就 多 推 送 农 业 技 术 的 相 关 信 息;在 没 有 Wi-Fi 的
CPI 同比上涨 2.0% 创 12 月新高》的文章引起了媒 环境下,多推荐耗费流量不大的图文信息,而在有
体人的普遍关注,大家的关注点不在它的内容,而 Wi-Fi 的环境下,则多推荐耗费流量大的音视频。
是其作者。这篇文章是名为 Dream Writer 的写稿 用户看到的新闻和资讯,都是人工智能在大数据
机器人写的,它不止引用了统计局的数据,还引用 基础上通过深度学习判断并推送的。
了业内人士对数据的分析。 1.3  供应链
2015 年至今,腾讯的写稿机器人出色完成着相 对于图书出版来说,实体书的存在,决定了图
关资讯整理工作。除了腾讯外,新华社的“快笔小 书离不开纸张、印刷、生产、运输、销售的过程,供
新”、今日头条的“xiaomingbot”都是已投入应用的写 应链对于出版业来说是十分重要的。
稿机器人。它们在内容较为精简,数据信息为主的 传统供应链的发展,技术的渗透性日益增强,
场景,例如体育赛事报道等场景中,已经广泛使用。 很多供应链已经倾向于具备或已经具备了信息

8 2017年  科技与出版  第  11  期


特 / 别 / 策 / 划
SPECIAL

化、数字化、网络化、集成化、智能化、柔性化、敏 和作品。同时,在推动中国文化走出去的过程中,
捷化、可视化、自动化等先进技术特征。供应链也 语言方面的困难和障碍也就不成问题了。
经过了初级供应链、响应型供应链、柔性供应链, 2.2  用人工智能辅助选题策划和营销传播
现在向智慧供应链发展。在初级供应链阶段,企 互联网的发展深刻改变了人们的生活方式、
业按照预算安排生产和交货,响应型供应链注重 交流方式和阅读习惯。我们可以做出两个判断:
直接成本的同时考虑客户交互,对客户订单进行 ① 信 息 爆 炸 不 会 停 止,时 间 碎 片 化、阅 读 碎 片 化
快速响应,柔性供应链是内部充分整合后的供应 成为常态。②大数据让人们的性格和偏好通过点
链,关注供应链整体成本,主张跨部门充分协同、 击、阅读、购买等行为被清晰地刻画出来,个性化
柔性化和精益敏捷。智慧供应链在客户及供应商 的传播和推送只会越来越精准。
之间信息分享和互动协同,真正实现了通过需求 出版业的传播难题在于,出版肩负着文化传
感知形成需求计划。 播的使命,但厚重和体系化是它的特点,与互联网
传播趋势不同步。如何才能利用新技术,推动行
2  人工智能对于出版的挑战以及应对 业发展?
之策 2.2.1  利用大数据和人工智能对人们的阅读习
从上文的分析可以看出,人工智能给出版及 惯进行分析,帮助进行选题策划。
相关行业都带来了或者说将带来巨大的影响和冲 我们可以从新闻界得到启发:
《纽约时报》的
击,如何看待并应对?核心在于:突出出版的核心 Blossomblot 可以根据社交平台的文章进行大数据
价值,实现跨社跨行业的联盟。 分析,推测哪类型内容更具热度,辅助编辑挑选合
2.1  弱化编辑的语言修改职能,强化编辑的文化 适的素材,经过该报内部统计,经过 Blossomblot
价值发现职能 筛选后的文章点击量是普通文章的 38 倍。
我们看到,人工智能在语言方面通过深度学 出版界也是一样。一方面,对于大众图书,大
习等技术手段已经取得了长足进展,虽然现在还 数据和人工智能帮助下的选题,在市场表现上肯定
不能达到人工从业者的水平,但是随着技术的进 会有突出表现。在这方面,已经有一些出版社做出
步,错误率越来越小,用户的体验越来越好。这对 了尝试和探索,并取得了一些成效。例如,中国青
于出版者来说是非常有价值的: 年出版社副社长王瑞 2016 年底表示,该社已经通过
一旦机器能够较大程度上纠正作品中的语言 大数据抓取开发了一些符合大众需要的选题,受到
错误,出版社应该拥抱甚至推动这个领域的人工 了读者的认可。另一方面,在大数据和人工智能帮
智能,把一些文字纠错的职能交给人工智能去做, 助下,学术出版也能对于学术前沿有更好的把握。
编辑进行监控和复查。大量的人力和精力就可以 2.2.2  对图书内容进行拆分,将其融入读者的碎
投入到出版的核心价值中去:发现和挖掘优秀的 片时间和场景中,引导读者对图书的阅读。
思想者、优秀的文化作品。挖掘优秀思想者、优秀 目前很多学习社区、学习型软件,其实就是在
文化作品,需要大量阅读和深厚的积累,需要价值 做这一步,其中做得优秀的比如罗辑思维等已经
的感受和判断,数据的收集和分析是人工智能的 获得了巨大的影响力和经济回报。此类知识服务
强项,但价值判断是人工智能无法进行的,而这, 商用户意识非常强,他们提供的知识型产品,许多
正是编辑工作无法被人工智能替代的地方。 内容来自于图书,他们针对用户需求对图书内容
全球文化交流更加不会受制于语言,没有了语 作了精细的碎片化,并且用听、读、讲等多种形式
言的掣肘,更加有利于出版社的价值发现。这就要 呈 现,从 而 融 入 了 读 者 的 碎 片 时 间 和 场 景,加 上
求出版者用全球视野,用语言人工智能作为辅助工 在微信初期积累的红利,获得了滚雪球式的发展。
具,不仅发现中国的优秀思想者、英语世界的优秀 其提供的内容,也得到了广泛的传播,值得出版社
思想者,还挖掘和发现全球其他文明中的优秀作者 学习和借鉴。

2017年  科技与出版  第  11  期 9


特 / 别 / 策 / 划
SPECIAL

2.2.3  发挥编辑价值判断优势,引导优秀内容的 4  技术将推动行业格局改变


传播
世界许多国家的出版业已经形成了寡头垄断
在人工智能时代,纯算法推荐容易让低俗内
的行业格局,例如,在法国,位于榜单前 10 位的出
容、标题党和不当内容受到广泛传播。在内容接
版商控制了 87.5% 的份额。在美国,5 大社的市场
收上,基于流量和利益诱导,曲意迎合用户的算法 份额高达 80.2%。韩国营业额超过 1 500 亿韩元的
推荐给用户的只能是越来越同质化、越来越无价 大 型 企 业 不 超 过 9 家,大 都 是 教 育 出 版 社。 在 英
值的内容,让用户陷入“信息茧房”中,日益背离 国,5 大社(不包括独立出版联盟)的市场份额达
技术让人获得更丰富信息的初衷。在这方面,需 50.8%,前十大社的市场占比高达 59.8%。
要编辑去引导优秀内容的传播。 而中国的出版行业,在市场准入方面壁垒很
2.3  利用人工智能优化供应链 高,但市场格局方面集中度却很差。
传统的精益生产理论强调制造就是增值的,那 行业集中度差的结果是,出版社在微观层面
是产品时代的思维,在智能供应链时代,只有客户 竞争激烈,无法形成联盟。而通过上文关于技术
买单的才是增值的,过量生产就是浪费。利用人工 和人工智能对出版业的影响我们可以看到,随着
智能优化供应链,让生产制造更个性、更具弹性、 技术的进步,市场越来越需要出版商之间结成联
响应速度更快,从生产开始,拉动物流、采购、配送 盟关系,甚至跨行业联盟,共同打造供应链平台、
等各个环节,以最终用户作为一切经营的出发点。 传播平台、销售平台,这样才能在产业变革中适应
变化,运用新技术为出版业服务。
3  痛点的解决
所以,未来,无论是政府从宏观层面促进,还
出版社利用人工智能,目前面临一个最大的 是出版单位基于市场压力自发行动,出版业走集团
痛点:数据不足。 化发展道路都是可预见的趋势。而且,集团化必须
人工智能需要大量数据来不断优化调整,李 是实质的而不是名义的。面临人工智能等新技术
开复曾表示:三个顶级专家和少量的数据,与三个 带来的社会变革,企业和行业发展比以往更需要用
二流专家和大量数据,在人工智能某方面进行竞 长远眼光从长期利益上着眼,拥抱变化,推动变革。
争性研发,一定是数据多的二流专家会领先。
在实际运营中,出版社面临的困难在于:出版
参考文献
社无法获得大量数据。从终端看,无论是网上书店
[1] 中国互联网信息中心. 第40次《中国互联网络发展状况
还是实体书店,都难以与出版社共享读者购买数
统计报告》[EB/OL]. [2017-08-04]. http://cnnic.cn/hlwfzyj/
据;从供应端看,生产厂商也不与出版方共享数据。
hlwxzbg/hlwtjbg/201708/P020170807351923262153.pdf .
这导致无论在生产端还是销售端,出版方都很难有
[2] Hinton G, Deng L, Yu D, et al. Deep neural networks
足够的数据来用人工智能辅助改善决策与运营。
for acoustic modeling in speech recognition: The shared
对于广大出版社来说,部分解决这个痛点的
views of four research groups[J]. Signal Processing
办法是根据特点相近、优势互补原则,结成较大联
Magazine, IEEE, 2012, 29(6) :82-97.
盟,开发联盟的销售平台、传播平台、生产平台,在
[3] 杨清清 . 腾讯写稿机器人背后:科技巨头抢夺万亿
联盟内共享数据。在生产端,通过联盟的力量,实 市 [N]. 21 世纪经济报道,2015-09-15.
现网络中的生产任务分配,减少排队等待等问题, [4] 郭全中 . 大数据时代下的智能传播及其盈利模式
缩短采购、印制等时间,提高印制效率;通过联盟 研究 [J]. 新闻爱好者月刊,2015(1):15-19.
的力量,和大的仓储物流商合作,减少图书流转时 [5] 李开复,王咏刚 . 人工智能 [M]. 北京:文化发展出
间。在销售端,建立联盟销售平台,增强联盟销售 版社,2017. ■
力量,在联盟内共享销售数据,为上游提供信息。 (责任编辑:苏磊)

10 2017年  科技与出版  第  11  期

You might also like