大数据读剧本:技术还是艺术?
美剧《纸牌屋》的成功,让人们看到了科技参与艺术创作中的可能性。利用“大数据”对影视剧进行“全身CT”,亦成为现实。
通过人工智能读取、拆解影视剧文本,再根据大数据比对进行剧本评价,由计算机为人“打分”。从浩如烟海的剧本中找到优秀作品并投入创作,也许将成为未来影视剧创作的必由之路。
专访
“大数据”,是近年来的科技热词,为数不少的领域都将其作为技术发展的突破口;影视作品创作,则一向被视为人类情感与创意的结晶。将两者结合碰撞出的火花,既新奇又绚丽。
用“大数据”审视人类创作,其背后的机制如何?科技“理性派”能给艺术创作带来什么?带着这些问题,本报专访了北京工商大学经济学院统计与数量经济系副教授、小土科技创始人兼CEO祝金甫。
“电视剧每集包含6个转折最能吸引观众”
记者:让计算机去分析剧本,首先需要它能读懂剧本。那么程序是怎么理解剧本中的转折、冲突?
祝金甫:首先,将剧本导入计算机后,程序会自动分析其中的文字并分解成不同的元素。再将这些元素进行分析、比对,就能让计算机去理解剧本。
例如剧情中的拐点、转折,一定是伴随着某一个事件。就好比剧本中之前还是大晴天,突然开始下暴雪,那这其中就包含一个转折;再比如前面是一对恩爱的夫妇牵着手走着,突然发生了车祸,那这里就蕴含着一个巨大的转折。我们的计算机可以通过比对文本中的文字去计算。
与此同时,这还有个程度问题。比如车祸,可能涉及到角色的死亡,也可能就是受伤,到剧情里就是转折的大与小。这都需要去判断,其背后也就是计算机的语义分析技术。通过语义分析,我们还能分析剧本中人物的情绪。例如恐惧,涉及的词汇可能有流汗、颤抖等等。
让计算机能够准确地理解含义,需要我们收集大量的词义,创建一个库。这个工作需要很长时间,我们已经做了七八年的时间。目前,对于剧本的整个分析过程还做不到全自动化,计算机只能承担大约50%的工作,随着计算机技术的不断发展,我相信这个比例也会逐渐增大。
记者:计算机对剧本的量化评分,需要基于一定的标准,这个标准又从何而来?
祝金甫:这也是通过大数据分析得出来的结果,此前我们收集了大量优秀的作品,对这些作品进行分析,从而得出一些共性的东西。例如电视剧每集四十多分钟,包含6个转折最能吸引观众。通过这些标准我们再分析新的剧本,得出综合的评分,目前来看,我们的评分也是很准的。高分的剧本拍出来后,收视率和好评率都有一定的保障。
记者:目前国外也有基于大数据分析进行影视剧创作的先例,利用大数据评估剧本和定制剧本有什么区别?
祝金甫:两者之间还是有很大的区别,我们的评估方式,是找到优秀剧本的共性,对剧本进行一个客观的评估。有点像给你的剧本做CT,再根据统一客观的标准进行评价。
国外一些案例则是收集用户喜好的行为数据,例如什么题材用户最爱看,最喜欢哪个明星,碰到什么剧情就快进。通过这些数据,再来投其所好,选择用户偏好的题材、演员乃至导演进行创作。
“70%的规定动作大数据来做,剩下的30%要靠人的创作”
记者:用硬标准给艺术创作打分,必然带来一种质疑。这样的评价机制,是否会让剧本的创作僵化,难道以后每集电视剧都要包括6个转折?
祝金甫:曾经有编剧就问过我,如果大家都这样去做,不是所有作品都一样了?
首先,影视作品也是一件商品,它必须吸引观众的眼球。那么能吸引眼球的,一定会有一些共性。因为人有其自身偏好特点,一个作品,连续6分钟对话没有冲突,那观众就是看不下去。一个故事包含人物地点时间,缺一个就不行,这些是结构化的。但这个冲突是什么,故事如何铺垫,每个剧本都是不一样的,这是计算机做不到的。
用计算机来评价剧本,是给出一个意见。比如你这一集里只有3个转折,我们会建议你加几个,但加什么还是编剧的创作。我相信这会是未来影视工业化的一个趋势,比如和做体操一样,70%的规定动作大数据来做,剩下的30%是自选动作,要靠人的创作。真正的大师级作品,一定是人在这30%里赋予独特的思想和灵魂创作出来的。
记者:这样的技术是否会影响创作者的积极性,甚至反感此类技术?
祝金甫:之前确实有很多这样的担心,但现实恰恰相反。绝大多数创作者,把作品视为自己的孩子,他当然希望孩子会更好。那我们这种第三方的评价方法,起到一个旁观者清的作用,我们提意见,创作者再完善作品,会让作品更好、更受欢迎。
主笔 吴楠 插图 宋溪