中新网2月10日电 当地时间2月5日(北京时间2月6日),2017年全球首个人工智能学界的顶级会议,暨 2017 届美国人工智能协会(AAAI)年会在旧金山召开。中国百度、美国谷歌、微软、Uber等人工智能产业的巨头均参会并分享自己的研究成果。百度副总裁王海峰应邀做了主题演讲,对百度自然语言处理技术进行了全面讲解。他指出,依托百度得天独厚的用户和数据优势,自然语言处理技术得到深厚积累,并已经应用在百度的搜索、Feed、o2o等众多产品上。NLP技术的发展将对实现人工智能发展产生至关重要的影响。
今年大会首次设立了应用人工智能(AI in Practice )环节,王海峰在该环节做了名为“百度的自然语言处理”(Natural Language Processing at Baidu)的主题演讲。他在开篇中提及,计算机对人类语言的处理和理解十分重要。自然语言处理的目的,就是让计算机能够处理和生成人类语言,从而让机器具备人类的思考和理解能力。
他同时指出,NLP是人工智能中最为困难的问题之一。百度公司十分重视该领域的研发,不仅在基于大数据、机器学习和语言学方面的积累上研发了针对NLP的知识图谱,并大量分析、理解语言、段落及篇章,陆续建立和完善了机器翻译和对话系统。
百度持续通过平台化的方式对有关产品进行支持。王海峰证实说,百度开发的NLP Cloud平台拥有 20多种 NLP 模块,每天的请求数量超过1000亿次。相关数据分析和技术已经应用在百度搜索、Feed、O2O和广告等业务与产品方向,并取得了卓越成果。
通过基于深度学习的语义理解,百度NLP对语言的查询理解效果相较传统模式大为提高,在语言生成领域已经有多个成功运用的实例。对此,王海峰向与会的专家学者列举了百度新闻自动写作、AI篮球评论、AI中文作诗等应用实现。其中,百度的自动写作系统已经完成了数千篇文章的写作,在百度Feed产品中被数百万的用户阅读;百度AI写出的诗词与古人创作的诗词放在一起,不仅让绝大多数人无法辨识出来,还被历史学者、《中国诗词大会》嘉宾蒙曼教授称赞为“和人类诗人的作品一样具有感情色彩”。
王海峰强调,这些成就的取得得益于百度广泛运用深度学习能力有关。百度从2013年开始应用深度神经网络算法模型至今,已经对这个模型进行了几十次升级迭代,从而确保了NLP研究始终拥有可靠和给力的技术基础。
在自然语言处理应用系统方面,百度持续强化和升级其机器翻译的水平。王海峰说,2015年5月,百度将神经网络机器翻译技术应用到百度在线翻译服务中,推出了全球首个基于深度学习的大规模在线翻译系统。同年,百度还在百度翻译app中上线了离线翻译功能,让用户在没有网络连接的情况下也可以使用翻译服务。目前,百度翻译已可支持全球28国语言、756个翻译方向之间的互译,每日翻译次数达1亿以上。
为应对用户日益增多的服务需求,百度还提供语音翻译及利用OCR技术进行的图片内容翻译。如今,百度还把百度翻译和百度搜索引擎结合在一起,用户在搜索框内直接输入外文即可获得翻译结果。
王海峰介绍称百度NLP通过平台化的方式对更多产品进行支持,迄今百度已经为超过2万个企业和开发者提供百度翻译API,让对方提升自己的产品功能创造更优质的服务。