2月4日至9日,素有人工智能研究风向标之称的美国人工智能协会年会在旧金山拉开帷幕。在本届会议上,出现了更多的中国面孔。除了IBM、Google、Facebook、Uber等外国公司,国内百度、腾讯、小i机器人等公司也参与了会议,其中复旦大学与小i机器人合作的两篇论文被大会录用。
AAAI成立于1979年,与其他顶尖AI学术会议不同的是,AAAI并不盲目跟风追逐热点,而是把目光聚焦在促进人工智能的研究工作上,通过三十年的不断累积,是业内具有极高学术影响力的学术会议之一。今年的AAAI共接收论文700多篇,其中半数有华人参与,论文录用意味着学术成果获得国际同行的认可,在相关学术问题上达到了国际领先水平。
AAAI会议能够拥有如此影响力不仅仅只是依赖严谨的学术论文,讨论“接地气”社会化议题的研讨会、设立与人们生活息息相关的人工智能产业应用展区都是吸引全球AI学者的原因。Facebook,百度,腾讯,微软,Amazon,IBM等科技巨头都积极参与其中。
小i机器人展区以AI领域成熟的产业应用吸引了来自各国学术、企业界,投资人的广泛关注。另外:AAAI作为吸引人才的一个窗口,不少海外学生现场表达了加入国内公司的意愿。
论文:聚焦机器自然语言理解的分类体系
复旦大学肖阳华博士带队的研究小组与小i机器人合作的Graph-Based Wrong IsA Relation Detection in a Large-Scale Lexical Taxonomy《基于图模型的大规模分类体系中的错误检测》和On the Transitivity of Hypernym-Hyponym Relations in Data- Driven Lexical Taxonomies《数据驱动的大规模分类体系中上下位关系的传递性》两篇论文被大会收录,并在会议上做口头报告。
自然语言理解是实现人工智能的关键,而分类体系在机器自然语言理解中不可缺少。两篇论文从不同的角度对大规模分类体系进行了深度探讨。
其中《基于图模型的大规模分类体系中的错误检测》主要研究如何提升自动构建的大规模知识库的质量:知识库在人工智能中起着重要的作用,其中,不管是人工构建的还是自动构建的知识库都获得了较多关注。相对于人工构建的知识库,自动构建的知识库规模更大,覆盖更广,但常包含更多的错误。该研究小组关注于包含isA关系的分类体系知识库,他们发现这些分类体系中往往存在环,而这些环经常是由于错误的isA关系导致的。从这个发现中,论文提出了两种模型用于从环中找出错误的isA关系。第一个模型通过在分类体系中提取DAG子图来消除其中的环,而第二个模型利用对分类体系中的结点定义层级来消除环。目前,已经在最先进的自动构建的分类体系Probase上实现了这两个模型。在处理了数千万关系以后,以91%的准确率消除了7.4万条错误关系。
《数据驱动的大规模分类体系中上下位关系的传递性》研究分类体系中的基础关系——上下位关系。
近几年研究人员构建了许多大规模的从语料自动抽取并构建的分类体系。这些分类体系包含了词汇之间的上下位关系(hypernym-hyponym)。上下位关系使得机器具备泛化能力,可广泛用于诸如实体分类、推荐等应用。论文聚焦于上下位关系的一个重要特性:传递性的判定问题。研究者发现,与人工构建的小规模分类体系和本体库不同,在大规模的自动构建的分类体系中,传递性并不总是成立。因此,他们提出了一个有监督方法来判定一个大规模自动构建的分类体系中传递性是否成立。基于这一判定方案,他们进一步利用传递性推断来发现分类体系中缺失的上下位关系。研究团队通过大量实验验证了相关模型与方法的有效性,并为当前现有的分类体系补全了近4百万缺失的上下位关系。
这已经不是第一次小i机器人与复旦大学合作研究成果被国际会议所认可了。在去年7月举行的人工智能联合会IJCAI上,小i机器人与复旦大学的学术论文被录用,而这些只是双方合作成果中很小的一部分。在构建大规模知识库方面,小i机器人与复旦大学计算机学院已经共同研发了最大的中文结构化百科CN-DBpedia、完成了深度学习算法在自然语言处理中的研究,建立了面向十亿规模知识图谱的在线自然语言问答系统。
以百度、腾讯、小i机器人为代表的中国人工智能企业踊跃参与,半数华人参与的入选论文,充分展示中国在人工智能领域的科研能力;今年评选出的7位院士有一位就是华人,据了解,AAAI-17也因为与中国的春节时间相冲突而改时间,华人在国际顶尖学术组织中的影响力正在不断提升。