乌镇智库尼克:数据视角解读中国AI行业发展


2016-11-16  新华网FMCI未来研究院


11月1日到2日,以“感知时代 智造中国”为主题的首届中国智谷大会暨人工智能与产业创新高峰论坛在江苏南京举办。大会汇聚国内外在人工智能、机器人和大数据领域的产、学、研、用领先机构,交流科研和产业化最新进展及信息,探索核心技术研发、成果落地转化和产业化机制。会上,乌镇智库理事长尼克就乌镇智库最近的人工智能研究成果向与会嘉宾做了分享。


乌镇智库理事长尼克在题为《乌镇指数:全球人工智能发展报告(2016)》(投资与融资篇)的报告中指出,全球专利与企业数量、投融资在时间趋势与地理分布高度一致;在企业数量、专利申请数上,长三角领先珠三角;总体上,中国逐渐接近美国,也逐渐领先于世界。但在人工智能领域大学排名,中国大陆与世界尚有差距,还有较大进步空间。


乌镇智库理事长尼克在智谷大会上演讲


自1956年达特茅斯会议诞生“人工智能”一词以来,距今已有60年。在这期间,虽然人工智能涉及的不同学科、不同技术发展起起伏伏,但人工智能整体上一直处于不断增长的趋势,并不存在高潮低谷之说。比如1957第一款神经网络 Perceptron曾经推动了人工智能领域的发展,虽然后来被证明行不通,但随后兴起的专家系统继续发挥推动的作用。


可以说,整个人工智能的发展过程都是在这样的模式之中,不同技术在不同时期扮演着推动人工智能发展的角色。


在这样的趋势背景下,乌镇智库以大数据为驱动,依托大数据方式产生报告、指数。目前,乌镇智库已经通过战略合作获得海量的数据。其中包括:全球所有专利、全球1亿篇学术论文(接近Googlebooks的水准)、全国所有统计局数据、超过8千万条的知识图谱数据,以及其它各类投融资数据库。大量的国内数据和海量西方数据的积累,弥补国内很多政府部门、企业、研究机构的视野空白。


在此,我们基于人工智能行业的企业、投资融资以及研究成果等维度提供一个全新看待人工智能的视角。


AI企业:


全球人工智能企业集中分布在美国、中国、英国等少数国家,三国企业数量占总数的65.73%。美国还是整个行业的领导者,其人工智能企业主要集中在硅谷/湾区、大洛杉矶、大波士顿地区。中国的人工智能企业主要集中在北京、广东及长三角(上海、江苏、浙江)一带,占中国人工智能企业总数的84.95%。四川虽然数量不及上述三地区,但明显高于其它省市。目前,人工智能企业的主要应用领域主要集中在金融、安防、电商零售、自动驾驶、医疗健康、教育、个人助理等领域。


美国、中国的人工智能企业分布图


与人工智能企业分布相同,美中英三国融资规模位列前三,但三者间的规模差距较大,美国为英国的21.9倍,中国的6.96倍。全球人工智能领域的融资,自2005年以来,主要集中于种子轮。2016年之后,A、B轮略有上涨,意味着有优秀企业进入新的发展阶段。投资机构在地域分布上,美国、英国、中国为前三位,与其各自在企业数量、融资规模的次序相同。各国获得的人工智能领域投资次数,与当地企业数量、投资机构数量呈正相关关系。


AI专利:


目前中国在专利方面已经取得了长足的发展,尤其是在人工智能专利申请数上,成绩要快于其他行业。全球人工智能申请专利总数,美国、中国、日本位列前三,且数量级接近,三国占全球专利总数的73.85%。值得注意的是,中国专利申请数在三四年前就已经超过美国。位列第四的德国人工智能专利申请数仅为中国的27.8%,美国的16.8%。


中国人工智能专利申请主要集中于北京、上海、广东三地,与中国经济的区域特点相吻合。京沪粤浙苏五省市占总体的59.62%。


人工智能专利申请数在细分领域上的分布,大体上相似,机器人、神经网络、语音识别及图像识别占主要部分。


AI学术:


谷歌学术、微软学术等数据的统计显示,中国人工智能领域论文不仅数量增长迅速,且以引用数为衡量标准的论文质量也有显著提高,已接近或达到国际先进水平。


人工智能实际上是一门交叉学科,除了计算机学科之外,还涉及心理学、数学、哲学、语言学、工程学、生物学等。其中,机器学习和计算机视觉处于上升态势,且增幅较快。另外,在整个人工智能行业里,机器人仍然是整个行中整体态势最高的,主要原因机器人和工业界的不同产业都有紧密关系。


另据领英数据分析显示,中国AI相关专业人才的数量排在全球第十位,其中超过半数有6年以上从业经验。


2016年人工智能与各学科的相关性数值


总体来看,全球专利与企业数量、投融资在时间趋势与地理分布高度一致;在企业数量、专利申请数上,长三角领先于珠三角;中国逐渐接近美国,也逐渐领先于世界。但在人工智能领域大学排名,中国大陆高校与世界顶尖大学尚有差距,还有较大进步空间。


在研究人工智能的高校方面,亚洲院校发展非常迅速。国内高校在三年前就已在论文数上开始全面超越美国。但从单篇论文的引用数和影响力来看,则国外大学论文的影响力略高于国内。


乌镇智库以大数据为驱动,旨在为业界、政府提供全面、细致的数据,及科学而权威的数据分析,对企业及政府决策发挥关键的智囊作用。智库借助最新科技,洞见信息技术最新发展趋势,以全球视野指导本土互联网产业进步,服务于政策和商业创新。


【尼克专访】


嘉宾简介:乌镇智库理事长,国家千人计划专家


记者:您曾说过,中国人工智能企业不仅数量增长迅速,质量也正大力提升。如何看待中国人工智能企业的发展趋势?比较看好哪些企业?


尼克:根据乌镇智库的数据调查,中国近年在人工智能领域发展迅速,已经进入产业化阶段,一些有规模的企业正在崛起,无论是在数量还是质量方面,中国人工智能企业的发展态势和规模,是前几次互联网革命达不到的,而且正在大幅度地接近和赶超世界水平。


因此,我个人比较看好一些在技术领域有深耕、面向消费者的企业,如智能语音技术提供商科大讯飞和大数据技术和服务提供商拓尔思。有些企业的主营业务并非人工智能,但他们在人工智能领域投入巨大,不可忽视,如BAT、华为等国内科技巨头。根据乌镇智库的报告,BAT中以百度投资最为全面,不仅成立大数据、深度学习等实验室,其地图、外卖、金融等产品已与人工智能技术接轨。


记者:您认为目前人工智能领域的投资是否存在过火的现象?未来会降温还是会继续增长?


尼克:目前中国的人工智能领域处于高速发展期,作为投资人应小心过量资金可能造成的行业异常。近几年国内的投资渐趋成熟和理性,整个行业在未来仍将飞速发展。根据乌镇智库数据,目前中国AI企业融资规模排在全球第二位,为美国的七分之一。


记者:您认为数据挖掘在互联网金融的征信和风控领域会有很好的应用。目前这些领域的应用有哪些例子?实际应用过程中会遇到哪些问题?


尼克:我个人比较看好人工智能在金融和征信行业的应用。八十年代,开发了主流信用评分体系FICO的征信公司Fair Isaac Corp,就高价收购了圣地亚哥的一家神经网络公司HNC。而近期,基于图数据库的建模受到欢迎,硅谷一些利用这种技术的公司在实时风控领域取得了很大进步。


近年我国风控领域的大数据技术应用也发展迅速。2015年7月,国内首批八家个人征信机构完成央行验收,标志央行正式开放个人征信业务。获得入场券的,例如考拉征信,就收集了许多数据源,并采用机器自然语言处理技术,处理诸如法庭判例等多种文本数据。


对于征信机构而言,数据与模型技术是主要竞争要素。确保数据的来源和质量,方能准确掌握用户的行为特点。