8月29日至31日,2019世界人工智能大会在上海举办,在31日举行的“科技有道 择善而行”——腾讯论坛上,腾讯 AI Lab 及腾讯 Robotics X 实验室主任张正友博士进行了主题演讲。以下为演讲全文:
很高兴再次来到世界人工智能大会。一年过去了,人工智能仍然是很热门的话题,it’s still a very hot topic。同时,人工智能还很酷,每个公司都想往人工智能上靠,投资公司投资的时候也要看看和人工智能有没有关系。“酷”这个字其实来自英文cool,非常棒的翻译。既是Hot也是Cool。但cool在英语里也有凉,有冷静的意思。所以我们同时要冷静看待人工智能。
近年来,世界主要发达国家都将人工智能作为国家战略,投入了大量的人力物力,力争赢得全球科技竞争的制高点。
作为在人工智能领域奋斗了三十多年的老兵,很高兴看到人工智能的今天。我也见证过人工智能的高高低低,深知最近人工智能繁荣的来之不易,是几代研究人员持之以恒,坐了几十年冷板凳换来的,我们都要珍惜,要把人工智能技术切实用好,造福人类。
同时我们也要认识到目前的人工智能离真正的智能还很远,比如智能如何发育和自主进化,这些都需要我们继续对人工智能的基础研究进行长期稳定的支持。
所以我们一定要两条腿走路。一条腿,支持将现有的人工智能技术赋能各行各业,造福人类。另一条腿,支持构建人工智能基础研究的稳定环境,推动人工智能基础理论的创新和突破。
-
符号主义(symbolism),希望通过逻辑演绎系统,模拟人类智能活动。代表技术有启发式算法,专家系统,知识工程。
-
连接主义(connectionism),模仿人脑结构,将神经元连成神经网络,利用连接机制来学习。代表技术包括感知机(perceptron),支持向量机(SVM),深度学习(DNN).
-
行为主义(actionism或situated AI), 通过外部行为探索智能,是一个感知-动作型控制系统。代表技术包括自组织映射(SOM),遗传算法,强化学习。
当然,这一波的人工智能兴起是以深度学习为代表的,得力于大数据和强算力,因而在视觉、语音、翻译等感知领域取得重大突破,跨越了很多应用门槛。
但是还有很多场景目前的深度学习还不能解决,比如认知智能包括机器的思考、决策、和推理能力,比如对环境的适应,比如学习能力的自主进化。这些都需要我们放开思维,大胆探索,将不同流派融合,甚至创造新的流派,开发出真正自主智能的系统。
下面我将围绕腾讯AI,对我们的布局,目前所取得的进展,以及未来的发展方向三个话题展开演讲。
目前腾讯已建立两大实验室矩阵——人工智能实验室矩阵,包括致力于全面基础研究与应用的在深圳及西雅图的腾讯AI Lab、基于视觉的腾讯优图、基于语音与自然语言理解的微信 AI等四大实验室;以及基于前沿科技的实验室矩阵,涵盖机器人、量子计算、5G、边缘计算、IoT和音视频技术等,打造面向未来的科技引擎,推动自主技术创新。
作为衡量机构研究实力的重要标准,成立两年多来,腾讯AI Lab的基础研究成果已覆盖CVPR、ACL、ICML、NIPS及Nature Communications等国际顶级AI学术会议或期刊,发表论文数量近350多篇,位居国内企业前列。此外,我们还发布了三大开源项目:
-
Tencent ML-images: 这是业内最大规模多标签图像数据集
-
PocketFlow: 这是世界上首款自动化深度学习模型压缩框架
-
中⽂词向量数据库:这是业内领先,包括了800多万中文词汇
腾讯积极与外部学界合作,建立了8大联合实验室,参与53个研究合作项目,联合培养34位顶尖学生,接待了17位全球访问学者。通过一年一度的学术论坛、联合研究、访问学者、博士生及研究生奖学金等多种项目和形式,推动前沿研究应用及人才培养。
下面介绍一下腾讯在AI方面的进展。
目前AI的现状主要还停留在感知层面,依赖大量的标注数据。在计算机视觉、语音处理、和自然语言里的自动翻译方面有很大的成功。比如腾讯的同声翻译就在支持着这一届的世界人工智能大会。
所以目前在限定条件下的感知与分析能力已经相对比较成熟。下一步要去解决充满不定性的现实环境的问题。我们的目标是取得技术突破,助力产业颠覆式升级。
AI的进一步发展依赖于提升三方面的能力:第一是内容的生成,第二是对世界的认知,第三是对行动的决策。下面我举几个例子。
在内容生成领域,我会举视频风格转换为例。在认知领域,我会举虚拟人为例。在决策领域,我会举绝艺围棋机器人为例。
这个工作依赖于对视频场景的深度理解,识别其中人物、物体、场景,并分析它们的关系,并在时间顺序识别视频中不同的动作和事件,就可以高效的生成丰富的内容,比如卡通风格的视频。
在认知领域,我们通过虚拟人的形态,进一步探索面向未来的人机交互新形式。它集合了计算机视觉、语音、自然语言理解到智能决策协作等多种AI技术于一身。通过跨学科、跨模态的交叉多模态研究,让机器用感知判断人类情绪,用认知判断意图,并进行更复杂的分析与决策,从而不断向真正的人类智慧靠近。
让我们看看腾讯虚拟人目前在游戏解说中的表现吧。请看视频。