姚期智:ai理论研究很重要,进步正来自于跨学科领域。今年的世界人工智能大会中,除了众多领导发表了讲话,人工智能领域的专家也对ai的现状和未来进行了讨论。
其中,在主题演讲阶段,图灵奖获得者姚期智做了关于人工智能理论的新方向的报告;yoshua bengio做了机器学习赋能智能手机预测新冠疫情传染性风险的相关报告。
以下,ai科技评论对姚期智院士的报告《人工智能理论的新方向》做了不改变原意的整理。
我今天讨论的话题是“人工智能理论新的方向”。ai在现实世界已经有了广泛应用,在这场大会中也能看到ai应用的新进展。但是我想说明的是,所有的这些进展都来自于基础科学。也就是说,ai领域在很多年前就已经打下了理论基础。这给我们的启示是:一定要让理论研究不断发展。
在这次演讲中,我想讨论三个要点:
1、ai理论很重要。当前ai面临的很多问题和挑战,都可以用理论来进行分析。通过理论分析,我们能更清楚的知道我们面临的挑战的本质,以及解决这些挑战的方法。
2、ai是跨学科的行业。当前在ai中获得的一些成果,其所处的领域很多是和ai几乎不搭边的学科。
3、探讨ai领域的新理论方向。
如上ppt所示,我列举了三个例子来进行讨论,分别是:
1、神经拓扑结构:神经网络研究的新视角;
2、隐私保护学习:人工智能 多方计算;
3、可控的超级人工智能:如何设计有益的超级智能。
第一点,神经网络如此强大的理论原因直到现在还是个迷。如果能找到原因,这对神经网络的改善、应用无疑是个突破。
我们用一个简单的例子来说明神经网络的应用。上图中的气象图的数据是“波动”的,现在需要“算法”分析图片中展现的气候形式,也即分析图片中的天气是暴风还是正常。人类工程师通常观察气象图的二维或者三维的表现,然后从中找到范式,判断是否符合风暴的特点。
深度学习、机器学习则采取高维视角,整张图应该被认为是一个高维的数据。机器学习的标准做法是通过处理高维度的数据,将数据分为不同的数据集类别,这个数据集可能是暴风天气的图像、也可能是正常天气的图像。
神经网络中的核心问题就是,如何设计神经网络的深度和大小,才能够对数据进行分类。
我们将数学和神经网络的能力联系起来,分析神经网络能识别哪类数据集,不能识别哪类数据集。
拓扑学有一个非常重要的概念:贝蒂数。在代数拓扑学中,贝蒂数是一族重要的拓扑不变量,用b_0、b_1、b_2、...、b_k表示,取值为非负整数或无穷大。
我们猜测,如果一个数据集在拓扑学意义上是非常复杂的,神经网络就非常难识别。关于数据越复杂神经网络越难识别这一结论,已经可以通过经典的拓扑学和计算理论证明。
这也给了我们一个启发,解决ai问题的方法可以从其它学科的角度考虑。
第二点,ai理论的新方向是隐私保护,这也是人工智能正在面临着的问题。隐私保护和密码学息息相关,例如我曾在1982年提出的安全多方计算就是相关理论方向,多方计算主要研究在私有信息不被泄漏的前提下,多个互不信赖的参与者如何协作进行计算。通过使用多方计算,多个数据库可以联合计算一个函数却不会透露各自的数据。
多方计算通过汇聚多方数据,实现高质量学习,同时又能保护各方数据隐私,对金融科技、药物研发等应用非常有用。例如在药物领域,人工智能能够大大降低制造新药物的时间和成本,并提高发现新药物的成功率,而人工智能 多方计算可以让多家制药公司在不泄露其独家知识产权的情况下,进行合作。
第三个需要讨论的ai理论方向是:通用的超级人工智能何时到来?答案是不可预知,因为现在的alphazero、人脸识别虽然很牛,但仅适用于特定领域。
正如1977年,john mccarthy曾经说过:“我们需要概念上的突破,1.7爱因斯坦 0.3曼哈顿项目,可能需要5~500年时间。”
最新的“超级ai理论”提出是在2019年,当时伯克利大学的stuart russell在书中提到,虽然超级人工智能不知道什么时候到来,但是我们必须做好准备。他在书中设定了三个原则,每一个原则都要用严格的数学方法来实现,这三个原则分别是:1、利他的:人的利益凌驾机器利益;2、谦卑的:机器不能自以为是;3、尽心的:机器能学懂人的偏好。此外,他还提出了许多方法论,涉及概率理论和博弈论。
综上,我想表达的是,现在的ai应用来自过去的理论研究,ai的一些进步也正来自跨学科领域。今日的理论探索,正为未来的伟大应用奠定良基!
上一篇:如何看待学生的追“ai”潮
下一篇:2020年中国大学百强榜发布