杜兰博士分享人工智能赋能千行百业的现在和未来 |
文/图 羊城晚报记者 鄢敏 从自动驾驶到虚拟偶像,人工智能已经离我们越来越近。那么,目前人工智能发展到哪一步?如何赋能千行百业? 5月21日,由广州市科技局、广东科学中心、羊城晚报社联合主办的珠江科学大讲堂第95讲,广东省人工智能产业协会会长、科大讯飞高级副总裁杜兰博士以《AI赋能,世界的下一种可能》为题,分享人工智能前世今生、技术路径,以及人工智能赋能千行百业的现在和未来。 像人一样感知、决策、执行 汉语、英语、日语、泰语……讲座开场,杜兰先带观众认识了一位会讲十余种外语的“同事”。实际上,这是多语种AI虚拟主播,运用人工智能技术自动预测表情,实时合成唇形。“不会出错,永不知疲倦。” 什么是人工智能呢?杜兰介绍,这个概念最早可以追溯到1950年。被誉为人工智能之父的图灵,在著作中提出用图灵测试来测量机器的智能程度。“包括明斯基在内的许多人工智能的先驱,都提出过自己对人工智能的理解。”后来,科学界逐步对人工智能的概念形成共识,那就是:人工智能就是能够和人一样进行感知、认知、决策、执行的人工程序或系统。 人工智能的三次跌宕 跨越世纪,人工智能如何变迁?杜兰指出,人工智能经历了三次跌宕起伏。 1970年,人工智能的第一次浪潮达到顶峰。这次浪潮中,人们已经可以通过第一代的神经网络算法,证明《数学原理》前52个中的38项。“当时,明斯基非常兴奋地宣告,未来3到8年,计算机的智能就可以达到人类的平均水平。显然这太过于乐观。”杜兰指出,进一步验证后,证明了第一代神经网络是具有缺陷的,这直接导致了1980年出现了人工智能的第一次冬天。 随着1982年Hopfield网络(神经网络算法)和1986年BP算法(Error Back Propagation误差反向传播算法)的出现,大规模神经网络的训练成为可能,人们再次看到了人工智能的希望。杜兰介绍,由于这些算法受到计算机运算能力的限制以及算法的难以收敛,直接导致了2000年第二次AI冬天。 2006年,深度学习的概念(DNN)被正式提出来之后,首次证明这种方法可以进行大规模深度神经网络的学习。杜兰说,有了学习能力后,一系列算法不断地在语音合成、语音识别等多个领域取得突破。 能听会说,能理解会思考 从技术角度看,杜兰指出,人工智能也分为三个阶段:运算智能、感知智能、认知智能。 运算智能就是让机器能存会算。杜兰介绍,所使用的方法是穷举和匹配搜索,计算机的储存资源和计算资源比人强大很多。使用大存储和超算之后,整个系统一定程度上表现出智能的特性。 感知智能是让机器能听会说,能看会认。杜兰指出,感知智能领域的典型项目是无人驾驶汽车,像人一样能够感知外界的变化。她说,科大讯飞的语音合成、识别等技术研究,也都是处于感知智能层面,讯飞听见系统,可将语音实时转写成文字。 杜兰表示,认知智能就是让机器能理解会思考。Winograd Schema Challenge是新型的认知智能国际评测任务,重点考察机器是否具备理解常识、并实现认知推理的能力,被认为是图灵测试的替代版本。 跨越鸿沟,飞入寻常百姓家 杜兰强调,要将技术真正从实验室走出来,进入日常生活,中间过程是很难的,高科技企业的早期市场和主流市场之间存在着一条巨大的“鸿沟”。她认为,互联网时代,跨越鸿沟主要是对用户使用习惯、商业模式等多方面的打磨,而在人工智能时代,技术鸿沟成为重点。 未来,人工智能可以在哪些领域发挥作用?杜兰借助“蜜蜂模型”来解释。中国的蜂蜜市场规模每年不到100亿元,但蜜蜂的价值并不是酿蜜蜂蜜而是传粉。人工智能对其他产业的作用,就如同蜜蜂对各种农作物一样,最大价值就是“赋能”。 杜兰表示,人工智能不是单项技术,实际上是计算机和其他信息技术的集成应用。“人工智能技术渗透到各行各业,将促进全社会方方面面的变革和技术升级换代,从数字化、网络化走向智能化。” 杜兰指出,人工智能的大规模应用,主要围绕两个方向:一方面,通过人工智能改变人和机器的交互方式,“万物互联时代,在远场、移动、无屏的场景下,以语音为主、键盘触摸为辅的人机交互方式已经到来。”另一方面,通过人工智能学习顶尖专家知识,达到一流专家水平,从而超越90%的普通专业人士,逐步代替简单、重复的人类劳动。