百度王海峰:人工智能赋能各行各业
人工智能改变世界正在成为共识,但人工智能现状是怎样的,如何才能真正让人工智能改变世界?10月26日,在IKCEST 2018国际高端研讨会上,百度高级副总裁、AI技术平台体系(AIG)总负责人、深度学习技术及应用国家工程实验室主任王海峰对百度AI的核心——百度大脑进行了详细解读,他表示,百度大脑是百度人工智能技术的集大成,不仅支撑着百度所有业务,更通过开放赋能,服务于社会各界、各行各业,助力行业变革与创新。
2018年大会的主题聚焦“新一代人工智能与知识服务”。百度是国内最早全面布局人工智能的企业,王海峰则是百度人工智能的奠基人和领导者。他认为,“汇聚知识的人工智能可以变得更强大,实现对客观世界的更深层认知,同时人工智能会把知识进行总结、凝练、扩展、传承,两者形成正循环,促进人工智能的发展。”
百度大脑于2016年正式发布,如今发展至“多模态深度语义理解”的新阶段。会上,王海峰从知识、视觉、听觉、语言等几个方面解读了百度大脑的最新进展,以及百度大脑全面开放这些能力,从深度学习框架、场景化AI能力、定制化训练平台、到软硬一体模组和解决方案等,助力各行各业应用人工智能。
百度大脑构建了完整的人工智能技术布局,包括语音、视觉等感知技术和知识图谱、自然语言处理等认知技术。随着人工智能技术的发展,知识成为其进一步突破的重要基础。王海峰表示,在多元语义知识方面,百度已经构建了包含数亿实体、数千亿级事实的庞大知识图谱。除了由实体、属性、关系构成的实体图谱,百度还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等。现场,王海峰播放了一段智能客服为用户服务的音频,机器在与用户的对话中,如人工客服一样,听清用户的话、理解用户的需求并推荐合理的服务,这背后是百度领先的语音、自然语言理解技术,以及基于业务逻辑和行业知识构建的行业知识图谱。
让机器像人一样听清并说话,从而实现自然的人机交互,首先要依赖于语音技术。王海峰提到,百度领先的语音技术包括融合声学模型和语义理解等实现语音语义一体化识别,构建基于深度学习的语音合成系统,以及软硬一体远场语音交互技术等。在用户与“小度”的对话中,机器的声音不仅清楚流畅,还富有情感,和真人非常接近。
视觉技术让机器像人一样观察世界。王海峰介绍,百度大脑具备丰富的图像识别体系,基于知识的视频语义理解,以及由此实现的基于场景的视觉语义化技术。图像识别是视觉技术的基础,它让机器能够“看见”,视觉语义化技术则让机器能“看懂”,并提炼出结构化语义知识。比如在零售场景中,视觉语义化技术通过识别人物、动作、物品并关联时间,将数字化的视频转化为结构化的语义知识,既能实现顾客在无人超市购物的完整体验,还可以帮助管理者分析和优化超市的运营。
自然语言理解技术致力于让机器更好地理解世界。王海峰以阅读理解和对话理解为例,介绍了百度自然语言理解技术的新进展。一方面,百度大脑基于阅读理解能力,自动获取并学习互联网中的万亿网页内容,汲取知识并凝练成知识图谱,进而支持问答、推荐等应用,并在应用中积累和更新知识,进一步提升机器阅读理解能力;另一方面,百度大脑在与用户对话交流的过程中沉淀和丰富知识,持续提升对话理解能力,实现与用户之间自然流畅的交互。
“百度大脑的各种能力,是由深度学习作为基础支撑的,”王海峰介绍,百度自主研发的深度学习框架PaddlePaddle,是国内唯一一个开源开放的深度学习框架。今年发布的PaddlePaddle3.0,除了核心框架,百度还开放AI Studio、EasyDL等平台,满足更灵活、更广泛的应用需求,让开发者可以更平等便捷地获取AI能力。
百度大脑的技术能力在持续提升,同时面向合作伙伴和开发者的开放也越来越全面和深入,让越来越多的行业和企业能够低门槛地获取AI能力,带动各行各业的变革与创新。比如医疗行业,百度大脑可以辅助医生更高效、便捷地筛查眼底、肿瘤等疾病;比如制造业,百度大脑帮助自动识别地板瑕疵,提升质量检测效果和效率,将工人从重复单一的工作中解脱出来;语音和自然语言处理等技术让人们“动动嘴”就能控制音箱、电视等,丰富人们的家庭娱乐……借助AI的能力,各行各业在不断提升效率,创造新的价值。百度大脑也在改变普通大众的生活,人们动动嘴、拍张照片就能搜索到想要的信息;百度地图帮助用户预测路况、规划路线、躲避拥堵等,为人们提供更加便捷、高效的出行服务。
我们正在越来越清晰地感受到AI带来的变化,拥抱AI是大势所趋。王海峰表示,“百度大脑将持续发展人工智能技术,推动知识的融合及应用,同时全方位开放,与行业深度结合,助力行业变革和社会经济发展。”
来源:光明网