http://www.ox-holdings.com

腾讯宣布推出智能语音助手,微软展示的是微软小冰的第三代产品

摘要微信 5.0“扫一扫”发布的时候,被讨论得最多的是它所承载的商业化重任。被忽视的,是背后的技术,及技术蕴藏的趋势。同样地,这个版本亮相的微信自主研发语音识别技术,也为外界所震惊和质疑。微信 5.0“扫一扫”发布的时候,被讨论得最多的是它所承载的商业化重任。被忽视的,是背后的技术,及技术蕴藏的趋势。同样地,这个版本亮相的微信自主研发语音识别技术,也为外界所震惊和质疑。“腾讯能够一夜之间自研成功语音识别技术?”类似质疑遍地都是。在独家采访微信“模式识别中心”团队后,我们发现两个产品功能并不是孤立地存在的,而是人工智能技术武装微信的两个投射。微信走向智能化,不是从这两个功能起步,也显然不以其为终点。本文揭秘了微信产品背后的故事,介绍“模式识别技术”的未来形态,以及科研与产品开发的关系。而我们更关心的,是微信乃至整个移动互联网正在发生的变化:越来越智能化。这是由移动设备和移动产品丰富的连接性引发的变革。正是得益于如此丰富的连接性,人工智能基础技术得以从多方面渗透进来,燃起穿戴设备的热潮,掀起电视、汽车、家居、医疗各产业的变革,真正拉开科技改变生活的序幕。1/3 博士,2/3 硕士的高学历团队“模式识别”是人工智能的一个分支,在上个世纪 60 年代成为一门学科。所谓模式识别(pattern recognition)是指对表征事物或现象的各种形式信息进行处理和分析,以实现对事物或现象进行描述、辨认、分类和解释的过程。模式识别对象包括文字、语音、图像、生物传感器、心电图、脑电图、地震波等等。对应到 IT 领域,主要是指文字、语音、图像、与 IT 相关的传感器等,如 iPhone 5s 新增的指纹识别功能,将来也会属于“模式识别”研究的对象。微信的模式识别中心也是一个研发中心。据团队负责人陈波介绍,他们隶属于微信北京研发中心,研究方向包含语音识别、图像识别、语音合成、音频指纹、语义理解、数据挖掘等等。不过由于这个研究型团队辖属于微信,他们不只负责理论研究,还对接产品功能开发。模式识别中心原先不属于微信,其前身是腾讯研究院下属模式识别小组,2010 年 9 月成立。这个小组面向整个腾讯公司提供基础研究成果的服务。比如诞生之初就为 QQ 输入法提供手写识别功能。2011 年腾讯内部创新热潮起来后,这个团队拓展研究领域,扩展到人脸识别、图像检索、文字识别等,集多种图像技术于一身“QQ 慧眼”就是这个团队研发的。2012 年 9 月,该团队正式划归微信管辖,随他们一同到微信的是当月发布的微信 4.3 版本中的通讯录语音搜索功能。为什么基础研究团队要整合到微信团队?陈波给出的答案是:“一方面微信是引领移动互联网潮流的产品,对视觉、听觉延伸的东西需求很大;一方面技术成熟,到了基础领域研究落地阶段,微信是一个比较合适的平台”。目前微信模式识别团队有 40 多名成员,都是高学历多能人才。据陈波介绍,40 多名同事中,有 1/3 是博士,2/3 是硕士。还有一个类似比例是:整个团队 1/3 从事前沿技术研究,2/3 从事现有技术研究和产品对接。关于团队的研究方向,陈波介绍主要分为语音和图像两个小组,语音研究对应的是手机上的麦克风,由博士生卢鲤带领 12 个人负责;图像对应的是手机摄像头,由博士生刘海龙带领 13 个人负责。“小组是比较成熟的方向。除了小组之外,我们也有其他研究方向”,陈波说,“包括文字识别、人脸识别、语义理解、视觉搜索、音频指纹检索等”。除了科学研究团队,模式识别中心还有一个工程团队与微信产品团队进行对接。据陈波介绍,她的团队不是纯粹搞研究,不只会写 paper,还有很好的开发能力。他们没有专门的手机开发人员,都是自己搞 iPhone 开发,把 demo 秀出来;遇到产品问题,也要与产品团队共同解决。在招聘人才方面,模式识别中心也是把关严格,要求研究与工程能力兼备,所以团队过即使加入微信后也没有膨胀发展:团队成立之初是 2、3 个人,去年加入微信大家庭的时候是 30 人左右;加入微信后,现在团队是 40 人出头。相对于竞争对手,这仍然是一个精干的团队。

日前,亚马逊创始人贝佐斯接受专访提到,Alexa已经成为亚马逊的核心战略之一,其估值可能接近百亿美元。

此外,对于微软而言,这样一个看起来概念并不新颖的项目,其实是微软集团全球执行副总裁陆奇直接拍板决定的战略级试验。

知识工程,则研究如何用机器代替人,实现知识的表示、获取、推理、决策,包括机器定理证明、专家系统、机器博弈、数据挖掘和知识发现、不确定性推理、领域知识库;还有数字图书馆、维基百科、知识图谱等大型知识工程。

1.3三是机器人。MIT Media Lab研发出的jibo是第一个社交机器人,会与人互动聊天(不太像人)。有人形机器人Pepper(太大了)。潜在的竞争者:HansonRobotics具有世界上最好的人类表情,能惟妙惟肖,与人做真实的互动。

同月,有报道称,华为在深圳有一个超过100名工程师的团队正在开发语音助手服务,开发工作目前还处于早期阶段。华为语音助手项目目标宏大,瞄准苹果Siri、亚马逊Alexa和Google Assistant。华为语音助手定位中文,面向国内用户,在海外市场将继续与谷歌和亚马逊合作。

此外,微软还展示了小冰为微信平台开放的多项专属技能,其中包括此前曾火爆一时的“How-Old”升级版人脸识别技能。

而人工智能的外延,则是机器人与智能系统智能科学的应用技术 。这包括工业机器人、农业机器人、服务机器人等各类机器人以及智能交通、智能制造、智慧医疗、智慧城市等等。

3.2二是体感和手势互动。微软的kinect体感游戏机,感知整个人身体的姿态和动作,据此进行交互做反应,其背后的芯片和相关软硬件公司为英特尔,其专业支撑体感和软硬件系统叫RealSense,提供体感的解决方案。

这一次,为什么是智能语音?

值得一提的是,微软方面强调全新一代微信版微软小冰将充分遵守微信平台的统一规范和用户体验。由于此前曾多次出现小冰在社交媒体上爆发式增长的失控现象,此次回归微信平台,为确保稳定有序地发展,微软仅有限度地开放了部分公测名额,对微信版小冰说出公测口令,才能够解锁该公众号的对话能力。

人工智能技术能够走过六十年,如今奔跑在天梯上,而深处却是更多基础和阶梯的支撑,比如光网宽带、移动宽带、移动互联网、云计算、物联网及大数据等等。事实上,如果联网通信、数据量爆发及计算能力的极大提升,人工智能技术也许还处于实验室之中。

2.1后端参与者。一是人工智能的核心算法,基本上被大公司垄断。AlphaGo的背后是上千个CPU,这类公司有谷歌、IBM、facebook。

对比之下,谷歌Assistant比苹果Siri则显得更聪明、更有能力,这对苹果来说是一件很尴尬的事,因为苹果Siri的起点比Assistant早五年。

去年高调在微信平台上首发但上线不到三天就遭遇“封杀令”的微软小冰,在曲线努力了近15个月后,终于以一种微软和腾讯双方都满意的方式成功重返微信。

那么,人工智能的内涵和外延是什么呢?我认为,人工智能的内涵包括脑认知基础、机器感知与模式识别、自然语言处理与理解、知识工程这四个方面。

10月24日科技概念股之人工智能入口上

2月份,百度宣布全资收购渡鸦科技,创始人吕骋携团队正式加盟百度,并出任百度智能家居硬件总经理,向百度集团总裁和首席运营官陆奇汇报。陆奇指出,凭借语音与对话技术的优势,百度在引领新一代人机交互平台上将拥有巨大的机会,自然语言和其他智能交互方式有可能出现在从手机到家居的每一个设备中。

除了其极为短暂的存在时间,当时更让业界诧异的是微软在这次封杀事件中摆出的姿态。在遭遇腾讯封杀后,“小冰”的官方微博“微软麒冰”更新了这样一条状态:“企鹅欺负我,不让我说话,求公道。”与此同时,微软方面的第二份声明也打起了悲情牌。

总之,当前机器人和智能系统的普遍应用,正在大大的推进科技进步和社会经济、国防和人民生活的迅猛发展。

3.3三是视觉识别和图像处理,机器人不仅识别语音、姿势,甚至识别周围的环境,要像人一样,进退自如地进行互动。

目前,腾讯的基础研究基地分散全国各地,其中有四大秘研基地,主要包括香港WHATLAB、上海&合肥优图实验室、北京微信模式识别中心、智能计算与搜索实验室。

事实上,当时的小冰能够实现两种功能:聊天和智能搜索。你可以像调戏Siri一样“调戏”它,也可以问问题,小冰会自动从必应搜索中找到相关的信息用聊天的形式反馈回来。同时它还有像Siri一样的智能助手功能,如果你让小冰建立一个待办事件,它就会在设置的时间点向微信群发送信息来提醒大家。

李德毅

一、上市公司:科大讯飞。语音识别,声纹识别,人脸识别,希望未来研发出手势识别。合作领域:手机领域与中移动“灵犀”,与滴滴、高德地图、QQ阅读合作的声音合成。智能家居方面与京东推出“叮咚”智能音箱。在机器人领域有“小鱼在家”、中兴看看。另外合作的有优必选、ninebot、狗尾草、康力优蓝。

郑重声明:本文版权归新匍京a奥门-最全网站手机版app官方下载所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。