http://www.ox-holdings.com

本届国际文档分析与识别技术竞赛结果揭晓新匍京a奥门,目前微信模式识别团队有

摘要微信 5.0“扫一扫”发布的时候,被讨论得最多的是它所承载的商业化重任。被忽视的,是背后的技术,及技术蕴藏的趋势。同样地,这个版本亮相的微信自主研发语音识别技术,也为外界所震惊和质疑。微信 5.0“扫一扫”发布的时候,被讨论得最多的是它所承载的商业化重任。被忽视的,是背后的技术,及技术蕴藏的趋势。同样地,这个版本亮相的微信自主研发语音识别技术,也为外界所震惊和质疑。“腾讯能够一夜之间自研成功语音识别技术?”类似质疑遍地都是。在独家采访微信“模式识别中心”团队后,我们发现两个产品功能并不是孤立地存在的,而是人工智能技术武装微信的两个投射。微信走向智能化,不是从这两个功能起步,也显然不以其为终点。本文揭秘了微信产品背后的故事,介绍“模式识别技术”的未来形态,以及科研与产品开发的关系。而我们更关心的,是微信乃至整个移动互联网正在发生的变化:越来越智能化。这是由移动设备和移动产品丰富的连接性引发的变革。正是得益于如此丰富的连接性,人工智能基础技术得以从多方面渗透进来,燃起穿戴设备的热潮,掀起电视、汽车、家居、医疗各产业的变革,真正拉开科技改变生活的序幕。1/3 博士,2/3 硕士的高学历团队“模式识别”是人工智能的一个分支,在上个世纪 60 年代成为一门学科。所谓模式识别(pattern recognition)是指对表征事物或现象的各种形式信息进行处理和分析,以实现对事物或现象进行描述、辨认、分类和解释的过程。模式识别对象包括文字、语音、图像、生物传感器、心电图、脑电图、地震波等等。对应到 IT 领域,主要是指文字、语音、图像、与 IT 相关的传感器等,如 iPhone 5s 新增的指纹识别功能,将来也会属于“模式识别”研究的对象。微信的模式识别中心也是一个研发中心。据团队负责人陈波介绍,他们隶属于微信北京研发中心,研究方向包含语音识别、图像识别、语音合成、音频指纹、语义理解、数据挖掘等等。不过由于这个研究型团队辖属于微信,他们不只负责理论研究,还对接产品功能开发。模式识别中心原先不属于微信,其前身是腾讯研究院下属模式识别小组,2010 年 9 月成立。这个小组面向整个腾讯公司提供基础研究成果的服务。比如诞生之初就为 QQ 输入法提供手写识别功能。2011 年腾讯内部创新热潮起来后,这个团队拓展研究领域,扩展到人脸识别、图像检索、文字识别等,集多种图像技术于一身“QQ 慧眼”就是这个团队研发的。2012 年 9 月,该团队正式划归微信管辖,随他们一同到微信的是当月发布的微信 4.3 版本中的通讯录语音搜索功能。为什么基础研究团队要整合到微信团队?陈波给出的答案是:“一方面微信是引领移动互联网潮流的产品,对视觉、听觉延伸的东西需求很大;一方面技术成熟,到了基础领域研究落地阶段,微信是一个比较合适的平台”。目前微信模式识别团队有 40 多名成员,都是高学历多能人才。据陈波介绍,40 多名同事中,有 1/3 是博士,2/3 是硕士。还有一个类似比例是:整个团队 1/3 从事前沿技术研究,2/3 从事现有技术研究和产品对接。关于团队的研究方向,陈波介绍主要分为语音和图像两个小组,语音研究对应的是手机上的麦克风,由博士生卢鲤带领 12 个人负责;图像对应的是手机摄像头,由博士生刘海龙带领 13 个人负责。“小组是比较成熟的方向。除了小组之外,我们也有其他研究方向”,陈波说,“包括文字识别、人脸识别、语义理解、视觉搜索、音频指纹检索等”。除了科学研究团队,模式识别中心还有一个工程团队与微信产品团队进行对接。据陈波介绍,她的团队不是纯粹搞研究,不只会写 paper,还有很好的开发能力。他们没有专门的手机开发人员,都是自己搞 iPhone 开发,把 demo 秀出来;遇到产品问题,也要与产品团队共同解决。在招聘人才方面,模式识别中心也是把关严格,要求研究与工程能力兼备,所以团队过即使加入微信后也没有膨胀发展:团队成立之初是 2、3 个人,去年加入微信大家庭的时候是 30 人左右;加入微信后,现在团队是 40 人出头。相对于竞争对手,这仍然是一个精干的团队。

人脸识别+安防

在资讯服务方面,包括新闻应用(如天天快报)、腾讯视频、QQ音乐、全民K歌和应用商店(如应用宝)等,AI能帮助这些产品更好了解用户的兴趣图谱,从而进行更智能的个性化推荐,让用户更高效的体验感兴趣内容。腾讯各个平台上的数字内容服务都会受益于这一更为智能的推荐技术。

近日,第十四届国际文档分析与识别大会在日本京都闭幕,本届国际文档分析与识别技术竞赛结果揭晓,我校计算机与通信工程学院殷绪成教授团队,获得最受关注的“鲁棒阅读竞赛”大规模真实场景文本识别技术竞赛冠军。国际文档分析与识别大会是国际模式识别协会举办的文档分析与识别、模式识别领域世界上最重要的国际学术会议之一,每两年举办一次,从1991年第一届开始,到今年已成功举办十四届。

据悉,物体智能识别之所以得到青睐是因为,如果此关键方向得到突破,则未来电脑、互联网的核心交流界面将发生本质性改变。人们将从单纯的计算机键盘输入、改换为全方位的智能交流互动。电脑的人工智能将成倍提升,智能化识别人脸、语音、图像照片、文字等。其影响力将对下一代家电、消费电子、安防产品、乃至科技研究的组织互动产生革命性的推动。

新匍京a奥门 1

这一项举措彻底救活了数以亿计的小微企业以及个体户,这也得益于微信平台的开放。

新匍京a奥门 2

恒信移动

新匍京a奥门 3

腾讯董事会主席兼首席执行官马化腾此前曾表示,发展人工智能,需要场景、大数据、计算能力和人才等四大要素,缺一不可。

图2.杨春博士接受第十四届国际文档分析与识别大会程序委员会主席Dimothenis Karatzas博士颁奖

公司2012年度营业总收入为1.99亿元,较2011 年度上升57.78%。

2017是人脸识别的爆发年。年初,百度运用人脸识别技术找回被拐卖的儿童;年中,人脸识别在机场、无人便利店的各种应用被挖掘;年末,iPhoneX的发布,以及在安博会上,人脸识别占据了展会很大的篇幅。可以说,“刷脸”热了整个2017年。

在腾讯的生态系统中,强大的AI能力可赋能我们的投资公司和合作伙伴,让大家能互惠互利。

殷绪成表示,学术研究和技术创新的重要目标就是要“顶天立地”,其团队下一步的重心就是继续脚踏实地,加强与合作伙伴的共同技术攻关,培育并推进技术的重大应用。目前,殷绪成教授团队已经与亿智集团、科大讯飞、腾讯科技、国家计算机网络与信息安全管理中心等合作伙伴在智能交通、智慧教育、网络广告、互联网安全等重大应用方面进行技术创新与产品推进。

杰弗里·辛顿是人工智能和物体识别领域的世界级专家。其多年经营于利用深度神经网络技术等提高计算机对图像、语音等多种目标的智能识别能力。有消息称,在并购前,杰弗里团队刚取得一项物体智能识别领域的重要突破。而谷歌多年前已经开始赞助杰弗里的研究项目。

除了以上提到的例子,门禁考勤、金融安防、智慧社区、智慧城市等领域,均对人脸识别产品有一定需求。今后,需要用到人员身份认证的地方,都会使用到基于人工智能的人员识别技术。

实际上腾讯或多或少都有这类事件,只是没有被披露出来,或者说是被另外一种方式掩盖了。你有知道的类似事件吗?

图3.获奖证书

据公司相关人员透露,公司在语言识别领域已经取得具备国际水平,在行业内处于领先地位,已经建成音频/语音信息分类和处理平台,其中包括非特定人大词表连续语音识别系统、语种识别系统、说话人识别/确认等系统,公司研发的电信级语音识别产品已在国内20余个省级电信运营商中进行商业化运营;桌面平台语音识别产品已成为英特尔数字家庭台式电脑的捆绑软件;嵌入式平台产品已集成于国内多家手机厂商和PDA厂商的产品内。未来中科信利将进一步在语音识别领域进行拓展和研发,并且进一步形成规模化和产业化,对母公司恒信移动有着潜在利好影响。

新匍京a奥门 4

他指出,在面向消费者的产品中,AI让我们更了解用户,从而提升其产品体验;

新匍京a奥门 5

"美国的大型科技企业,历来有为未来3~10年后产品储备长期研发技术的习惯。不止谷歌,许多大型科技企业一直把图像和语音的智能识别领域看作未来最重要的核心方向之一。"微软研究院一位资深研究员表示。

基于对面部识别技术的研究,美亚柏科于2017年5月3日推出人脸识别开发包。人脸识别开发包是一款集摄像头实时数据采集、人脸检测和人脸识别功能于一体的开发包。用户可根据需要调用开发包中的接口,实现人脸检测和人脸识别功能,应用于人证比对、人脸布控场景,如:机场、地铁、火车站及酒店等。可为公安各警种的应用提供基础服务,为社会公共安全防范、逃犯追捕、重点人员的管控等领域提供强有力的支持。

相对于其他互联网与科技巨头在AI领域的投入,腾讯显得相对冷静。不同于AII  in和AI  Frist等,腾讯提出了一个更为平实的愿景“Make AI Everywhere”(让AI无处不在)。

殷绪成2008年加入北京科技大学计算机系,近10年来,以模式识别、计算机视觉、图像识别、人工智能等多领域共同关注的重要应用技术挑战课题——大规模、强复杂自然场景/网络图片/多媒体视频文本检测、识别与检索——为中心,开展系统的方法研究与深入的技术创新,取得了一系列方法与技术突破性研究成果。特别的,殷绪成教授团队“十年磨三剑”,连续三届荣获国际文档分析与识别大会技术竞赛“鲁棒阅读竞赛”冠军。2013年,在美国华盛顿召开的第十二届国际文档分析与识别大会上获得“网络图片文本检测”和“自然场景文本检测”冠军,是中国研究机构首次问鼎该项冠军;2015年,在法国南锡召开的第十三届国际文档分析与识别大会上再次蝉联“网络图片端到端文本识别”和“自然场景端到端文本识别”冠军,也是本届赛事夺冠的唯一中国团队。今年,在日本京都召开的第十四届国际文档分析与识别大会上,以杨春博士为技术组长的殷绪成教授团队,联合腾讯科技TEG技术小组,荣获“大规模真实场景端到端文本识别”冠军,识别精度比第二名提高了60%。COCO-Text竞赛数据集是目前本领域内最大的真实场景文本识别评测数据集,包括4.4万张训练图像样本、1万张验证图像和1万张测试图像;其中,端到端文本识别全面体现了文本检测、文字识别和技术系统等一系列相关的综合研究能力和应用技术水平。

公司是一家同时拥有地面零售连锁商务经验和移动信息技术研发, 业务平台运营经验的企业。目前公司旗下子公司中科信利涉及语音识别软件研发业务。公司持有其70%股权,中科信利是以开发语音识别搜索引擎技术为核心的软件企业,主要开发服务器端的音频信息处理技术,为国内多家音乐语音搜索平台运营厂家提供音乐搜索软件和音乐搜索平台技术支撑服务。中科院声学所中科信利语音实验室给公司提供了强大的技术研发后盾,目前主要研究方向包括:语音信号处理、语音识别、语种识别等领域。

【嵌牛鼻子】:人工智能

目前,优图团队专注于图像处理、模式识别、机器学习、数据挖掘等领域开展技术研发和业务落地。

自然场景/网络图片/复杂视频文本识别是利用人工智能技术,使计算机、智能手机等能够像人一样认识自然界和互联网图片视频中普遍存在的文字,在数字移动服务、智能信息检索、智慧城市与智能交通、互联网内容安全、图像视频大数据等方向和行业中具有重要的应用价值。近年来,该领域一直都是国内外学术界和工业界关注的重点方向;目前,世界上几乎所有的互联网和IT巨头都进行相关的技术研究及应用,包括了腾讯、阿里巴巴、百度、科大讯飞、汉王、Google、Microsoft、Amazon、Samsung等。

公司进一步完善视频智能交通版本,进行"烟火识别"算法开发,研发基于智能分析手势识别的PPT翻页控制及远程教育中的教师跟踪技术。并且在其他智能检测算法方面积极储备技术。在今年2月7日在深交所互动平台上,公司表示公司的智能视频算法已初出成果,并准备就某些软件申请著作权。

郑重声明:本文版权归新匍京a奥门-最全网站手机版app官方下载所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。