查询服务

您所在的位置: 首页 > 动态区 > 企业新闻 > 电子信息

旷视科技:产学研的结合才是创新本质

发布时间:2017年12月04日    信息来源:                          字体:                          

  当地时间10月29日上午,在意大利威尼斯召开的计算机视觉国际顶级会议 ICCV 2017上,人工智能企业北京旷视科技有限公司(以下简称“旷视科技”)团队拿下三项世界冠军,成为了第一个在COCO挑战项目中获得多项冠军的中国企业。

  就在2天后,旷视科技又宣布了这样一个消息,10月31日,旷视科技完成新一轮4.6 亿美金融资,刷新全球人工智能领域单轮融资最高纪录。

  对此,旷视科技品牌与市场中心总经理谢忆楠说:“这些成绩更大的价值,在于印证了旷视在行业中的领导地位,以及能树立行业更正确的评价标准。”

  旷视科技希望让更多的人明白,一家企业的价值不仅仅是看科研人员的数量,更重要的是要能挖掘出行业内更本质的创新跟发展,产学研的结合才是创新本质。

  拿到分量最重的三项冠军

  谢忆楠介绍,在ICCV 2017的COCO、Places共七项的挑战项目中,旷视科技研究院团队(Megvii)只参与了四项挑战但都获取了名次,其中包括三项第一、一项第二。

  MS COCO Challenge 是继 ImageNet(已停办)之后,计算机视觉领域最受关注和最权威的比赛之一,这个比赛也代表了继 ImageNet 后的图像识别的最高水平。

  COCO 从2015年开始举办,至今已经三届,前两届物体检测冠军分别是 MSRA 和 Google。今年的 COCO 包含四个物体检测、物体分割、人体关键点检测、背景语义分割。旷视科技团队参与了前三项任务的挑战,并取得了两项第一(物体检测、人体关键点),一项第二(物体分割)的杰出成绩。

  而 Places 是在今年新设立的一项旨在深度理解图像场景的国际级计算机视觉类竞赛,今年与 COCO 联合举行。Places 2017 共设有三个任务:场景分割、物体分割、边缘检测。旷视科技团队只参与了其中物体分割的挑战,并击败了主要竞争对手 Google,赢得了该任务的冠军。

  谢忆楠说,对于产业界来说,机器对于人体、物体和场景的理解十分重要。此次旷视研究院在 COCO 和 Places 竞赛中的成绩足以印证旷视科技在全球范围内的技术领先性。

  实际上,自2011年旷视科技成立以来,其就利用具有竞争力的技术优势,旷视研究院与产品中心将持续在产品开发中共同推进技术转化,展开行为识别、场景分割、物体检测和物体分割等技术在互联网金融、智能安防、城市大脑、新零售、手机等实用场景或行业中的应用探索,以实现技术价值最大化。

  旷视科技首席科学家、旷视研究院院长孙剑表示,这次旷视科技能够一举在这个竞争最激烈的比赛中,第一次代表中国企业拿到分量最重的三项冠军,主要依赖三个法宝:旷视科技拥有自研并全员使用的深度学习引擎 MegBrain,它使我们可以以最快的速度系统化训练算法;旷视研究院拥有对深度学习和计算机视觉算法长期而深入的研究积累,虽然旷视科技很少在国际数据集竞赛上“刷榜”,但其实内部的技术指标一直都非常高,借这次机会拿出来和大家分享一下;旷视研究院除了拥有充沛的计算资源,更重要的是拥有一个鼓励不断高速创新的环境、和追求极致的文化。

  构建“产学研”结合闭环

  追溯起来,旷视科技是国内计算机视觉领域最早的创业公司之一,其主要致力于打造自己的人工智能开放云平台,提供人脸识别、图像识别的开放服务,主要应用于金融、安防、智能手机等板块。

  业内人士告诉记者,旷视科技的创始人印奇实属技术天才,高中还没毕业就被清华大学选中。进入清华后,他入选姚期智的实验班。姚期智是中国科学院院士、量子计算专家、图灵奖获得者,他的“姚班” 培养出了大批科学领域的人才。在“姚班”印奇结识了他现在的另外两位创业伙伴––唐文斌和杨沐。

  从大二开始,印奇和唐文斌就在微软亚洲研究院实习,参与微软人脸识别引擎的研发工作。那时候,印奇就对人脸识别技术很是着迷,毕业之后,他曾在微软研究院全职工作一年,参与研发的引擎后来被应用在X-box和Bing等微软产品中。

  2011年,印奇、唐文斌、杨沐3人在清华园创立旷视科技。他们当时的想法是先从人脸识别技术出发,再到图像识别研制“机器之眼”,用它读懂世界。

  谢忆楠说,目前,旷视科技共有约600名员工,其中一半以上都是研发人员。

  如今,精通深度学习的基本都是读过PhD(泛指研究型博士学位)的人,中国在这方面目前总共也就一、两百号人。

  相比科研人员的数量,旷视科技更注重的是一个由学术委员会、旷视研究院以及旷视科技商业化的业务构成的“产学研”结合的闭环。

  旷视研究院的第一批学员都是来自于信息学竞赛 ( NOI/IOI ) 和大学生程序设计竞赛 ( ACM/ICPC ) 的金牌选手们。

  谢忆楠说:“研究院主要培养研究科学家和全栈人工智能工程师,简单的来说就是同时具备前端和后台能力、独当一面的工程师。”

  11月5日,旷视科技宣布组建学术委员会,聘请了中国科学院院士、量子计算专家、图灵奖获得者姚期智担任旷视科技学术委员会首席顾问。

  除了旷视科技的三位创始人,如今旷视内部的大量员工也出自“姚班”。

  关于成立学术委员会,谢忆楠表示:“学术委员会主要的功能,在于能为公司提供一些无论是在学术角度还是在工业角度都超出当前事业的见解。”

  旷视科技目前其拥有国内外申专利超过 500 件,累计获得国际人工智能技术评测冠军10余项,是中国人工智能企业拥有自主知识产权最多的公司之一。

  “刷脸”服务人群覆盖超2.5亿

  走进旷视科技总部,玻璃门上的摄像头会自动识别人脸,并根据数据库匹配做出开门与否的选择。第一次访问的客人,必须将自己的人脸信息输入进去,才可以顺利进入。

  近年来,旷视科技的人脸识别技术产品应用范围迅速扩大,覆盖领域包括金融、安防、商业(白名单管理等)、医疗、教育、政务、网约车平台、直播等多个产业。

  2015年3月,阿里巴巴集团董事局主席马云在德国“CeBIT2015”开幕式上,向德国总理默克尔演示旗下蚂蚁金服的Smile to Pay“扫脸”技术。

  该扫脸技术就是由旷视科技提供,当时在业内掀起了人脸识别的小热潮。但那时的人脸识别技术应用范围还十分有限,只能在少量安防和金融领域使用。

  现阶段,在互联网身份验证服务方面,谢忆楠说,旷视的产品主要应用方向包括实名制、远程验证的风控体系,如防止因身份证信息泄露导致非法贷款行为等情况发生。

  相应的应用领域包括银行验证、互联网金融;甚至包括了许多生活服务类场景,如:车辆出行的司机、乘客实名验证、Airbnb等共享经济、直播主播的身份验证等。

  但除了金融领域,其他的应用基本都是一次使用模式,虽使用规模大,但背后的商业空间较小。而金融领域却可以多次使用,使用渠道包括网络个人信用分、黑名单、微众银行等。

  谢忆楠透露,目前,金融领域的人脸识别应用中,旷视拥有85%左右的市场占有率。

  在人工智能开放云平台方面,旷视打造的Face++人工智能开放平台不久前刚刚完成了升级,用户可在平台注册账户并自助使用服务,主要为开发者提供基础的AI能力,如人脸识别、表情识别、文字识别、人体识别等。谢忆楠说,截止到今年10月份,旷视科技的人工智能开放平台的 API 已经服务了来自200多个国家的数十万开发者,总调用量超过60多亿次。

  除了上述平台产品,旷视科技也在围绕核心技术打造“云+端”的行业解决方案,系统化的为行业用户解决切实的问题。尤其是在商业领域和安防领域,纯云端的服务无法满足复杂多变的场景需求,这些场景需要软硬结合的智能化产品来带动行业升级。

  商业领域的引用较为单一,主要是白名单管理,从效果来看,人脸识别的应用价值主要体现在降本增效,可以再增加人们体验的前提下提升商业运行效率。比如一些办公场景原本需要门禁卡出入,但是用刷脸的形式可以大大提高员工的出行效率;而在零售的场景,用人脸技术可以对原本商家无法掌握的线下客流进行实时抓取和统计分析,这就让传统零售业变得自动化智能化。

  而在安防领域上,目前旷视可提供的数据服务,能达到判断何时何地出现过嫌疑人的程度。这种技术应用,将视频变成警情,可提升办案的速度。谢忆楠提到,旷视合作的破案最快的案件仅用了25分钟,此前这个案子已经八年未解,但通过人脸识别技术,很快就锁定了嫌疑人。

  目前,旷视科技也推出了自有的摄像头设备,内含旷视的人脸识别算法。根据场景需求,产品按照服务器大小分为两种,目前最前沿的是基于FPGA芯片开发的一款全帧人脸抓拍机,旷视将其称为MegEye-C3S。

  除此以外,在人脸识别技术与产业结合的成果上,比较典型的还有现在手机厂商们极力推崇的“刷脸”功能。

  11月7日晚间,锤子科技发布的坚果Pro2就采用了人脸识别解锁技术,其中的人脸识别解锁功能就是由旷视科技提供技术解决方案。此前,旷视科技还为华为、vivo、小米等国内一线手机产商提供过该技术方案。

  除了智能手机厂商,旷视科技的合作伙伴还包括阿里巴巴、蚂蚁金服、华为、联想、富士康、招商银行、万科等近知名公司,客户数量近千家。

  实际上,成立6年来,旷视科技的技术经历了几个应用发展阶段。

  从2011到2013年,与淘宝、美图等公司合作,将人脸数据化,并进行娱乐、卡通化的应用;第二个阶段是实名制的落地,主要应用于银行、考场、机场等场景;现阶段,技术变成更轻型化的功能技术,只要是实名制的APP都可以使用。

  谢忆楠说,目前旷视科技的人脸识别技术及其应用范围,还在继续延伸,如从人脸到人形的识别,以及针对视频结构化和开摄像头追踪等技术的探索。

  赋能机器之眼 构建城市大脑

  在人脸识别这个“超独角兽时代”,未来,旷视科技又将如何定位未来的发展,走出差异化?

  谢忆楠说,旷视科技未来三年主要做两件事:赋能机器之眼,构建城市大脑。他认为,安防是未来城市和物联网的雏形,它未来一定是偏网络化、中心化、多层级的一个解决方案,旷视科技在这其中的定位就是做“赋能的机器之眼”。

  该赋能技术的核心不是SDK或者API,而是云和端的结合。“赋能的本质就是打通数据的链路,而不是一个简单的闭环。”谢忆楠说。

  据中国安防网的统计,2016年我国安防行业总体规模已达5687亿元,同比增长17%;预计未来两年国内安防市场将维持15%的增速,2018年安防市场规模将达到7521亿元。

  智能安防行业已成为计算机视觉领域最热门的AI+行业落地方案之一,除了有新兴的创业独角兽公司旷视、商汤、云从、依图等布局外,老牌的海康威视、浪潮集团等也扎根其中。

  谢忆楠觉得,旷视科技的核心优势在于它是世界最大面部识别云平台,并且有着强大的软硬件结合能力。

  从 2015 年起,旷视科技开始涉足硬件,目前为止一共生产了6款物联网智能感知摄像头,1款智能物流机器人,服务了几十家机器人企业。

  但是其真正的杀手锏是一种“类人脑神经元算法”的深度学习算法。“通过这种技术框架,他们可以用大规模的数据对算法进行‘训练’,从而提升‘智力’。”谢忆楠表示。

  旷视曾参与 G20 峰会、博鳌亚洲论坛2017 年年会、金砖国家领导人会晤等国际级重要活动的安保工作。

  但是,由于不同细分领域用户其对安防产品的具体使用场景不同,对安防的需求也存在差异,目前大部分产品都不能满足这些特性需求。另外,由于该行业的技术门槛较高,很难把最新的科技实现全面的集成覆盖,各地区差异性显著。这是安防领域亟待解决的两大问题。

  谢忆楠认为,安防领域的格局到明年就会定下,并且会是三分天下的格局,有新兴AI业务公司、行业巨头以及传统的科技巨头。

  而想要构建城市大脑,安防、金融、零售、智能物流、智能制造等实现统一的结合必不可少。谢忆楠认为,在构建城市大脑上,旷视最核心的定位就是把数据连通,形成平台化的计算方式,做未来大数据的构建者和运营者。

  由于整个产业链的庞大,谢忆楠认为:“由于现在技术成熟分周期,技术与产品、场景、解决方案甚至客户,都需要相互权衡,才能最终达成综合方案。”

  因此,谢忆楠说,接下来,旷视科技计划将4.6亿美金的融资用在在金融安全、城市大脑、手机智能三个方向上,在三个方向实现更好的落地,形成产业上、下游的整合。

  “随着旷视逐步的发展,除了思考目前的现状以外,旷视也要思考未来三、五、十年的发展,在正确的方向上给予更大的投入。”谢忆楠说。

  从目前的投资方和客户组合判断,旷视科技发力国际市场指日可待。

  对此,谢忆楠表示:“未来两年左右的时间,会有纯深度学习或纯人工智能的公司走上公开市场,旷视希望自己是第一个,但这并不是旷视的目标。旷视的价值在于未来的五到十年。”

中科汇联承办,easysite内容管理系统,portal门户,舆情监测,搜索引擎,政府门户,信息公开,电子政务