
在昨日的世界互联网大会上,旷视的人工智能算法平台Brain++荣获了“世界互联网领先科技成果”。

那么什么是Brain++?
Brain++,它是一套端到端的 AI 算法平台,目标是让研发人员获得从数据到算法产业化的一揽子技术能力,不用重复造轮子也可以推进 AI 快速落地。我们的 Brain++还引入了 AutoML 技术,可以让算法来训练算法,让 AI 来创造 AI。
人工智能算法从研发到部署是一套庞大的系统工程,目前业界普遍把深度学习框架作为算法开发工具,但是学习和使用成本高,难以规模化。究其原因,在于只有深度学习框架是不够的,需要拉通从数据到算力再到框架的端到端解决方案,人工智能时代亟需一个满足产业需求的操作系统。目标是让研发人员获得从数据到算法产业化的一揽子技术能力,不用重复造轮子也可以推进AI快速落地。可以让算法来训练算法,让AI来创造AI。
具体而言,Brain++涵盖了深度学习算法开发的所有环节。
从数据的获取、清洗、预处理、标注和存储开始,到研究人员设计算法架构、设计实验环节、搭建训练环境、训练、加速、调参、模型效果评估和产生模型,到最终的模型分发和部署应用,Brain++为旷视的研发人员提供了一站式全流程的 AI 工程解决方案。
总体架构上,Brain++可以大体分为三部分。
主体的深度学习算法开发框MegEngine提供算力支持的 MegCompute用于提供数据服务和支持的 MegData目前,可以使用Brain++来训练、部署算法,无需依赖第三方开发的深度学习框架。

依托Brain++,在行业落地方面,已实现对个人物联网、城市物联网、供应链物联网三大场景的赋能。
2019年8月,科技部宣布依托Brain++“图像感知国家新一代人工智能开放创新平台”。未来,将通过开源,推动建立完善的AI产业生态,为打造自主可控的人工智能操作系统奠定坚实的基础。

简单点来说:刚开始的AI行业,一切都需要手动输入!以前,一个AI模型,至少需要一两个月,开发者甚至要通过手敲C++来完成计算过程,需要手动输入各种情景和变量!

举例:20年前,深蓝下棋,是靠程序员手动输入了成千上万的棋谱,而后电脑计算对手的各种可能概率!(如果,对战的棋手,走出棋谱里没有的棋路,电脑就很容易战胜)

那时候,全行业的深度学习框架还只有一个早在2007年推出的近乎文物级别的Theano与一个2013年推出的Caffe ,这些框架局限于简单的推理和逻辑验算! 举例:20年前,深蓝下棋,是靠程序员手动输入了成千上万的棋谱,而后电脑计算对手的各种可能概率!(如果,对战的棋手,走出棋谱里没有的棋路,电脑就很容易战胜) 拆解Brain++的组成人工智能数据平台人工智能基础(训练)框架人工智能计算平台三大部分的内容,分别对应着AI发展中的三大要素:数据、算法以及算力。

在数据平台中通过让算法与数据一同工作,借助算法来辅助数据清洗和标注,可以大大提升数据标注的速率与成本。
其具体方式是先以少量的标注训练出一个初级的算法,然后以这个算法来标注数据,接着对于算法标注过程中遇到的不确定的数据,人工的对其中最不确定的数据进行标注,算法则再一次对剩余数据进行自动标注,进而以最小的时间与成本代价获得了更高效更快速的标注结果。
此外,在数据方面,旷视还在今年年初联合北京智源人工智能研究院发布了一个包含70万张图片的数据集Objects365,其中包含了365中常见的物体以及超过一千万个标注框,是目前世界上最大的物体检测数据集,相较此前最大的COCO数据集,是其十倍之多。
Brain++中的人工智能基础框架则可以简单地认为是TensorFlow或者PyTorch。

作为一个典型的第二代AI开发框架,Brain++相较“前辈”Caffe更灵活,可定义的程度也更高。另外,还结合了其自主研发的旷视AutoML技术可以为神经网络针对不同平台进行自动的优化,进一步提升了算法的灵活性。
举例:**音响的智能升级!
在以前,智能语音控制是需要人工不断输入,遇到一个方言类输入,需要人工手工标注出来!给系统一个可选择性!比如四川方言“龟儿子” 标注备选同义词
兰州方言“夯客” 标注备选同义词
东北方言“棒槌” 标注备选同义词

最近,全面升级的某某助手高调亮相。升级之后,某某助手有三大亮点值得瞩目!
全双工免唤醒能力全球首创的家庭信息流能力强大的家庭通讯与通知能力其中,搭载的全双工免唤醒能力,是小度智变的关键。
当用户喊出一次语音控制后,就再也不用持续唤醒,可以很智能的识别出哪些语言是应该执行的指令,哪些是没有意义的对话。
这是系统积累了多年的语音、语义识别和自然语言处理的AI能力表现。再也不需要多次重复的无效唤醒,人机交互体验更加流畅。
家庭信息流能力,是信息流、定制化和个性化推送能力是Brain++础上的延展。借助信息流这一天然优势,人工智能产品不仅能为用户提供大量优质内容,还能在与用户的互动中逐渐学习用户喜好和需求,为用户推送喜欢、合适的内容。

在这个系统中,每一个个体终端,都是一个可以学习的媒介!
系统会自动从每个智能终端采集用户使用习惯!自动申请需要的CPU/GPU数量,形成终端和服务器交互学习!实现人工智能的自我升级!这一切都是系统自我实现的!
系统还可以在训练的过程中随时停下来进行调试,找出错误的地方后然后继续改进!
另外,多任务与多用户调度能力也是Brain++的一个特色。软件对算力分配利用透明计算的原理,开发了一层软件进行计算资源的管理与调度优化,可以在用户空闲时临时收回资源分配,进而支持数百研究人员同时在上万块GPU上进行上从数百到数千个改进学习任务。
两种方式互相结合,可以在保证训练效率的情况下让算力能够被最高限度的利用。
从传统被动学习

到 ????????

的转变!
那么这样一个由三大部分构成的Brain++,相比以前用的Caffe、TensorFlow系统有什么不同呢?
首先是完全自主研发。Brain++的意义在于更加适应已经很庞大的数据库,面对很难快速的去做调整的数据,可以很容易的去做修改,去验证!
其次是针对计算机视觉任务的定制化优化:在Brain++中,针对计算机视觉做了很多的优化。
数据检测时可以用一个多达256多个样本的“大mini-batch”的检测器,用128张GPU卡训练任务,进而将训练时间从33小时减少到4小时。

那么,Brain++的发展的最后是不是就能够实现科幻电影里那种能够自我学习的机器人那?

当然,未来是可能的!除非在开发出更完善的平台上!
想要做好AI平台,其难度与重要意义可以类比如今的华为想要搭建一个鸿蒙操作系统+生态。
而要拆解其难度,摆在面前的第一关就是怎么将其搭建起来,这本就是一个非常庞大的工程。

不光是时间问题,不仅意味需要时间从底层起一步步构筑完善,最重要的,则是生态的构建,如何汇聚起优质的开发者,如何保证框架的高效可用,即使是企业内部使用,这依旧是无法绕开的难题!
长期以来,业内都会有一个调侃叫做所谓人工智能,有多少智能,背后就有多少人工。
Brain++平台的出现,让这种调侃,在未来失去了玩笑的可能!

Brain++是一个不断的进化,一路不停的反哺着最切合用户需求的应用。或许,五十年、一百年后,所有科幻电影里的情节都能实现!
推荐阅读
(点击标题可跳转阅读)
最详细、最完整的相机标定讲解深度学习+机器视觉=下一代检测视觉检测系统最经典的结构你了解吗?机器视觉技术的十大应用领域工业相机和普通相机究竟有什么不同?基于机器视觉和深度学习的智能缺陷检测波士顿等移动机器人的视觉算法解析2020年37个人工智能技术发展趋势机器视觉的光源选型及打光方案分析光学三维测量技术及应用国内80%搞机器视觉的工程师,走的路子是错的!视觉+机器人,如何实现连接器的自动装配?机器视觉技术发展的五大趋势搞懂机器视觉基本内容,这份PPT就够了机器视觉:PC式视觉系统与嵌入式视觉系统区别
基于HALCON的机器视觉开发,C++或C#如何选择?
3D视觉技术在机器人抓取作业中的应用实例基于机器视觉的粗糙度检测方案机器视觉常用图像软件对比及分析工业相机编程流程及SDK接口使用汇总

End

商务合作:QQ1504328545
声明:部分内容来源于网络,仅供读者学习、交流之目的。文章版权归原作者所有。如有不妥,请联系删除。
更多是视觉资讯尽在“新机器视觉”微信公众号~