GTC现场直击:30亿美元的显卡、多人VR交互、神秘ISAAC黑科技

文章正文
发布时间:2024-10-16 19:44

欢迎关注“创事记”的微信订阅号:sinachuangshiji

  文/Lina

  智东西5月10日美国硅谷报道,今天,英伟达2017 GTC(GPU技术大会)的最重磅环节——CEO黄仁勋主题演讲——正式开始。每年的GTC上,这位CEO亲切地被粉丝们爱称为“老黄”的GPU领袖都会带来一场重磅主题演讲,通常来说不仅会发布新型显卡,还会点明英伟达在接下来这一年里的业务发展重心。

  就在昨天,英伟达刚刚发布了2018财年第一季度财报(截至4月30日)。不仅业绩好于预期(营收19.37亿美元,同比48%;净利润为5.07亿美元,同比增长144%),而且对Q2的展望也超好,股价盘后涨超14%,以117美元的价格直逼今年2月所创下的119美元历史新高。今天的主题演讲结束之后,英伟达的股价更是再次飙升,冲到了121美元,总市值已经达到了714亿美元,不知道黄老板昨晚做梦有没有笑醒?

  今天一大早,智东西来到了GTC大会现场,准备参加每年GTC的最重磅环节——CEO黄仁勋主题演讲。此时是早上8点,离9点开场还有整整一小时前,但是入口处已经排起了巨长的队伍。

  9点一到,主题演讲准时开场。名为“i am ai”的开场视频以“我是科学家”、“我是治愈者(healer)”、“我是保护者”、“我是老师”等第一人称作为旁白,介绍了以英伟达GPU驱动的人工智能如何在数据、医疗健康、农业、机器人、艺术、教学等等领域进行应用。

  一、摩尔定律失灵与GPU的崛起

  今天,老黄仍旧是一身(万年不变的)经典黑色皮衣开场。

  在将近10年的GTC上,每年老黄都会提到同一主题——摩尔定律。在过去30年里,我们受益于摩尔定律,芯片所提供的计算能力每年都高速增长,人们只需要等待计算能力来追上计算需求。然而在最近的几年里,摩尔定律开始失灵,人们需要花越来越多的成本来换取计算能力的些微增加。

  与摩尔定律逐渐失灵形成对比的是GPU的崛起,随着人工智能与深度学习在近年来的兴起,以GPU驱动的计算已经随处可见,英伟达的GTC大会每年也在以爆发式的速度增长着。

  今年,超过7000人参加了位于美国硅谷的GTC 2017,其中包括50间世界最大的公司、10间世界最大汽车厂商、80间AI创企,25间VR创企等等。

  二、VR打头阵:多人交互平台Holodeck

  寒暄完了,接下来进入正题。非常意外地,老黄第一个发布的项目并不是AI相关,而是一款VR多人交互平台Holodeck。

  在视频DEMO中,几名英伟达同事一起在虚拟世界里,观看一台实时渲染的Hypercar(可以理解成超级跑车中的超级跑车),不光整台车的外壳与内部装饰的细节都清晰可见,而且这辆车的所有部件都被渲染出来了,透过车前盖,可以清晰看到引擎部件。

  此外,这个虚拟世界是遵循物理定律的,当你伸手抓住方向盘时候,手指不会穿过方向盘。两人之间或者三、四个人之间也可以做牵手等的动作交互。根据老黄介绍,这款Holodeck最早在今年9月就会开放,具备三大特点:照片级真实的模型、遵循真实物理法则、适宜交流合作。

  多人VR也是2017年里被大家看好的一大方向,英伟达并没有将Holodeck作为一款产品推出,而是将其开放SDK给大众使用,进一步推进多人VR的发展。从DEMO中我们可以看到,这款Holodeck非常适用于多位设计师一起观看并修正同一产品。

  三、深度学习的爆发

  接下来就是本次主题演讲的重头戏——AI。

  老黄先是介绍了深度学习算法从2012年以来,推动人工智能爆发式增长。自2012年以来,人工智能界里一个突破紧接着另一个突破,在图像识别、自动驾驶、语音识别、翻译等领域取得了突出成就。人类已经成功地让机器识别出物体、人脸,进而让机器解图像/视频内容、随后增强学习带来了AlphaGo、以及发展中的无监督学习、对抗神经网络等等。

  深度学习的突破离不开三点:

  1、深度学习算法升级

  2、海量数据积累

  3、GPU的计算能力加速

  现在,AI与深度学习已经在日益兴盛。在斯坦福大学,最受欢迎的课程不再是如何做一个“电影评论家”,而是“机器学习入门”。不是每个人都是程序员,但是每个人都有自己的数据,每个人都想通过这些数据教会电脑如何在特定领域帮助我们,如何应用深度学习。

  举个例子,老黄接下来展示了一段充满噪声的视频(噪声相当于画面中白花花的的那些躁点)通过深度学习,机器可以识别出视频中的重点特称,进而还原出平滑无躁点的视频图像,甚至可以清晰地识别并还原出树木在车窗上的倒影。这一功能将会在今年晚些时候作为SDK开放。

  众所周知,AI是现在英伟达重头压码的项目。从硬件到软件,英伟达推出了全套的AI服务。不仅有HGX-1、DGX-1、Tesla-1等适宜深度学习的GPU硬件、还有各类SDK、以及Caffe2到TensorFlow到theano,世界上每一个框架都支持GPU计算。

  此外,18个月前,英伟达还推出了一个名为Inception的项目(PS:电影《盗梦空间》也叫Inception,但老黄没有提是否跟这个有关)这是一个面向全世界深度学习创企的项目,目前已经有1300家参加,其中包括了将深度学习用于农业的Blue River、用于车载智能的Argo AI等等。

  除了类似Inception这种面相创企的项目外,老黄还介绍了一款专门为企业打造的视频内容识别工具SAP AI。由于类似Facebook、微软、谷歌等公司拥有海量用户视频数据,如果能够训练机器看懂视频内容,则可以提供更全面的用户画像与用户兴趣点监测,非常适宜于精准营销。

四、重头戏!新卡发布Tesla V100

  讲了这么多,终于来到了今天的重头戏——新GPU显卡发布!这是一款名为Tesla V100的新显卡,也是老黄口中“世界上最昂贵的计算能力项目”——30亿美元(3 Billions Dollar)。

  话不多说,看图~

  这款GPU采用的是台积电的12nm Finfet工艺,有210亿个晶体管,同时具有5120个CUDA处理内核,具体参数如图。对于不太理解这些数据的人,你只需要知道一点:Tesla V100真的超——快。

  而且,本次发布的Tesla V100所运用的并不是我们熟悉的Pascal架构,而是一款新型的Volta Tensor Cores,单个计算单元比原本的速度快了12倍。

  就在演讲的10天前,老黄找到了SQUARE ENIX(对,就是那个推出了《最终幻想》的日本游戏公司),使用Tesla V100做了一段游戏图像渲染。看到男主角的穿着时,老黄还拿自己打趣道,“咦?这件皮夹克挺好看的,我得打电话过去找他们买一件。”台下观众瞬间笑出声。

  除了游戏渲染外,Tesla V100还可以用于许多方面,比如照片风格转化。不久前,人们已经可以通过人工智能将自己照的照片转化为毕加索、莫奈、梵高等不同艺术家的风格。但是,如果你想把一张照片的风格转化成另一张照片的风格呢?

  通过学习大量的照片,机器可以将左边的照片风格嫁接到右边的照片上,原本的蓝天白云变成了夕阳满布的日落景象(中间)。通过机器学习与深度学习,机器能够理解画面结构、画面内容,因此只有风格变了,但天空仍旧是天空、沙滩仍旧是沙滩。

  与其他应用相比,云计算服务对GPU的需求可以说是更为强烈。今天的主题演讲里,老黄还分别请来了来自亚马逊与微软的两位云服务高管:Matt Wood和Jason Zander。

  亚马逊是世界上最早布局人工智能的公司之一,现在其提供的的众多功能都与人工智能、机器学习、深度学习等相关,如图书推荐等精准营销,而最近势头正猛的Alexa与AWS云服务则更是人工智能的集中体现。亚马逊如今拥有世界最大规模的GPU集群。

  微软的云服务也在近年来以飞快的速度发展着,而除了云服务爱,微软也有类似Alexa的语音助手——Cortana。最近,微软宣布Cortana已经可以支持40多个国家的语言翻译,如果将Cortana嵌入到微软自己的AR头显HoloLens里,下一步我们可以戴着Hololens走到一给外国人面前无障碍交流。

  “星际迷航(Star Trek)里的万能翻译器马上就要出现了!”老黄笑着说。星际迷航与星球大战果然是技术宅两大心头好(其实智东西也不例外~欢迎其他Trekkie们来后台跟我们聊聊,AOS和TOS都欢迎哦)。

  五、基于Tesla V100的其他新产品

  除了介绍Tesla V100的各种应用外,基于Tesla V100的众多新产品:

  1)基于Tesla V100的新型超级电脑DGX-1

  旧版的DGX-1每台配备了8块Tesla P100显卡,而新版DGX-1配备了8块Tesla V100,售价14.9万美元,从今天起开放预售,今年第三季度开始发货,今天之内下单的壕还可以得到一次免费的升级。

  2)小型超级电脑DGX Station

  对于小型AI创企、或是对计算能力要求并不太高的个人,英伟达还推出了一款小型超级电脑——DGX Station。它配备了8块Tesla V100显卡,售价6.9万美元,同样是今天开放预售,第三季度发货。

  3)专门用于云计算的HGX-1

  这是一款专门用于GPU云计算的超级电脑,适用于公有云、深度学习、图形渲染、CUDA计算等。与DGX-1一样,配备了8块Tesla V100,售价14.9万美元。

  六、英伟达云:一键配置深度学习

  上文提到了亚马逊AWS云、微软Azure云,现在,老黄宣布英伟达自己也要做云啦——NVIDIA GPU CLOUD。不过,与亚马逊和微软不同,这是一款专门针对于深度学习的云。

而且,这款云还能够提供一键配备深度学习项目功能——这是什么意思呢?

  老黄说,“现在有关深度学习的软件太多了、框架太多了、不同类型的GPU也太多了,一个人要从零开始搭建一个深度学习的项目真是太困难了。”

  于是,英伟达要解决这一点,简化深度学习项目搭建过程。从DEMO中可以看出,用户登录了英伟达云之后,只需要3步就可以创建自己的深度学习项目:

  1、选择计算环境(既可以选择英伟达云、亚马逊云等,也选择本地GPU计算)

  2、接入数据库(可以选择现有数据库如ImageNet,或者自己上传)

  3、选择框架(如Caffe、TensorFlow等)

  接着,噔噔噔噔~你就可以创建了一个深度学习项目啦。不用买GPU、也不用搭环境,控制中心还是可视化的,可以看到你的账号之前的项目和正在运行中的项目,是不是好方便?这个项目今年7月就进入BETA测试阶段啦。

  同时,老黄还宣布Xavier DLA深度学习加速平台开源,用户可以在这基础上进行编程,优化深度学习效果。

  七、车载AI计算平台DRIVE PX

  除了上文提到的领域之外,自动驾驶、车载AI也是英伟达的重要关注领域之一。

  同时,英伟达还宣布和丰田合作,丰田将采用英伟达DRIVE PX车载AI计算平台,两家的工程师正在一起合作,希望在未来几年把搭载英伟达技术的丰田自动驾驶车开在路上。

  现在已经有200个开发者/企业正在使用这个DRIVE PX车载AI计算平台,其中甚至有一间时是做无人驾驶飞机的。老黄介绍了这个平台的三项功能:

  1)地图构建(Mapping ro Driving)

  车辆可以通过扫描环境、监测路上特征、进而创建高精地图、最终实现车辆定位与自动驾驶。

  2)副驾辅助(Co-Pilot)

  虽然我们现在不能立刻为世界的所有地方构建高精地图,但在我们已经创建了的地方,如从家里去公司,车辆可以在特定路程为你实现自动驾驶。

  3)守护天使(Guardian Angel)

  有时即使你没有开启自动驾驶模式,AI系统仍旧会一直在线。比如你在一个十字路口看到绿灯,正准备开车前行时,系统忽然禁止你前行,因为刚好有车闯红灯冲过来,

  八、细思恐极黑科技——ISAAC

  看过我们3月发布的有关神经网络之父Yann LeCun清华演讲文章的用户可能还记得,我们在文章里面提到了机器学习的一个分支——强化学习/增强学习(Reinforcement Learning)。AlphaGo用的就是增强学习。需要建立一个世界模拟器(World Simulator),模拟真实世界的逻辑、原理、物理定律等,然后再将机器放进这个世界里不断训练。

  万万没想到,NVIDIA今天就推出了一个类似的世界模拟器——ISAAC机器人训练模拟世界。在这个虚拟世界里,万事万物都遵循物理法则——比如物体运动、万有引力——但是不遵循时间法则。

  在现实生活中,你想要训练一台机器学会打冰球,你要将这个冰球放在机器前面,一遍一遍地教会它,成千上万次的训练都耗费大量的时间。然而在虚拟世界里,机器可以在一秒内重复众多次这样的动作,不需要遵循现实世界中的时间法则。

  而且你还可以同时训练一堆机器学习打球,然后找到里面最聪明的一个,将它的“大脑”程序复制出来,创建一堆同样的机器再继续训练筛选,听起来很像养蛊对不对……

  而最可怕的是这个世界里不需要遵循时间定律,人类需要通过几百几千万年的进化才能够学会使用工具,而一个机器人只需要几个月甚至几天的训练时间就能学会打冰球,谁知道它们未来能学会什么……(手动惊恐脸。jpg)

  不过话说回来,就像我们在Yann LeCun清华演讲文章最后提到的,对于许多科幻小说里提出的,最终能够“推翻人类”、“统治人类”的“超级智能”,我们真的大可不必太担心。如果我们想要机器做一件事情,则需要给它赋予这个能力,朝这个目的去打造机器,但我们并不会这样去打造机器。

  结语、乘着AI浪潮而兴盛的英伟达

  新的GPU(Tesla V100)、新技术(Holodeck等、DRIVE PX平台)、新产品(DGX-1、DGX)、黑科技(ISAAC机器人训练电脑)等等……今年老黄的演讲可以算得上是干货满满、诚意满满了。

  随着人工智能、深度学习、机器学习、自动驾驶等技术的兴起,人们对强大计算能力的需求日益旺盛。而英伟达的GPU凭借其优秀的并行处理能力,在人工智能浪潮中抢占先机,一跃成为AI时代里一支异军突起的力量——这两年里,英伟达飙升的股价也证明了这一点。