会成为元宇宙最重要的基础设施吗?

日期:2022-10-12 14:57:36 / 人气:163

人们往往会用波峰和波谷来描述股票的走势。但是往往却会无视最重要的工夫维度。从短期看,你也许能分出分明的波峰波谷,但假如再放眼到更长的工夫维度,过来站在最高点的波峰,也不过是站在将来最低点的脚下而已。现如今,英伟达正在被市场看低,但一位知名科技博主指出,其实这家企业正在同时穿越三个山谷,一旦它成功抵达天国之城,就将成爲将来元宇宙最重要的根底设备。文章来自编译。英伟达的投资者之前不断都处在山谷之中:英伟达的股价跌跌不休不过,这张图表不是英伟达最近两年的状况,而是其从 2017 年终到 2019 年终的股价走势;上面这张是它从 2017 年到明天的股价走势:英伟达目前的股价正在跌跌不休过来三年,英伟达的业务发作了三件大事,将他们的股价推到了史无前例的高度:疫情招致团体电脑购置量激增,尤其是游戏图形卡的购置量激增,由于客户既要买新电脑,手头又有一笔可自在支配的支出没中央花,就只能追求更好的游戏体验了。机器学习使用在超大规模计算(hyperscalers)中呈现迸发式增长,而这些都是用英伟达的 GPU 训练的。加密货币泡沫招致对英伟达芯片的需求猛增,由于要挣钱(挖矿)得靠求解以太坊打工量证明(POW)方程。加密货币的走势与其说是山谷,不如说是悬崖:以太坊成功切换到权益证明(POS)模型,令由不计其数的英伟达 GPU 搭建出来的一整个矿场在一夜之间变得一文不值;鉴于另一个采用打工量证明的次要加密货币网络,也就是比特币,简直完全是用定制设计的芯片来开采的,所以一切这些旧的 GPU 都涌入到二手市场。关于英伟达来说,这是一段特别蹩脚的时期,由于该企业之前爲了满足对 3000 系列芯片的需求而付出的努力正值播种报答之际,疫情带来的购置热潮却曾经完毕。不必说,太多的新库存再加上太多的二手库存使得企业的财务业绩蹩脚无比,尤其是英伟达还在计划爲新系列清算途径:英伟达的游戏支出也下降了上周在承受采访时,英伟达首席执行官黄仁勋(Jensen Huang)坦诚,企业没有预见到这一点:我不觉得我们本可以预见到这一点。我不以为我会做什麼不一样的事情,但我从之前的例子学到了一点,那就是一旦事情最终发作在你身上时,就唯有吞下苦果,然后放下……我们渡过了两个蹩脚的财季,在企业的背景下,两个蹩脚的财季的确会让一切投资者感到懊丧,让一切员工感到困难。英伟达以前也遇到过这种状况。出成绩应对就是了,不要过度心情化,理解成绩是怎样出来的,让企业尽能够坚持矫捷。但是一旦既成现实,你只能做出客观、困难的决议。我们照顾好我们的协作同伴,我们照顾好我们的途径,我们确保每团体都有足够的工夫。我们推延了 Ada 的出售,从而确保各方都有足够的工夫来对商品停止重新定价,这样即使在 Ada 的背景下,即使 Ada 出来了,重新定价后的商品其实还是具有十分好的价值的。我以为我们曾经把各方都尽量照顾到了,这招致了两个相当蹩脚的季度。但我以为从大局来看,我们很快就会回来的,所以我以为这也许是过来的经验。这个说法也许有点托大;往年早些时分,Tae Kim 与 Doug O'Laughlin 等剖析师预测英伟达的股价会暴涨,虽然鉴于英伟达在疫情中期曾经订购了额定的一批 3000 系列 GPU,这些预测关于避开 PC 销售放缓与以太坊(从打工量证明)过渡的完满风暴大约曾经爲时已晚(黄仁勋还指出,芯片的消费前置工夫添加是英伟达错得如此凶猛的一个重要缘由)。关于英伟达来说,更令人担忧的是,虽然库存和以太坊成绩是阅历了“相当蹩脚的财季”的最大的驱动要素,但这还不是其游戏业务正在阅历的独一低谷。我想到了约翰·班扬(John Bunyan)的《天路历程》(Pilgrim’s Progress):可是在屈辱谷里,不幸的信徒可够受了;由于他还没有走多远,就看见一个叫做魔王(Apollyon)的善良的朋友在田野里迎面而来。这个魔王叫做库存成绩;故事里信徒打败了魔王,英伟达最终也能打败库存成绩。走完这个山谷,又是一个叫做死荫谷的山谷;信徒必需要从这儿经过,由于到天国去的路就在它两头穿过。这山谷是个十分热闹的中央。先知耶利米对它这样描述过:“一片原野,一片沙漠有深坑之地,一片干旱和死荫之地,一片无人(除了信徒)经过、无人寓居之地。”上周英伟达关于 GTC 的主题演讲令人震惊的是这个寓言在多大水平上契合英伟达的野心:该企业正在走上一段似乎相当孤单的旅程,去定义游戏的将来,如今还不清楚业界其别人会不会跟进或许什麼时分跟进。此外,该企业在数据中心以及元宇宙方面也在追求异样大胆的战略:在一切这三个方向上,英伟达要追求的高度比它在过来两年里到达的那些成就都要高,但途径却是出奇的不确定。山谷中的游戏:光线跟踪与人工智能临时以来,3D 游戏的出现都要靠一系列的技巧,尤其是照明方面的技巧。首先,游戏决议了你能看到什麼(也就是渲染一个被其他物体遮挡的物体是无用功);然后,你得给物体(如一棵树、一棵草或任何你能想象到的东西)使用适宜的纹理。最初,你得从事后确定的光源地位去打光,然后再给物体添加暗影。最初再把整个场景转换成一个个的像素,渲染到 2D 屏幕上;这个进程叫做光栅化。光线跟踪对光线的处置方式是完全不一样的:光线跟踪不是用事后确定的光源来打光,使用暗影映射,而是从你的眼睛(或更精确地说,是你察看场景的摄像头)开端。然后再跟踪目光所及的屏幕的每一个像素,然后(基于像素所代表的对象类型)对像素停止折射处置,并持续跟踪该光线,直到光线击中光源(然后就停止光照处置),或许丢弃这条光线。这种处置能发生十分逼真的打光效果,尤其是反射和暗影效果。无妨看看上面这一来自《PC Magazine》 的图片:我们来看看光线跟踪是如何改善了游戏的视觉效果的。我截取了 Square Enix 的《古墓丽影:阴影》PC 版的几张屏幕截图,这款游戏是支持Nvidia GeForce RTX 显卡的光线跟踪暗影效果的。可以细心看看空中上的暗影。采用光栅化的暗影效果采用光线跟踪技术的暗影效果与效果更粗糙的光栅化版本相比,光线跟踪的暗影效果愈加柔和、更爲逼真。其暗度取决于被物体遮挡住的光量多寡,甚至暗影自身都有明暗之分,而光栅化似乎给每个物体都赋予了一个十分僵硬的边缘。光栅化的暗影效果看起来还不错,但是在玩了带有光线跟踪暗影效果的游戏之后,就很难回去了。英伟达是在 2009 年初次宣布 API 支持光线跟踪的;不过,运用这种技术的游戏寥寥无几,由于这种技术的计算本钱很高(电影 CGI 倒是运用了光线跟踪技术;不过,那些场景渲染普通都需求数小时甚至数天的工夫;可游戏的渲染却必需是实时停止的)。所以 2018 年英伟达才推出了引入了公用光线追踪硬件的 GeForce 2000 系列显卡(所以才叫做“RTX”)。AMD 则走了另一条路,给其中心的着色器单元添加了光线跟踪功用(同时还停止光栅化处置);与英伟达的纯硬件处理方案相比 AMD 的要慢一些,但能用,而且重要的是,由于 AMD 同时爲 PS5 和 Xbox 制造显卡,这意味着如今整个行业都支持光线追踪技术了。未来会有越来越多的游戏支持光线追踪,不过由于功能成绩,大少数使用依然相当受限。不过,光线跟踪很重要一点在于:光照效果是静态计算出来的,而不是靠光线和暗影贴图,所以开发者可以“收费”取得光照效果。完全依赖光线跟踪技术的游戏或 3D 环境开发起来应该更容易、更廉价;更重要的是,这意味着环境可以以开发者从未意料到的静态方式发作变化,而且与大少数靠手工费力预制的环境相比,其光照效果还更爲逼真。关于两个新兴的使用场景而言,这一点尤其吸引人:一是像《我的世界》(Minecraft)一样的模仿游戏 。有了光线追踪技术,拥有高度详尽的 3D 世界这个梦想会变得越来越接近理想,由于这些 3D 世界都是静态构建的,而且拥有完满的光照效果。将来的游戏可以走得更远:英伟达的宗旨演讲一开端就引见了一款叫做 RacerX 的游戏,包括物体在内,游戏当中的每一个局部都停止了完好的模仿;游戏内的物理特性也应用了相反类型的光照计算。第二个场景是我在《DALL-E、元宇宙与零边沿本钱内容》中讨论过的 AI 生成内容的将来。我下面提到的一切纹理目前都是手工绘制的;随着图形功用(次要由英伟达推进)的加强,由于需求创作高分辨率的资产,新游戏的开发本钱也会随之添加。因而,可以想象,未来有能够资产完全是自动化创立出来的,而且是实时停止的,然后再经过光线跟踪技术赋予适宜的光照效果。不过,目前英伟达曾经在用 AI 来渲染图像了:该企业此次还发布了深度学习超级采样(DLSS)技术的第 3 版。这项技术可以预测帧并停止预渲染处置,这意味着那些帧基本不需求计算(之前版本的 DLSS 需求对独立像素停止预测和预渲染)。此外,就像光线跟踪技术一样,英伟达也采用了公用硬件,让 DLSS 的功能更好。这些新做法搭配上英伟达 GPU 的公用内核,令英伟达十分合适爲游戏与沉溺式 3D 体验(如虚拟世界)树立全新的范例。但成绩是:一切这些公用硬件都要付出代价。 英伟达的新 GPU 是大芯片——顶级的 AD102,以 RTX 4090 的方式出售,这是一款完选集成的片上零碎,采用台积电 N4 工艺,尺寸爲 608.4 平方毫米;相比之下,AMD 行将推出的 RDNA 3 显卡系列内置的顶级芯片 Navi 31 芯片是小芯片(chiplet)设计,采用台积电 N5 工艺,尺寸爲 308 平方毫米,加上采用台积电 N6 工艺的 6 颗 37.5 平方毫米的内存芯片。简而言之, 英伟达的芯片要大得多(这意味着更贵),而且它采用了略微更古代的工艺流程(能够本钱会更高)。 Dylan Patel 在 SemiAnalysis 上解释了这种做法的潜在影响:简而言之,经过保持 AI 和光线追踪固定功用减速,转而采用先进封装的更小芯片,从而节省了少量芯片本钱。 AMD 的 RDNA 3 N31 和 N32 GPU 的先进封装本钱明显上升,但绝对于晶圆和成品率成原本说,小型扇出 RDL 封装依然十分廉价。到头来,与经过将内存控制器与有限的缓存拆分、运用更廉价的 N6 而不是 N5 ,以及更高的产出所节省的本钱相比,AMD 封装本钱的添加就不值一提了......在接近十年的工夫里,英伟达在传统光栅化的游戏功能方面第一次呈现本钱构造更糟的场面。这就是英伟达正在走进的山谷。由于 4000 系列的昂扬价钱,在英伟达做完宗旨演讲之后,尤其是当英伟达的网站上的细则标明英伟达发布的其中一款二级芯片其实更相似于三级芯片换了个马甲时,游戏玩家们马上开端极力支持,他们疑心英伟达是在玩推广游戏来掩盖价钱的大幅下跌。 Nvidia 的显卡功能也许是很好的,而且毫无疑问最合适将来的光线追踪与 AI 生成内容,但代价是它无法爲当今的游戏提供最佳的价值。要到达纯模仿虚拟世界的高度,需求熬过一代的工夫,对大少数游戏玩家还不关怀的功用停止免费。在山谷中的人工智能:是零碎,而不是芯片对英伟达在游戏方面的做法持悲观态度的缘由之一,是该企业在创造着色器(shader)时曾经对将来下了相似的赌注。我已经在去年的 GTC 之后解释过着色器:英伟达先是凭仗 Riva 和 TNT 系列视频卡(经过了硬编码,可对相似微软的 Direct3D 等 3D 库停止减速)而声名鹊起:不过,GeForce 系列可以经过一种叫做“着色器”的计算机顺序停止充沛编程。这意味着哪怕是在制造出来之后,GeForce 卡也可以经过开发新的着色器(比如说用来支持新版本的 Direct3D)来加以改良。更重要的是,着色器不一定就得是渲染图形;任何类型的软件——理想状况下任何可以并行运转的复杂计算顺序——都可以编程爲着色器;窍门是弄清楚如何写这种顺序,这就是 CUDA 的用武之地。我在 2020 年的那篇谈英伟达的集成梦想的文章中解释道:这种笼统层次的添加意味着底层图形处置单元可以更复杂,这意味着图形芯片可以拥有更多的 GPU。比如说, 英伟达刚刚发布的 GeForce RTX 30 系列最先进版本的内核数到达了令人难以相信的 10496 个。这种水平的可扩展性对视频卡来说很有意义,由于图形处置完全是并行处置的:一块屏幕可以分红恣意数量的多个局部,每一局部均可同时独立计算。这意味着功能可以程度扩展,也就是说,每添加一个内核都能进步功能。不过,现实证明,可以充沛并行运算的计算类型并不只要图形而已……所以英伟达才从模块化的组件制造商变为了软硬件集成制造商。模块化组件是指它的显卡,而软硬件集成是指它的 CUDA(一致计算设备架构)的平台。 CUDA 平台可以让顺序员经过多种言语拜访英伟达显卡的并行处置才能,但又不需求理解如何对图形停止编程。如今 Nvidia “技术栈”有三个层级:不过,要想理解 CUDA ,重要的一点是要晓得它并不只仅是让内部顺序员可以爲英伟达的芯片编写顺序,CUDA 也爲英伟达自身赋能了。这大局部是出于绝望。 去年春天,黄仁勋在承受我们采访时解释到,在他看来对企业将来至关重要的着色器的引入,简直杀死了这家企业:可编程性的缺陷是效率要差一些。正如我之前所提到的那样,功用固定的东西更高效。任何东西只需是可编程的,任何光看定义可以做不止一件事情的东西,关于完成任何特定义务来说都会带来不用要的担负,所以这里的成绩是“我们该什麼时分做这件事(让本人的东西可编程)?”事先给我们启示的一点是,一切看起来都像 OpenGL 的飞行模仿(OpenGL Flight Simulator)。一切都可以看成是模糊纹理和三线性插值细化纹理,一切东西都没有生命,但我们觉得,假如不赋予媒介生命的话,就没法让艺术家发明出不一样的游戏,不一样的流派,讲述不一样的故事,而最终媒介也将不复存在。与此同时,我们也希望做出一个愈加可编程的调色板,让游戏和艺术家可以用它做一些很棒的事情,我们遭到了这种野心的驱使。还有一个动机也在敦促我们做这件事,那就是有朝一日就算显卡被商品化了我们也不会开张。所以当这些考量到了一定水平,我们就开端做可编程的着色器,所以我以为要这样做的动机是十分明白的。但后来我们遭到的惩罚是我们没想到的。什麼样的惩罚?这个惩罚来得太忽然,一切我们对可编程性的预期,一切我们爲未来所做的,在一切不用要功用方面的开支,这些都是惩罚,由于目前的使用并不能从中播种益处。除非出来新的使用,否则的话,我们的芯片会显得太贵,而如今的市场竞争十分剧烈。英伟达之所以能活上去,是由于他们的间接减速才能依然是很好的。从久远来看,英伟达仍将蓬勃开展,由于他们爲了应用着色器而开发了一整个 CUDA 根底设备。这就是数据中心增长的来源;黄仁勋解释道:从你成爲一家处置器企业的那一天起,你就必需内化这一点:这个处置器架构是全新的。以前从未呈现过像这样的可编程像素着色器,或许这样的可编程 GPU 处置器,以及这样的编程模型,因而我们得内化这个。你必需内化这是一种全新的编程模型,而且与成爲一家顺序处置器企业或一家计算平台企业相关的一切你都得做出来。所以我们必需树立一支编译器团队,我们必需思索做出 SDK,必需思索树立本人的库,也必需与开发者接触,宣传我们的架构,并协助人们完成它的益处,假如不行的话,甚至你得本人开发新的库,让人们可以轻松地将本人的使用移植到我们的库,然后看到它的益处。这个故事之所以要再讲一遍,第一个缘由是要指出着色器复杂性的本钱与目前游戏的光线追踪和人工智能的本钱之间的类似之处;二是要大家留意这一点,英伟达处理成绩的办法不断都是本人把一切的事情都干了。在那时分,它意味着要开收回 CUDA 来对这些着色器停止编程;而在明天,这意味着要爲人工智能开收回整套零碎。黄仁勋在上周的宗旨演讲中谈到:英伟达努力于经过减速计算来推进迷信与工业开展。无需做减速计算即可获得更好功能的时代曾经完毕了。运用没有减速支持的软件,只能破费昂扬成原本补偿其功能与扩展性的缺乏。近 30 年来英伟达一直专注于这一范畴, 作爲减速软件与扩展计算的专家,英伟达提供了百万倍的减速,远超摩尔定律。减速计算是一项全栈应战。需求对成绩范畴有深化理解,并对计算的每一个层次以及 CPU、GPU 与 DPU 这三种芯片停止优化。跨多 GPU 多节点扩展是数据中心规模所面临的应战,要将网络和存储与计算资源一致分配,从 PC 到超级计算中心和公司数据中心,从云端到边缘,开发者和客户希望能在许多中央跑本人的软件。不同的使用希望在不同的地位以不同的方式运转。明天,我们将着眼于全栈来讨论减速计算。我们将引见新的芯片,并论述其如何用无限的晶体管释放更多的功能,我会引见新的库,以及这些库如何减速迷信和工业范畴的关键义务,还有特定范畴公用的新框架,有助于开发功能更高且易于部署的软件。以及新平台,它可以让你平安、安心肠部署软件,并取得数量级的提升。在黄仁勋看来,光是有速度很快的芯片已缺乏以应对将来的打工负载:这就是英伟达要用上本人的一切设备来建立整个数据中心的缘由。不过,再一次地,在一个每家企业都需求减速计算的将来里,英伟达专门爲他们打造的数据中心——英伟达的天国之城(Celestial City)——却与现状构成鲜明比照,由于如今的数据中心外面,英伟达芯片的最大用户是那些本人的零碎曾经就位的大型玩家(hyperscalers)。比如说,像 Meta 这样的企业就不需求英伟达的网络;他们创造了本人的。这些企业的确需求少量可大规模并行化的芯片来训练本人的机器学习算法,这意味着他们必需给英伟达交钱,奉献其高额利润。也就难怪 Meta 和之前的谷歌一样,正在开发本人的芯片。这就是一切大企业都能够要走的一个进程:他们不需求英伟达的零碎,他们需求的是可以满足他们的要求,跑他们的零碎的芯片。这就是为何英伟达会如此卖力地投入到人工智能和减速计算的群众化的缘由:从临时看,规模化的关键在于爲除了最大玩家之外的一切人开发零碎。穿越山谷的窍门在于,在英伟达目前的大客户中止购置英伟达昂贵的芯片之前,就能看到该生态体系的开展。 黄仁勋已经预见到 3D 减速器将会被商品化,于是用着色器来完成跨越;你会觉得到他对芯片也有异样的恐惧,所以如今正在跃进到做起零碎来。在山谷中的元宇宙: Omniverse Nucleus在去年春天的采访中,我曾问黄仁勋英伟达会不会本人做云效劳;假如我们要做效劳的话,除了我们本人做的东西以外(假如必需本人做的话),这个效劳还会运转在世界各地的 GPU 上,跑在每个云下面。我们企业制定的其中一条规则是不糜费企业的资源去做曾经有的东西。假如某个东西曾经存在,比如说 x86 CPU 这样的东西,我们会间接用。或许假如某个东西曾经有了,我们会选择与其协作,由于我们不想把本人稀缺的资源糜费在那下面。所以,假如云端曾经有了某个东西了,我们相对只会用那个东西,或许让那个东西去做就行了,这样会更好。但是,假如做有些东西对我们来说行得通,但对他们没有意义的话,我们会找他们去做;假如其别人不想做,那麼我们能够会决议本人去做。关于要做什麼我们是很有选择性的,但关于其别人曾经做过的,我们态度十分坚决,那就是不做。现实证明,有个东西是没有其别人想做的,那就是爲 3D 对象树立一个通用的数据库,这个数据库的用途是英伟达所谓的 Omniverse。这些对象可以是用于制造业或供给链的超级详细的毫米精度级对象,也可以是爲虚拟世界生成的奇幻对象和修建物;依照黄仁勋的想象,任何在 Omniverse Nucleus 上做开发的人都可以运用这些对象。此处的天国之城是一个跨行业和文娱可用的 3D 体验世界——假如你情愿的话,可称之爲元宇宙的 Omniverse,它们全都衔接上英伟达的云效劳——且其雄心壮志足以让扎克伯格感到脸红!出于异样的缘由,这座山谷似乎愈加漫长,愈加黑暗:你不只需求创立一切这些资产以及 3D 体验,而且需求让整个市场置信其适用性和必要性。爲一个尚不存在的世界建立一个云效劳,就是爲了攀上目前依然看不见的高度。黄仁勋与英伟达的雄心壮志之大是毫无疑问的了,虽然有些人能够会质疑同时穿越三座山谷的智慧如何;除了那场游戏业的完满风暴以外,他们的股票自身仍走不出山谷也许也是合理的。不过,值得思索的是, 英伟达客户(无论是消费者客户还是公司客户)对企业感到懊丧的首要缘由是价钱:英伟达的 GPU 价钱昂贵,而且企业的利润(除了最近几个季度以外)十分高。不过,就英伟达的状况而言,其定价权间接来自英伟达本人的创新,这既表现在既定打工负载的相对功能方面,也表现在其对 CUDA 生态体系的投资、爲全新的打工负载发明出来的工具上。换句话说,由于过来承当了本人如今正在着手的事情的那种风险,英伟达曾经博得了被憎恶的权益。举个例子,假定将来对一切游戏的希冀不只仅是要能光线追踪,而且要对一切粒子停止全方位的模仿:英伟达在硬件上的投资将意味着它会像光栅化时代一样主宰那个时代。异样地,假如 AI 使用被群众化,而且可供一切公司运用,而不只是超大规模的公司能用的话,那麼英伟达的价值定位将是掌握整个长尾。再者,假如我们进入了元宇宙的世界的话,那麼英伟达不只在根底设备方面有抢先劣势,而且在让那个世界成爲理想所必需的根本对象库方面也有抢先劣势(当然了,这些对象将在 AI 生成的空间里应用光线追踪点亮),从而让英伟达成爲该范畴最重要的根底设备。这些赌注未必全都能取得报答;不过,我的确欣赏这个愿景之大胆,假如英伟达未来得以穿过山谷,抵达天国之城,从而取得可观利润的话,我也不会妒忌的。

作者:杏耀注册登录测速平台




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT © 杏耀注册登录测速平台 版权所有