雨天周末, 不思念书不思学习, 就思扯淡.
先吐个槽, 最近看到某DPU厂商80亿估值然后因为多样原因玩不下去了的公众号著作, 然后还有一个会还在究诘DPU如何如何的....我还记起三四年前和某个机构一都基本上把这些厂家都调研过, 其时就连续的diss这群东说念主没思明白, 但似乎几年昔日仍是没思明白.
不外最不异乎思明白了极少为啥叫DPU了, 从Pradeep在互联网泡沫时期创建的Juniper, 到背面下野创建Fungible, 其实DPU的真谛是从蕴蓄需要处理数据的视角界说的, 关联词到其后逐渐演进的经由中, 老黄把DPU的成见踵事增华后, 发现这词仍是有问题, 这不又SmartNIC和DPU都无法界说, 又启动造出了一个SuperNIC了么?
倒是Tesla东说念主间清醒的一个DumbNIC讲的很理会, 通衢至简趁机还把HBM-Disaggragation搞了...
回到正题, 在算力通缩情况下, 老黄如何保管或者进一步冲高到五万亿市值是一个很道理的话题,是以今天从经济学的角度扯个淡...渣B也没隆重的读过经济学的书, 另一方面关于建模的量化数据因为合规原因, 没稀有据也没专门愿去了解数据, 因此也不作念过多的分析了, 仅仅单纯的扯个淡云尔.
1. 什么是算力通缩上周一篇《把GPU当成一个金融家具如何加杠杆?》谈到了算力通缩(computility deflation,以下简称CD), 领先咱们来给CD一个界说:
算力通缩(computility deflation,CD):在经济学中, 通货紧缩是指商品和作事总体价钱水平的下跌. 从算力的角度来看, 咱们也不错界说平均1GFLOPS的价钱算作GPU和算力作事的总体价钱水平.
就算力作事价钱(以租用H100等GPU)的价钱来看, 总体价钱是不才降的. 举例H100的房钱价钱从4好意思元一小时如今降到2好意思元一小时一下. 而从GPU本人的商品价钱来看, 国内一些H100的整机价钱也从早期的300多万降到了220万.
2. 经济学的悖论一般来说, 咱们浅薄的以经济学中的IS-LM模子来看, 也就是说供给增多或者需求下跌或者两者同期发生引起的. 浅薄来说就是供给过量(过量坐褥),需求低迷(消费减少), 或者是信贷紧缩等带来的货币供应减少而产生的.
天然有另一种不雅点是, 通缩和经济中的时期跳跃关系, 跟着全成分坐褥率的提升, 商品本钱会下跌. 也就是老黄期待的需要一年一代新卡来抑止算力架构.
有一个悖论的场地是H100售价3万好意思金,而物料本钱好像唯一3000好意思金, HBM本钱占了2000. 在算力通缩布景下, 如何能够握续性的保管高Margin, 同期还能通过连续的迭代增多营收来冲高市值?
归根结底仍是要答复一个问题: 钱从哪儿来, 钱盼愿的收益率弧线是什么?
从货币供应的角度来看, 针对AI的投资并莫得减缓, OAI这一轮的融资还算平日, 然后H100/H200的需求还在握续, 国内各地的“智算中心”面目也还在握续的成立中. 然后各人来看Blackwell也供不应求.
关联词反过来看有一个很道理的不雅点, 到底是谁在为这些投资买单? 钱从哪儿来的?投资酬劳率如何预计? 杠杆率是些许?很是是从算力提供方来看, 算力自身由于时期迭代产生贬值十分快(算力作事价钱和算力商品价钱都在加速下滑), 既然算力通缩布景下, 为什么不延长消费, 再等等新卡? 另一方面关于基础法子参预的杠杆加在什么场地? 使得智算中心成立的ROI如何盘算推算?
最近还有一种不雅点是在互联网泡沫时期的基础法子为其后互联网茂密发展奠定了基础,很是是巨额的海底光纤的本钱在后期是完成收归来了的. 关联词关于智算中心的本钱, 巧合要在几年后收回从投资酬劳率的角度是很难, 对此我一直握比拟负面的派头, 唯一少数几家界限大有可能收回一部分, 关于它们来看, 算力投资的风险并不是太大.
azure, 微软通过OAI投资和更表层的copilot业务收入不错填补, 同期也在布局我方的推理芯片Meta,巨额的H100通过Llama的生态以及里面的保举系统不错摊薄本钱, 同期也有我方的推理芯片AWS Trainium/Google Trillium(TPU)的供应量具体数值不理会, 关联词至少Google自家的搜索等业务仍是有巨额的算力耗尽的.Tesla的自动驾驶, 字节等企业的搜广推以及视频生成等业务上, 巨额的H100的耗尽推行上也不会带来很大的亏空.至于各地成立的多样智算中心, 是不是过两年要启动不良钞票处置了呢? 不良的界说和订价还分两种情况
1. 不良算力(空格) 钞票处置
2. 算力(空格)不良钞票处置
即不良算力本人的评估: 先还不要说那些多样以DSA卡成立的算力集群了...浅薄的以NV H系列卡为例, 初期许多东说念主以为买点机器归来插上电给个经管口IP地址就不错卖了, 然后发现蕴蓄成立也需要跟上, 还有就是牢固性和故障运维, 紧接着发现如若要寻推一体, 又要搭一个存储集群, 然后还有互联网带宽...
另一个问题是: 算力通缩和不良算力以及算力不良本人是否有很大的关系, 需要考据一下?
3.算力的杠杆杠杆的产生经常是在时期维度上带来的, 举例在期货阛阓上通过保证金来对远期交割物收尾一个契约, 另一方面就是关于大型基础法子成立通过融资租出的样子. 本体上仍是要在近期创造出一个巨大的需求, 然后通过远期相对细方针现款流来完成.
而本体上科罚通缩的步调好像就是: 增多货币供给, 以及扩大总需求.
3.1 Scaling-Law: 需求的创设
最浅薄彰着的需求创设就是老黄经济学中的“The More You Buy, The More You Save”.
从pre-train scaling-law构造了一个庞大叙事: 从千卡的A100到万卡的H100再到10万卡的历练, 但很闪现的是OAI在GPT-5的历练上遭遇了蛮大的虚浮. 但在总共杠杆赌局里, 莫得一方会那么容易的平仓认输, 致使于Inference Scaling-law的出现.
另一方面这样的杠杆也在合并着阛阓里的玩家, 花一个亿预历练的模子成了贬值最快的商品, 更大的模子有几家跟? 国内所谓6小虎的情况以及前几天刚爆出ST的裁人..
3.2 供应端的流动性紧缩
关于供给过量的问题, 领先来谈一谈存量阛阓. 其实H100的存量阛阓会清洗出一无数玩家, 关于H100的估值可能还存在争议, 那么咱们以现阶段对一些A100/A800算力中心的不良钞票估值该如何作念? 这些需要探求算力的时期价值和资金的时期价值. 咱们单独放一章来谈.
那么咱们来谈另一个话题, 为什么新卡的供应上, 微软等几个巨头要疯抢GB200? 一方面是后一节讲的算力的时期价值, 新卡出来的前几个月的需求曲直常焕发的, 同期带来的流动性溢价会产生更好的短期现款流. 这对算力商品提供方(NV)和算力作事提供方(Azure等)都是故意的, 关联词前提是要构造出鼓胀的需求来支付这样的短期现款流,那么也就只可进一步的找一个算力耗尽方, 然后通过更远的现款流预期在科罚期限错配的问题.
4.算力的时期价值既然上了杠杆, 那么资金的本钱和对应的算力通缩下算力的时期价值就是一个咱们值得探讨的问题.本体上许多机构对大界限投资的短期酬劳逐渐产生质疑和丧失耐性了, 毕竟ChatGPT也出来快满两年了, 关联词巨额的投资似乎还暂时看不到酬劳.
另一方面跟着时期的荏苒, 当年抢购的H100逐渐出现商品价钱和作事价钱的快速下滑, 这也让一些算力投资方逐渐感受到了风险, 接下来跟着Blackwell的出现, H100的贬值速率还会进一步加速, 总共H系列的本钱摊销周期似乎和两年前估量的周期也在镌汰.
也就是说推行上算力价钱的TimeDecay速率远特出了当初投资的现款流模子, 这种期限错配产生的不良钞票处置, 是一个十分道理的话题, 关联词就点到放弃吧.
5. 谈谈货币投放受限下的算力通缩其实写了这样多并不是说在反对Scaling-Law或者说是看空AIGC, 其实任何新时期的出现都是丑陋且反直观的, 关联词算力的问题除了基础法子迭代外,更多的仍是需要算法去科罚. 渣B以前的量化算法复杂度从刚启动连系的时候亦然因为盘算推算复杂度基本上一次全量盘算推算需要30天傍边, 因此从阿谁时候启动就在折腾一些并行盘算推算的框架, 关联词其后仍是算法上的优化科罚的问题.
而关于这一次AIGC来看, 从根柢上我握有一个怀疑派头是新的数学用具并莫得诈欺于模子之上, 这个平直决定了现时生成式大模子的天花板, 天然现时的天花板鼓胀高鼓胀容纳许多思象空间. 但老是认为那边不合, 举个例子吧, 举例为了蕴蓄界限和深度摄取LayerNorm等带来的观望内存压力,是否有更好的算法来科罚?
另一方面是基础法子上, 是否有不需要NVLink, 不需要CoWoS, 不需要HBM的基础法子, 哪怕是历练不成, 先撸一下对算力需求相对较低一些的推理场景? 举例苏妈出一个多带极少PCIe接口的多带一些GDDR的家用级显卡, 况且放开GDR, 让一些买不起H100又要作念大模子连系的中小界限团队先用起来,放低一下姿态果真是生态不成, 不谈rocm, 光拿来给NV作念内存池的二奶都行? 在NV带来的流动性紧缺上绕开CoWoS和HBM, 从而掀开一个遏抑口, 即即是数据中心卖的不好, 撸掉NV家用卡RTX的阛阓亦然功德?
好像就瞎扯这样多吧, 其实蛮但愿若干年后, 咱们能对这一场杠杆局作念一些总结和追想, 很是是监管层的视角.历史天然不会浅薄的疏导, 关联词每次都会押韵.
本文来源:zartbot,原文标题:《算力通缩下的“老黄经济学”》。
风险领导及免责条件 阛阓有风险,投资需严慎。本文不组成个东说念主投资冷落,也未探求到个别用户很是的投资方针、财务情景或需要。用户应试虑本文中的任何意见、不雅点或论断是否稳当其特定情景。据此投资,包袱兴盛。