NFT:ChatGPT背后的算力博弈 中国企业亟待打破美国桎梏_Sentinel Chain

华西证券预测,全球AI软件市场规模将在2025年达到1260亿美元,2021年到2025年复合增长率为41.02%。

ChatGPT繁荣的背后,是堪称天文数字的算力支持。

据测算,AI训练服务器方面,单个大语言模型训练驱动AI训练服务器需求约2亿美元;AI推理服务器方面,如ChatGPT在初期便可带动推理服务器需求约45亿美元。

一时间,ChatGPT们层出不穷,而它们背后的AI服务器赛道也开始随之水涨船高。

算力作为大模型的核心引擎,它的计算公式很简单:有多少枚GPU芯片就能产生多大的算力,高端GPU芯片的数量,能直接影响算力的大小。

ChatGPT所需要的算力并不是固定的,反而是逐次递增。ChatGPT越聪明,背后的代价是所需算力越来越多。

据媒体推测,GPT-3训练成本预计在500万美元/次,GPT-3模型需花费训练成本约140万美元,Google的PaLM模型需花费训练成本约1120万美元。

ChatGPT更新内容包括更多可控制的API模型、功能调用能力:金色财经报道,OpenAI公布(对ChatGPT的)更新内容,包括更多可控制的API模型、功能调用能力、更长的上下文和更低的价格。此外,嵌入模型成本降低了75%。[2023/6/14 21:34:40]

据微软高管透露,为ChatGPT提供算力支持的AI超级计算机,是微软在2019年投资10亿美元建造的一台大型顶尖超级计算机,配备了数万个英伟达A100 GPU,还配备了60多个数据中心总共部署了几十万个英伟达GPU辅助。

为了满足与日俱增的ChatGPT算力需求,微软宣布将推出基于英伟达最新旗舰芯片H100 GPU和英伟达Quantum-2 InfiniBand网络互连技术,推出Azure可大规模扩展的AI虚拟机系列,以显著加速AI模型的开发。

看上去,ChatGPT的背后就是满篇的英伟达、英伟达和英伟达。

Titanium Blockchain CEO对2100万美元的加密欺诈指控认罪:金色财经报道,根据美国司法部(DOJ)发布的新闻稿,Titanium Blockchain Infrastructure Services(TBIS)的首席执行官Michael Stollery承认通过欺诈性的首次代币发行(ICO)从美国和海外投资者那里筹集了2100万美元。Stollery和他的公司最初于2018年5月被指控犯有证券欺诈罪。根据法庭文件,Stollery没有按照要求在SEC注册ICO,承认在其网站上伪造代币白皮书以及盈利前景,并在TBIS的网站上植入了虚假的客户推荐,并谎称他与美联储和数十家知名公司有业务关系。Stollery还承认,他没有将客户的钱用于投资,而是将至少一部分资金用于个人信用卡还款和夏威夷度假屋的账单。Stollery因证券欺诈罪名面临最高20年监禁,定于11月18日宣判。[2022/7/26 2:37:18]

实际上,英伟达作为硬件霸主,不仅在消费级市场占据大部分市场,也是AI服务器芯片领域的头号选择。

YouTube视频\"Charlie Bit My Finger \"的NFT形式以76万美元售出:YouTube家庭视频 \"Charlie Bit My Finger \"的NFT在周日以760,999美元的价格卖出。据悉,自该视频上传到YouTube后,以幼儿哈利和他的小弟弟查理为主角的家庭视频的浏览量超过了8.83亿次。据CNN报道,该家族表示,他们将在周日的拍卖会后从平台上删除该视频。(Cyrptoslate)[2021/5/25 22:41:39]

物以稀为贵,目前英伟达的旗舰芯片H100,在一周时间涨价近7万元人民币,售价普遍高达30万元左右;次旗舰A100芯片在短短三个月多时间里,从6万元一路涨至9万元,涨幅超过50%。

不仅涨价买不到,甚至美国还禁止英伟达卖芯片。在去年8月,美国政府发布出口管制政策,禁止英伟达将A100、H100两款芯片售往中国。

DeFi聚合器Frontier宣布Frontier Chain已正式进入开发、启动规划和经济建模阶段:DeFi聚合器Frontier在推特上宣布,Frontier Chain已经正式进入开发、启动规划和经济建模阶段。3月31日官方将公布质押、治理计划等更多信息。[2021/3/14 18:43:57]

为了不丢掉中国市场,又符合美国出口管制,英伟达随后推出性能阉割版A800、H800芯片。但这两款芯片同样被供不应求的市场一抢而空,价格也随之水涨船高。

以百度阿里腾讯为首,国内大部分互联网公司都已经宣布进军大模型。市场统计,从ChatGPT之后,中国年内即将推出的大模型数量已超10个。

如果想要达到ChatGPT的水准,至少需要3000枚A100芯片,以9万/枚的价格来算就是2.7亿人民币才能完成一个大模型部署;10个大模型就需要3万枚A100芯片,27亿人民币。

MangoChain主网将于6月18日上链:据官方消息,6月16日MangoChain(MGP)技术总监(CTO)Mithil Thakore在印度社交媒体公布了应用级公链MangoChain,即将在新加坡时间2020年6月18日主网上链运行的计划。

6月18日18:18mangochain和mangowallet的1.0版本上线试运行;

6月19日16:00持有ERC20的mgp地址开放映射绑定;

6月23-25日 (48小时)BKEX交易所钱包同步映射;

6月25日 16:00 MangoWallet迁移生态。

详情请见官方公告。[2020/6/16]

加上后期训练成本,所需要的芯片更是天文数字。但按照目前英伟达的交货时间来看,想要买到足够的芯片,可不是一件容易的事情。

恍惚间,矿卡时代又再次来临。

在前些年虚拟货币火热的时候,作为挖矿必备的显卡提供商,英伟达几年时间大赚特赚了48亿美元。如今又靠着ChatGPT活出第二世,让历史再次重演。

面对市场需求激增,借AI浪潮翻身的英伟达很鸡贼的推出算力租赁服务。

3月21日,2023年GTC大会上,英伟达创始人兼首席执行官黄仁勋推出NVIDIA DGX Cloud,可以为企业提供训练生成式AI高级模型所需的基础设施和软件。DGX Cloud每个实例配有8个H100或A100 80GB GPU,企业可以云租赁的形式按月租用DGX Cloud集群,价格为每实例3.7万美元/月起。

英伟达真的没有替代品吗?为什么企业宁愿选择租赁,也不选择其他GPU芯片商?

IDC数据显示,国内GPU服务器在2021年占国内服务器市场规模的比例超过88.4%,使用英伟达的产品占比超80%。

AI大模型所需要的芯片在处理信息的精细度和算力速度要求更高,在超算领域,双精度浮点计算能力FP64是进行高算力计算的硬性指标。而英伟达的H100、A100是目前唯一具备这些能力的芯片。

美国卡脖子的并不只有英伟达芯片的售卖,从技术、设备、材料都限制中国企业的研发。但在美国的重重限制下,中国企业仍然顶着压力跑出几匹黑马。

根据IDC最新发布的《中国加速计算市场(2021年下半年)跟踪报告》,2021年全年中国AI服务器市场规模达350.3亿元,同比增长68.6%。

在企业级GPU芯片领域,中国厂商壁仞科技在2022年推出BR100芯片、天数智芯推出了智铠100芯片、寒武纪推出了思元270芯片。

其中壁仞科技称,BR100拥有全球最高算力,峰值算力达到了市场在售旗舰产品的三倍以上,16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。

虽然数据良好,但缺少至关重要的处理FP64的能力,依然无法完全取代英伟达H100、A100俩兄弟。

并且,英伟达使用的CUDA平台早已成为应用最为广泛的AI开发生态系统,只支持英伟达的Tesla架构GPU,在现阶段根本无法用国产芯片取代。

虽然中国芯片厂商正在对GPU芯片领域奋起直追,但技术差距和美国卡脖子仍是关键性问题,还需要一段时间的努力。

借着大模型东风一路上扬的不止AI服务器和GPU芯片,还有储存器市场。

ChatGPT的运行条件包括训练数据、模型算法和高算力,其中高算力的底层基础设施是完成对海量数据、训练的基础。

最显而易见的特点就是ChatGPT经历数次迭代之后,参数量从1.17亿增加到1750亿,近乎两千倍的增长,也给计算存储带来极大的挑战。

AI新时代开启,预计全球数据生成、储存、处理量将呈等比级数增长,存储器将显著受益。而计算存储是ChatGPT的重要基石,随着阿里、百度等科技巨头类ChatGPT项目入局,整体计算存储市场需求将进一步快速提升。

随着AIGC持续火热,北京、上海、广州等数字经济发达地区也出台了政策推进智算中心建设。比如,北京市提出新建一批计算型数据中心和人工智能算力中心,到2023年,培育成为人工智能算力枢纽;上海市提出布局建设一批具有高性能、高吞吐的人工智能算力中心,推动公共算力服务平台建设等。

而各行各业都将面临着ChatGPT的洗礼,在迎新一轮人工智能的浪潮下,和AI相关的行业将会迎来广阔的市场空间。

而中国企业也势必会冲破美国掣肘,打破不公平的桎梏。

锌媒体

个人专栏

阅读更多

金色荐读

金色财经 善欧巴

Chainlink预言机

白话区块链

金色早8点

Odaily星球日报

欧科云链

深潮TechFlow

MarsBit

Arcane Labs

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

大币网

[0:15ms0-8:43ms