最好看的新闻,最实用的信息
07月06日 0.9°C-0.9°C
澳元 : 人民币=4.7
中央海岸
今日澳洲app下载
登录 注册

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图)

7小时前 来源: 华尔街见闻 原文链接 评论0条

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 1

被称为“HBM之父”的韩国科学技术院(KAIST)金正浩教授抛出一个颠覆认知的判断:AI的本质是内存,而不是GPU。

近日,韩国科学技术院(KAIST)电气工程系教授金正浩接受视频专访,围绕HBM技术演进、AI算力格局和未来半导体架构作出系统性阐述。

金正浩被业界称为“HBM之父”,早在2010年代初期便与SK海力士合作参与HBM1开发,此后主导了一系列底层架构研究。此次访谈内容在科技与投资圈广泛流传,核心观点直指当前AI算力竞赛的结构性矛盾。

金正浩在访谈中直接给出了一个令人震动的数字:

“GPU装100万台,真正工作的时间只有10%。”

他解释,每当ChatGPT输出一个词,系统就需要从HBM中读取数据、完成计算、再写回内存,“读和写几乎占掉了全部时间,GPU就在旁边干等着。”即便通过算法优化,GPU利用率也很难突破30%。

这正是他多年坚持的核心论断的现实依据:“AI等于内存(AI = Memory)。”

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 2

为什么GPU遇到了“外通死局”

金正浩对英伟达(NVIDIA)现状的判断措辞犀利。他说,黄仁勋近期频繁访问韩国、参加综艺、吃炸鸡喝啤酒、会见各路人士,“这么多会面背后,说明他不安心”。

“GPU的技术性成长已经快停了,这是我的判断。人工智能计算机的进化,掌握在内存手里。”

他的逻辑链条清晰:GPU想提升性能,只能扩大芯片面积、堆更多计算单元;但GPU太热,必须在背面安装散热装置,因此无法像内存一样垂直堆叠。“GPU陷入了外通死局。”

相比之下,从训练时代转向推理时代,内存的重要性正在被重新定价。金正浩说:“推理时代,更重要的是往AI里塞进多少数据,而决定这一点的半导体是内存。”

他进一步指出,AI能力的竞争最终是内存能力的竞争:“谷歌Gemini、OpenAI、Anthropic Claude,谁更强,是由内存决定的——这是我的主张。”

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 3

HBM的两大核心:容量与带宽

金正浩将HBM的价值归结为两个维度。

第一是容量。随着上下文工程、多模态输入和Agentic AI的到来,内存需求以每年翻倍的速度增长,“10年就是1000倍”。传统方式靠缩小晶体管来增容,但如今已逼近量子力学边界,几乎无法继续缩小,因此必须“向上堆叠”。

第二是带宽。金正浩打了个比方:“传统内存如果是8车道高速公路,HBM是1024车道,现在是2048车道,几年后可能达到100万车道。” 靠并行通道同时传输海量数据,才能匹配AI计算的速度需求。

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 4

HBF:NAND闪存的堆叠时代

HBM解决了速度问题,但容量依然有天花板。金正浩在访谈中详细阐述了他认为的下一条技术路线——HBF(High Bandwidth Flash)。

简单说,HBF就是把NAND闪存像HBM一样垂直堆叠。DRAM速度快但容量有限,NAND闪存容量大、可长期保存数据,速度虽然慢一些,但在推理场景中足够满足“冷数据”的存储需求。

金正浩认为,未来HBM和HBF将形成共存格局,类似于城市规划:“就像有百货商场,周围有复式公寓、普通住宅,各种形态的HBM、HBF组合在一起,形成复合体,向GPU供给数据。”

他作出了一个明确的长期预判:“现在是HBM的时代,但10年后,NAND闪存和HBF的市场需求将超过HBM。三星和SK海力士必须为HBF时代做好准备。”

他指出,目前正在开发HBF的公司包括SK海力士、闪迪、三星电子,以及日本的铠侠(Kioxia)。铠侠市值最近超过了丰田汽车,成为日本股市第一,闪迪股价持续上涨,而三星和SK海力士则在韩国市场维持市值领先地位。

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 5

HBS:更超前的第三条路

金正浩还提出了一个目前仍属于前沿概念的设想——HBS(High Bandwidth SRAM)。

SRAM(静态随机存储器)比DRAM快约1000倍,但密度低、成本高,传统上只能作为芯片内的小容量缓存。金正浩的思路是:把整张12英寸晶圆全部做成SRAM,再垂直堆叠12至16层,就能将容量从100GB扩展到1600GB。

“这样速度快1000倍,容量又足够,那就说得通了。”

他描述的终极AI芯片形态是一栋“100层3D大楼”:“HBM、HBF、HBS各自构成多层建筑,GPU放在顶层负责散热冷却,这就是未来AI计算机不可避免的3D半导体结构——这是我现在的判断。”

他同时坦言,这条路最大的工程挑战不是计算,而是供电与散热:“要给GPU和堆叠内存供几千安培的电,电力供应网络的设计将是最难的技术,这也将成为企业间真正的核心竞争力。”

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 6

定制HBM:甲乙关系正在逆转

金正浩专门谈到了HBM4带来的供需结构变化。

过去,内存是标准化产品,厂商先生产、客户再选购,买家主导价格,库存风险由内存厂商承担,这就是“内存周期”的本质。

但从HBM4开始,由于需要根据英伟达、谷歌、AMD等客户的加速器架构量身设计(即“定制HBM”),内存厂商必须在研发之初就拿到客户的数量承诺,才会启动开发——也就是所谓的“长期协议”。

“AI企业太需要高性能HBM了,所以他们排队来。供应方开始决定价格,这是范式的转变。”

他还预期,未来HBM芯片内将集成通信功能,实现“HBM之间相互通话”,形成类似联盟的结构:“我们自己沟通,谁对我们更好,就给谁更多内存;不听话的GPU,就不分配。”

这进一步抬升了内存厂商的系统性地位。

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 7

三星、海力士是唯一能同时做两件事的公司

金正浩在访谈中反复强调,全球范围内能同时量产DRAM(HBM)和NAND闪存(HBF)的公司,目前只有三星电子和SK海力士。

“闪迪和铠侠虽然股价冲天,但只能做HBF,做不了HBM。三星和SK海力士拥有引领未来最强大的工具。”

当被问及三星与SK海力士今年合计营业利润500万亿至600万亿韩元的预测是否现实,金正浩回答:“现实的。” 他补充说,他经常与两家公司的高管进行技术交流,“他们的眼神越来越亮了。”

不过他也指出竞争压力真实存在,美光、闪迪获得来自英伟达和谷歌的订单分流。

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 8

AI PC与AI手机:内存决定设备价格

金正浩还将内存需求的叙事延伸至终端设备。

他预测,未来AI PC要真正实现个人AI计算,所需内存规模将使“一台PC的价格达到1000万韩元,内存价格决定PC价格”。而AI智能手机售价300万至500万韩元中,200万至300万韩元将是内存的价格。

“AI基础设施、AI模型的持续进化,需要越来越多的内存。AI PC and AI手机,是这个趋势的另一条主线。”

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 9

Agentic AI与物理AI:内存需求还将暴增1000倍

金正浩对AI演进方向的判断同样值得关注。他认为,随着Agentic AI(智能体AI)和Physical AI(具身AI/物理AI)的到来,内存使用量将比现在高出约1000倍。

“AI代理24小时工作,不像人类还要睡觉,工作量暴增,内存需求自然跟着爆炸。那时候不是HBM,而是需要'超级HBM'的时代了。”

HBM之父金正浩:AI的本质是内存,GPU真正工作的时间只有10%(图) - 10

研究之路:50年积累,“运气”说

金正浩在访谈中追溯了自己的学术路径。

他1993年获得博士学位,研究方向是飞秒级超快电信号测量,导师数年前获得诺贝尔物理学奖。1994年他加入三星电子内存事业部,1996年回到KAIST,此后持续深耕内存与HBM基础研究约10年,才形成商业产品。

2015年,他在一次校内会议上第一次听到“深度学习”这个词,随即意识到AI算法与HBM架构背后用的是同一套数学——线性代数和矩阵运算。“我在大学二年级特别喜欢矩阵,两边恰好用的是一样的数学——这就是运气。”

他笑言,当初做HBM时想的是用在电视机上让画面更生动,完全没想到会成为AI时代的基础设施:“那时候不知道,这也可以说是运气。

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

电话: (02) 8999 8797

联系邮箱: [email protected] 商业合作: [email protected]网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:[email protected]

友情链接: 华人找房 到家 今日支付Umall今日优选