2024年初,硅谷发生了一件震撼业界的事儿。
一家名叫Groq的初创公司,突然公布了一个大模型测试网址。
当你输入一段提示词,按下回车,屏幕上的字不是像ChatGPT那样一个词一个词地往外蹦,而是像瀑布一样唰地一下,就把屏幕给铺满了。
经过测试,Groq的输出速度,达到了每秒500个Token!
这是啥概念?哪怕OpenAI采购了英伟达最强的NVL72超级算力集群,输出速度不过每秒50个Token左右啊!
英伟达团队努力了一年多,始终无法达到Groq的恐怖推理速度,最后无奈做了个决定:
打不过,就加入吧。
2025年年底,英伟达花了200亿美元,收购了Groq的技术,几个月后,英伟达正式推出Groq 3 LPU,推理速度比H100芯片快6倍。
而此时,中国连能完全匹敌H100的芯片,都还没造出来,哪怕最好的昇腾950也不行。
那怎么办?中国只能在AI竞赛中被美国越落越远了吗?
并不会。
2026年5月7日,一家名叫寒序科技的中国芯片创业公司,宣布了一个重要消息:他们成功流片了亚洲首个8纳米eMRAM AI芯片。
中国的Groq,终于诞生了。
那么,这个eMRAM AI芯片到底是啥?它的诞生,又会怎样改变中美竞争格局呢?
一
要了解这个问题,我们需要简单科普一个概念:内存墙。
1、本文只代表作者个人观点,不代表星火智库立场,仅供大家学习参考; 2、如若转载,请注明出处:https://www.xinghuozhiku.com/546853.html
付费会员