米兰体彩app 独家丨直指2000 Tokens/s, 北大系「流式推理芯片」公司完成数千万元融资



“不作念GPU,只作念速率。”
作家丨姚单
裁剪丨余快
365建站客服QQ:800083652雷峰网独家获悉,国内一家专注超快流式推理芯片的创业公司——「寒序科技」晓谕完成数千万元融资,投资方为启高成本、赛意产业基金,源合成本担任本轮独家财务照应人。
{jz:field.toptypename/}此前,寒序科技一直较为低调,其AI推理系列(SpinPU-ESeries)产物的关系默契在当年两年间并未对外系统线路。
知情东谈主士显露,寒序科技首颗芯片样片回片测试效果“极度理思”,环节预备中,其「单元面积带宽」与GroqLPU(LanguageProcessUnit,言语惩办单元)线路一致,达到惊东谈主的100GB/s/mm^(2),这是揣测AI芯片推感性能的最贫窭预备,亦然直指2000Tokens/s的底气。
在业内看来,这类智力决定了大模子(LLMs)推理时能否真实把“流式输出”、“高Tokens/s”作念出来。环节的是,这家公司下一代芯片仍是在流片中,米兰体彩以“片上MRAM+SRAM”和“详情味流式乘加单元”,主义性能指向夸张的2000Tokens/s+,反不雅当今主流对话模子推理速率仅约30-50Tokens/s。
在现时推理芯片竞争中,这简直是最具辨识度的硬预备之一。也因此,接近步地的东谈主士将其评价为:国内少有的、真实沿着Groq场地往下打的团队。
值得珍爱的是,业内近期无数传说,NVIDIA已以约200亿好意思元估值级别锁定Groq的推理技艺结合,并筹谋在NVIDIAGTC2026行将发布的新一代AI推理系统中采用Groq芯片设想。寒序决策被业界以为是最面对该决策的超大带宽流式惩办芯片。
与GPU道路不同,这家公司遴荐的是更聚焦、更极致的产物界说:不卷大而全,不卷通用训诫,而把资源压到推理速率上,核神志念四个字——唯「快」不破。
寒序科技竖立于2023年8月,源于国内磁学征询贫窭高地「北京大学磁学中心」。中枢团队是国内首个有智力跑通从物理、材料、器件到异质集成、芯片设想、算法的交叉团队。
有接近本轮融资的东谈主士告诉雷峰网,这家公司之是以近期驱动对外开释信息,一个贫窭布景是:其环节技艺与样片考证仍是走过最危急阶段。当今,该公司新一轮融资也已在激动中。

备案号: