一、公司图谱:硅谷硬核派的“晶圆狂想”

Cerebras Systems成立于2015年,由硅谷半导体行业资深团队创立,致力于突破传统芯片设计的物理极限。其核心理念是“以整片晶圆为画布”,将传统切割成数百个小芯片的12英寸晶圆直接制成单一巨芯——Wafer-Scale Engine(WSE)。这种“晶圆级集成”技术曾被视为半导体领域的“永动机难题”,自1970年代起多家巨头尝试均告失败,但Cerebras通过独创的缺陷绕过技术与台积电先进制程的结合,于2019年实现量产突破。

截至2024年,公司已融资7.2亿美元,估值超40亿美元,客户涵盖葛兰素史克、阿贡国家实验室等顶尖机构,其CS系列AI系统单价超200万美元,累计部署量达数十套。


二、技术哲学:用“暴力参数”重构AI算力规则

Cerebras的技术突破体现在三个维度:

  1. 物理尺度革命:第三代WSE-3基于台积电5nm工艺,面积达46225平方毫米(约A4纸大小),集成4万亿晶体管、90万AI核心和44GB片上SRAM,存储带宽21PB/秒,单芯片即可训练24万亿参数模型,性能比英伟达H100快20倍。
  2. 架构创新:通过存算一体设计,数据在芯片内部以“零距离”流动,彻底规避传统GPU的“存储墙”瓶颈。其片上内存带宽是英伟达H100的7000倍,使得Llama3.1 70B模型的推理速度达到450 token/s,成本仅传统方案的1%。
  3. 系统级优化:CS-3系统采用液冷散热与三维封装技术,将WSE-3的125 petaFLOPs算力封装进标准机架,功耗效率比GPU集群提升5倍。

三、发展速度:三年三级跳的“摩尔定律粉碎机”

  • 2019年:第一代WSE横空出世,16nm工艺集成1.2万亿晶体管,开启“晶圆级芯片”商用时代;
  • 2022年:WSE-2升级至7nm,晶体管翻倍至2.6万亿,斩获新冠研究大奖;
  • 2024年:5nm工艺的WSE-3实现4万亿晶体管,训练效率较初代提升100倍,直接对标英伟达Blackwell GPU。

这种迭代速度远超传统半导体行业规律——其晶体管密度每代提升约2倍,而英伟达同期的H100到Blackwell仅提升1.6倍。


四、产业冲击波:重构AI芯片生态链

  1. 技术路径颠覆

    • 设计范式:传统GPU依赖“小芯片拼接”,而Cerebras证明“大即是美”的可行性,刺激AMD、英特尔探索类似架构。
    • 商业模式:按系统销售(而非单芯片)的模式,推动超算从“奢侈品”转向专用化服务,例如CS-3系统已被用于开发比GPT-4大10倍的生成式模型。
  2. 市场格局裂变

    • 在医药领域,Cerebras系统可将药物发现周期从5年缩短至18个月,威胁英伟达在生物计算的传统优势。
    • 其每token推理成本低于0.1美元,迫使云厂商重新评估GPU租赁定价策略。
  3. 供应链重塑

    • 台积电5nm产能向Cerebras倾斜,挤压英伟达、AMD的先进制程配额。
    • 液冷、高密度供电等配套产业因Cerebras的需求加速创新,推动数据中心能效革命。

五、挑战与隐忧:巨芯时代的“达摩克利斯之剑”

  1. 生态壁垒:CUDA生态仍占据90%开发者市场,Cerebras需通过开源工具链(如联合LangChain)构建新生态。
  2. 地缘风险:2024年其IPO因国家安全审查受阻,凸显AI芯片企业的政治敏感性。
  3. 成本悖论:尽管单芯片性能强悍,但200万美元级系统定价将中小客户拒之门外,需依赖政府实验室和跨国药企等“超级买家”。

结语:算力平权运动的“特洛伊木马”

Cerebras的价值不仅在于技术参数,更在于其证明了“非主流路径”的可行性——当英伟达在CUDA城堡中加高城墙时,有人选择直接重建一座新城。正如WSE-3的90万核心构成的“硅基蜂群”,Cerebras正在用集体智慧冲击AI算力的垄断格局。这场革命的终局或许不是取代GPU,而是让世界意识到:算力的未来,本应拥有更多形状。