中国北京(2026年6月17日)—专注3D架构AI云端大算力芯片研发设计的算苗科技今日宣布,旗下面向大模型推理的3D TokenPU芯片A4E已于6月15日正式流片,标志着中国在高端AI算力芯片领域,实现依托国产供应链、采用3D混合堆叠架构的大模型专用处理器落地,有望为国内大模型产业提供自主可控、高性能、高性价比的算力支撑。
大模型时代原生设计专注推理能效比
当前,AI产业正加速由训练向推理迁移。德勤预测,未来超80%的算力需求将集中在推理侧。然而,大模型推理长期受制于“内存墙、算力墙、通信墙”三大核心瓶颈,尤其是数据在存储器与处理器之间的频繁搬运,造成高达80%的能耗和70%的成本压力。
作为大模型时代原生的算力芯片企业,算苗科技首创3D TokenPU架构,跳出通用GPU的设计思路,专攻推理场景极致性能。第一代产品A4E将8层存储晶圆垂直堆叠在计算逻辑晶圆上,通过硅通孔(TSV)与凸点(bump)技术实现微米级互联,将传统芯片间的“毫米级”传输距离压缩两个数量级,带来16TB/s的超大访存带宽,有效缓解数据饥饿问题。
在架构设计方面,算苗科技引入Tile-Native软硬件协同理念,将Tile作为数据搬运、存储和计算的基本单元,实现“一次搬运、多次复用”的高效模式。硬件原生支持Tile级数据调度与多精度动态切换,软件端则构建适配LLVM、Triton等开源生态的编译工具栈,兼顾开发者友好性与算子优化效率。这种“硬件架构-软件工具-算法特性”的闭环优化,为大模型推理提供了更高性能和更低TCO(总拥有成本)。
“我们不是在别人的赛道上追赶,而是在开辟新的方向。”算苗科技创始人兼CEO汪福全博士表示,“3D TokenPU专为大模型Token处理而生,不必单纯依赖制程缩小,就能实现算力密度、能效比的跨越式提升。”
从设计到制造自主可控面向量产
算苗科技已构建起覆盖芯片设计、核心IP、制造、封装的国产化供应链体系。A4E芯片基于自研RISC-V架构与自研IP、自研软件体系打造,与国内头部供应链伙伴深度合作,采用成熟国产工艺也可实现卓越推理性能。在工程化量产层面,算苗团队核心成员已在高通量存算一体芯片项目中,完成万片级3D混合堆叠晶圆的量产,是全球少数掌握该技术的团队之一。同时,公司构建了高精尖人才梯队,研发人员占比超80%,核心骨干来自中科院、清华、北大等顶尖院校,兼具深厚的半导体工程化落地与AI前沿算法研究能力。
携手客户深耕千亿级推理市场
当前全球大模型推理市场已迈入千亿美金规模,中国市场也达到数千亿人民币规模。算苗3D TokenPU的核心客户为头部大模型厂商,目前已联手客户开展近一年的深度研发工作;从芯片定义阶段便锚定真实推理场景需求,针对性完成架构与底层算法深度调优,实现AI算力和大模型算法的极致匹配。
算苗3D TokenPU大算力芯片的技术路线与产业化潜力线上炒股配资开户,也获得了资本市场的高度认可。公司已先后完成多轮融资,投资方覆盖国资平台、头部市场化基金与一线产业资本,包括国开金融、北京顺禧、源码资本、石溪资本、联想创投、襄禾资本等。
元鼎证券配资平台:三色预警机制下的资金安全保障体系提示:本文来自互联网,不代表本网站观点。