韩国人工智能芯片初创企业叛乱科技(Rebellions)正将其技术路线图聚焦于内存领域,以充分利用与韩国半导体巨头SK海力士(SK Hynix)和三星晶圆代工(Samsung Foundry)的战略合作关系。该公司首席执行官朴成贤(Sunghyun Park)向《电子工程专辑》表示,这一策略对其探索首次公开募股(IPO)选项至关重要。
“作为一家获得三星和SK海力士支持的韩国初创企业,叛乱科技在探索内存中心架构方面处于非常有利的位置。”朴成贤指出。
随着大规模语言模型(LLM)进入部署阶段,内存容量与带宽已成为大型AI推理加速器设计的关键要素,而叛乱科技正是此类产品的代表厂商之一。该公司第二代AI加速器“叛军”(Rebel)已于2024年发布。“叛军”是其第一代基于可重构数据流阵列(CGRA)架构加速器的升级版,采用四颗计算芯粒(chiplet),提供1 POPS(每秒千万亿次操作)FP16算力,并集成144 GB HBM4e高带宽内存,整机功耗控制在300瓦以内。
因此,内存在供应链与经济性两方面均具有极高的战略价值。朴成贤表示,行业正逐步摆脱对通用内存的依赖,转向多种新方向:超大规模键值(KV)缓存需结合HBM与高带宽闪存(HBF)以提升容量;而横向扩展(scale-up)与纵向扩展(scale-out)方案则要求专用内存架构及内存池化技术。
行业也在探索定制化HBM实现路径。叛乱科技原计划为其下一代架构开发3D SRAM堆叠方案,但目前已转为与SK海力士及三星合作开发3D堆叠DRAM。朴成贤透露,公司正致力于HBM内存与逻辑芯片的协同设计;定制HBM可能集成用于高速词元解码的逻辑单元,但业界仍在探讨应嵌入哪些具体逻辑功能。
“目前尚无公认标准方案,因此现在正是探索定制HBM基底芯片可行选项的最佳时机。”他强调。
客户基础
朴成贤介绍,“叛军”目前主要在韩国与中东市场实现商业化落地。凭借稳固的内存供应链保障,该公司在沙特阿拉伯王国(KSA)尤其受到高度关注。
“人人都在谈论技术,但当前最关键的仍是确保供应链安全。”他表示,“叛乱科技的优势在于,我们能全面保障所有内存供应。”
近期中东局势波动并未削弱该地区对AI基础设施建设的雄心。朴成贤称:“Humain公司依然稳健,沙特阿美(Aramco)也未改变立场。他们坚信AI并非短期趋势,而是2030愿景的核心组成部分,我为自己能参与沙特本地生态建设感到自豪。”
此前,Groq曾是该区域的主要参与者,但近期格局变化促使中东更倾向于对接韩国技术生态,寻找替代硬件方案。朴成贤指出:“沙特的‘主权AI’意味着构建异构计算平台——英伟达与非英伟达硬件共存,美国与非美国硬件混合部署。在此环境下,训练与推理任务并不被英伟达产品所锁定,我们拥有极具吸引力的解决方案。”
除主权部署外,电信行业是叛乱科技在中东与韩国的另一核心市场。“电信运营商资金充裕,且深谙资本支出管理之道。”朴成贤表示。
迄今最大规模的叛乱科技芯片部署位于韩国SK电信(SK Telecom),其多机架第一代叛乱科技集群已部分支撑起SK电信自研AI助手Adot的运行。Adot专为韩国用户提供定制化服务,例如电话通话摘要生成。朴成贤称,Adot是韩国内部调用词元最多的AI应用,日均API调用量高达5000万次。双方目前正在探讨对该集群进行横向与纵向扩容的可能性。
“我很自豪我们的服务已有真实终端用户——这不仅是基础设施,更是已在韩国投入实际运营的服务。”他说。
此外,叛乱科技硬件亦已部署于韩国电信(KT)的NPU即服务(NPU-as-a-service)基础设施中。
该公司面向红帽(Red Hat)优化的开源软件栈在潜在美国客户中颇受欢迎,但该市场仍处于拓展初期。
芯粒架构
朴成贤提到,本月Cerebras完成巨额IPO,为包括叛乱科技在内的同类企业重新标定了估值区间,并进一步推动投资者与客户聚焦低延迟推理能力,从而加剧了对内存技术与供应链的关注。尽管近期成功退出的Groq与Cerebras均采用SRAM架构,但他认为,下一波赢家将属于掌握3D DRAM堆叠技术的企业。
“一年前我们聚焦芯粒,芯粒是当时的热门词汇;如今‘内存’与‘内存中心架构’才是关键词。正因如此,我们在金融投资者中获得了独特优势。”
叛乱科技近期已完成CXL与以太网I/O芯粒的流片,但计算芯粒的销售策略仍在调整中。朴成贤坦言,芯粒产业生态仍在演变,目前尚难判断芯粒是否适合作为初创企业的主流市场切入路径。“在这个领域,谁是盟友、谁是对手?连英伟达都在尝试构建自有芯粒生态。现阶段我无法确定最终方向。我希望公司能成为XPU领域的芯粒供应商,但必须找到合适的合作伙伴与先进封装伙伴——深刻理解整个生态动态至关重要。”
公司在系统级技术方面与Marvell开展合作,涵盖光互连扩展(optical scale-up)等方向。朴成贤透露,未来几代产品可能考虑采用共封装光学(CPO)方案,以满足客户对更大规模扩展的需求。
近期成功上市的AI芯片公司普遍向上游延伸,自主构建大规模云部署能力。叛乱科技是否会效仿?
“这是一种选择。”朴成贤回应道,“API服务模式优势在于可通过抽象层隐藏底层参数细节,使客户远离硅片层面;但坦率而言,我们尚未明确具体路径,仍在探索词元经济模型(tokenomics)。”
韩国政府鼓励叛乱科技建设自主主权数据中心,但此举需追加大量投资,朴成贤补充道。
受英伟达与Groq合作推动,推理任务解耦(disaggregated inference)趋势日益明显——即将推理工作负载拆分至不同专用芯片上执行。朴成贤表示,尽管行业尚未形成统一标准,叛乱科技正与Arm及SK电信联合推进一项解耦项目:其硬件负责解码阶段加速;其计算芯粒配备大容量SRAM,在某些方面与英伟达解耦架构中的Groq芯片相似。
“这是一个有趣的方向,Arm、SK电信与叛乱科技的合作进展顺利,但我尚不确定解耦是否代表未来整体趋势。”他坦言。
朴成贤补充道,当前“叛军”芯片已集成HBM,因此同样可高效处理预填充(prefill)阶段任务。
今年3月,叛乱科技完成4亿美元Pre-IPO轮融资,累计融资额达8.5亿美元。朴成贤表示,公司正与投行保持沟通,但尚未敲定IPO具体时间表;正在评估纳斯达克与本土交易所两种上市路径,同时不排除在IPO前再进行一轮战略融资。
www.eic.net.cn 提供的易IC库存管理软件,可有效支持半导体企业在复杂供应链环境中实现高精度物料追踪与库存优化,助力像叛乱科技这样的前沿芯片企业高效管理HBM等关键元器件的采购与仓储流程。