中国科学院计算技术研究所与软件研究所,近日联合发布了全球首个基于人工智能技术的处理器芯片软硬件全自动设计系统“启蒙”。据悉,基于AI技术,该系统首次实现从芯片硬件到基础软件的全流程无人化设计,其产出方案在性能、能效等关键指标上均达到人类专家水平。
“启蒙”系统有望改变处理器芯片软硬件的设计范式,不仅能有望大幅提升设计效率、缩短设计周期,同时有望针对特定应用场景需求实现快速定制化设计,灵活满足芯片设计日益多样化的需求。

处理器芯片软硬件全自动设计
众所周知,芯片设计是一项非常具有挑战性、需要耗费大量人力和资源的工作。传统设计流程需要顶尖专家团队耗时数月甚至数年攻坚,极具挑战性。其包含多个关键步骤,硬件设计方面包括逻辑设计、电路设计、物理设计等;基础软件方面包括操作系统内核设计、编译工具链设计、高性能库设计等。
当前芯片基础软件适配需求激增。AI、云计算和边缘计算等技术推动专用处理器设计多样化,指令集组合呈指数级增长,每种组合均需适配庞大的基础软件栈。
传统设计范式下,软件生态适配周期长、成本高,严重制约硬件算力释放。为了减少芯片软硬件设计的人力和资源投入,满足芯片设计日益多样化的需求,研究人员基于AI技术,构建国际首个全自动的处理器芯片软硬设计系统“启蒙”。
基于“启蒙”系统,芯片软硬件设计的各个环节都能实现全自动完成,设计成果可比肩甚至超过人工专家设计水平。

图1启蒙1号实物图,启蒙1号和启蒙2号的性能对比
在芯片前端设计方面,其实现国际首个全自动化设计的处理器核“启蒙1号”, 5小时内完成32位RISC-V CPU的全部前端设计,达到Intel 486性能,规模超过4000000个逻辑门,已完成流片。
其升级版“启蒙2号”为国际首个全自动设计的超标量处理器核,达到ARM Cortex A53性能,规模扩大至17000000个逻辑门。
在硬件代码自动生成方面,其实现硬件代码自动生成大模型CodeV系列 ,能同时完成Chisel、Verilog语言的代码自动生成与代码片段补全。其中,CodeV-R1在Verilog硬件代码生成领域达到7B量级国际最优水平,在RTLLM Benchmark上超越671B满血版DeepSeek-R1。
在自动操作系统配置优化方面,其实现国际首个基于大模型的操作系统内核配置自动优化方法AutoOS ,可自动生成定制优化后的操作系统内核配置,性能相比行业专家手工优化最高可提升25.6%。
在自动编译工具链设计方面,其实现国际首个自动跨平台张量程序转译工具QiMeng-Xpiler,可在不同的处理器芯片如英伟达GPU、寒武纪MLU、AMD MI加速器、Intel DL Boost,和不同编程模型如SIMT、SIMD之间自动程序转译,性能最高达到厂商手工优化算子库的2倍。
同时,其实现国际首个基于大模型的端到端编译器,成功实现真实编译数据集ExeBench中91%的编译任务。
在自动高性能库设计方面,其提出国际首个基于大模型的高性能矩阵乘代码自动生成框架QiMeng-GEMM和国际首个基于大模型的高性能张量算子指令级自动生成框架QiMeng-TensorOp ,在RISC-V CPU上的最高性能分别达到OpenBLAS的211%和251%,在NVIDIA GPU上的最高性能分别达到cuBLAS的115%和124%。
大模型、智能体、应用三个层级
自动的电路逻辑设计长期以来都是计算机科学的核心问题之一。现有自动设计方法通常将AI技术作为工具用于优化芯片设计的某个具体步骤。
不同于传统自动设计方法,“启蒙”系统旨在端对端的实现从功能需求到处理器芯片软硬件的全自动设计和适配优化。
然而,由于处理器芯片设计领域的特殊性,实现处理器芯片软硬件全自动设计主要面临数据稀缺、正确性和求解规模等方面的关键挑战。
为了应对上述挑战,建立处理器芯片软硬件全自动设计的新范式,“启蒙”共包含三个层级:
底层为处理器芯片领域大模型;
中间层构建芯片和软件智能体,实现处理器芯片和基础软件的自动设计;
最上层则应用于芯片软硬件设计的各个步骤。

图2 “启蒙”系统的结构图,包含三个层级
处理器芯片大模型需要充分结合领域特点,掌握处理器芯片设计的领域知识,具备软硬件设计的基础能力。
此外,利用处理器芯片大模型构建反馈式推理流程,包括正确性反馈和性能反馈。通过自动功能验证和基于功能正确性反馈的自动修复,确保生成结果的正确性。同时通过自动性能评估和基于性能反馈的自动搜索,对解空间有效裁剪,实现对高性能设计结果的高效搜索。

图3 “启蒙”系统中的反馈式推理,包括正确性反馈和性能反馈
在处理器芯片大模型的基础上,为自动设计处理器芯片的软硬件,“启蒙”系统分别构建了芯片生成智能体和基础软件智能体。
结合反馈式推理能力,芯片生成智能体自动完成从功能需求到逻辑电路的设计,基础软件智能体自主完成给定基础软件对目标芯片的自动功能适配和性能优化。
基于芯片生成智能体和基础软件智能体,针对多样化的实际应用场景,在最上层全自动完成处理器芯片软硬件设计各个步骤。
“启蒙”的建立和展望
以最顶层的多种应用实现为驱动,实现芯片软硬件各个步骤的自动设计方法后,不仅可以为处理器芯片大模型提供丰富的软硬件设计领域数据,同时也可以为处理器芯片智能体提供与专业工具协同交互的流程设计经验。
因此,“启蒙”系统采用“三步走”的技术路线:
1.自顶而下:以通用大语言模型作为处理器芯片大模型的起点,实现处理器芯片智能体并完成处理器芯片软硬件各个步骤的自动设计。将各个步骤串联后自动产生丰富的跨层协同设计领域数据,用于训练处理器芯片大模型。
2.自底而上:基于训练后的处理器芯片大模型重新构建智能体,并应用于软硬件设计的各个步骤,提升自动设计效果。
3.自演进:将自顶而下和自底而上的设计流程组成迭代的循环,通过循环实现系统的自演进,不断提升系统的处理器芯片软硬件全自动设计能力。
目前,研究人员已基本完成第一步中软硬件各个步骤的自动设计,并以3D高斯泼溅为驱动范例,将各个步骤串联,组成完整的软硬件协同设计流程。后续将继续推进跨层协同设计数据集的建立和处理器芯片大模型的训练。
未来,研究人员还将通过符号主义、行为主义及连接主义等不同人工智能路径的交叉探索,不断提升“启蒙”系统的处理器芯片软硬件全自动设计能力,同时持续拓展“启蒙”的应用边界,为更广泛的处理器芯片设计应用场景提供智能化支持。

新媒体编辑 | 王航飞
一审 | 陈旦
二审 | 王辉
三审 | 柴琼颖