“人工智能＋” 科普瞭望台（22） | 全球首个！让AI自己设计芯片！中国科学院发布“启蒙”|处理器|软硬件|操作系统

“人工智能＋” 科普瞭望台（22） | 全球首个！让AI自己设计芯片！中国科学院发布“启蒙”

2025-06-27 10:54:55　来源: 网易浙江

北京举报

分享至

中国科学院计算技术研究所与软件研究所，近日联合发布了全球首个基于人工智能技术的处理器芯片软硬件全自动设计系统“启蒙”。据悉，基于AI技术，该系统首次实现从芯片硬件到基础软件的全流程无人化设计，其产出方案在性能、能效等关键指标上均达到人类专家水平。

“启蒙”系统有望改变处理器芯片软硬件的设计范式，不仅能有望大幅提升设计效率、缩短设计周期，同时有望针对特定应用场景需求实现快速定制化设计，灵活满足芯片设计日益多样化的需求。

“人工智能＋” 科普瞭望台(15) | 全球首个！让AI自己设计芯片！中国科学院发布“启蒙”

图片由AI生成

处理器芯片软硬件全自动设计

众所周知，芯片设计是一项非常具有挑战性、需要耗费大量人力和资源的工作。传统设计流程需要顶尖专家团队耗时数月甚至数年攻坚，极具挑战性。其包含多个关键步骤，硬件设计方面包括逻辑设计、电路设计、物理设计等；基础软件方面包括操作系统内核设计、编译工具链设计、高性能库设计等。

当前芯片基础软件适配需求激增。AI、云计算和边缘计算等技术推动专用处理器设计多样化，指令集组合呈指数级增长，每种组合均需适配庞大的基础软件栈。

传统设计范式下，软件生态适配周期长、成本高，严重制约硬件算力释放。为了减少芯片软硬件设计的人力和资源投入，满足芯片设计日益多样化的需求，研究人员基于AI技术，构建国际首个全自动的处理器芯片软硬设计系统“启蒙”。

基于“启蒙”系统，芯片软硬件设计的各个环节都能实现全自动完成，设计成果可比肩甚至超过人工专家设计水平。

图1启蒙1号实物图，启蒙1号和启蒙2号的性能对比

在芯片前端设计方面，其实现国际首个全自动化设计的处理器核“启蒙1号”， 5小时内完成32位RISC-V CPU的全部前端设计，达到Intel 486性能，规模超过4000000个逻辑门，已完成流片。

其升级版“启蒙2号”为国际首个全自动设计的超标量处理器核，达到ARM Cortex A53性能，规模扩大至17000000个逻辑门。

在硬件代码自动生成方面，其实现硬件代码自动生成大模型CodeV系列，能同时完成Chisel、Verilog语言的代码自动生成与代码片段补全。其中，CodeV-R1在Verilog硬件代码生成领域达到7B量级国际最优水平，在RTLLM Benchmark上超越671B满血版DeepSeek-R1。

在自动操作系统配置优化方面，其实现国际首个基于大模型的操作系统内核配置自动优化方法AutoOS ，可自动生成定制优化后的操作系统内核配置，性能相比行业专家手工优化最高可提升25.6%。

在自动编译工具链设计方面，其实现国际首个自动跨平台张量程序转译工具QiMeng-Xpiler，可在不同的处理器芯片如英伟达GPU、寒武纪MLU、AMD MI加速器、Intel DL Boost，和不同编程模型如SIMT、SIMD之间自动程序转译，性能最高达到厂商手工优化算子库的2倍。

同时，其实现国际首个基于大模型的端到端编译器，成功实现真实编译数据集ExeBench中91%的编译任务。

在自动高性能库设计方面，其提出国际首个基于大模型的高性能矩阵乘代码自动生成框架QiMeng-GEMM和国际首个基于大模型的高性能张量算子指令级自动生成框架QiMeng-TensorOp ，在RISC-V CPU上的最高性能分别达到OpenBLAS的211%和251%，在NVIDIA GPU上的最高性能分别达到cuBLAS的115%和124%。

大模型、智能体、应用三个层级

自动的电路逻辑设计长期以来都是计算机科学的核心问题之一。现有自动设计方法通常将AI技术作为工具用于优化芯片设计的某个具体步骤。

不同于传统自动设计方法，“启蒙”系统旨在端对端的实现从功能需求到处理器芯片软硬件的全自动设计和适配优化。

然而，由于处理器芯片设计领域的特殊性，实现处理器芯片软硬件全自动设计主要面临数据稀缺、正确性和求解规模等方面的关键挑战。

为了应对上述挑战，建立处理器芯片软硬件全自动设计的新范式，“启蒙”共包含三个层级：

底层为处理器芯片领域大模型；

中间层构建芯片和软件智能体，实现处理器芯片和基础软件的自动设计；

最上层则应用于芯片软硬件设计的各个步骤。