yc中国创始人、知名科技领袖陆奇在一次行业分享中,提出了一个引人深思的观点:在人工智能时代,芯片和底层软件“基本都要重做”。这一论断不仅揭示了当前技术浪潮的深度,也为人工智能基础软件开发指明了方向与挑战。
一、 人工智能时代:呼唤底层硬件与软件的范式转移
陆奇的观点核心在于,传统计算架构及其支撑软件体系,是为解决确定性问题、进行逻辑与事务处理而设计的。而人工智能,尤其是深度学习所驱动的应用,其核心是处理海量非结构化数据、进行概率性推理与模式识别。这种根本性的任务差异,使得现有以CPU为中心、强调高主频与复杂指令集的通用芯片,以及围绕其构建的操作系统、编译器、驱动等底层软件,在能效比、并行处理能力和专用优化上遭遇瓶颈。
因此,“重做”并非推倒重来的简单否定,而是指一场深刻的范式转移:从通用计算走向“领域专用计算”。在芯片层面,这意味着GPU、TPU、NPU以及各类AI加速芯片的崛起,它们针对矩阵运算、张量处理等AI核心计算任务进行了硬件级优化。在底层软件层面,则需要全新的系统软件栈来高效管理这些异构计算资源,实现软硬件协同设计,最大化释放专用硬件的潜能。
二、 芯片重构:从通用到领域专用的革命
人工智能芯片的重构是基础中的基础。传统的芯片设计流程和架构需要被重新思考:
- 架构创新:计算单元的设计从标量、向量转向更适应AI计算的张量核心;内存体系需要解决“内存墙”问题,通过高带宽内存(HBM)、存算一体等新技术,减少数据搬运带来的能耗与延迟。
- 设计方法革新:芯片设计本身也开始引入AI,通过机器学习进行布局布线、功耗和性能优化,加速芯片迭代周期,以应对AI算法快速演进的挑战。
- 生态碎片化与整合:市场上涌现出众多架构的AI芯片,如何建立统一的编程模型、运行时和工具链,降低开发者的使用门槛,成为芯片“重做”过程中必须解决的软件生态问题。
三、 底层软件重构:构建AI时代的“新操作系统”
芯片的变革必然要求底层软件随之重构。陆奇所强调的“基本都要重做”,在软件层面体现得尤为明显:
- 系统软件栈的重塑:需要全新的编译器(如MLIR等中间表示层)、驱动、运行时和调度器。它们的目标不再是高效执行通用指令,而是能够将高层的AI模型描述(如PyTorch、TensorFlow定义的模型)高效地映射到底层复杂的异构硬件(CPU、GPU、AI加速器)上,实现跨平台的性能可移植性。
- 资源抽象与管理:类似于操作系统管理CPU和内存,AI时代的系统软件需要抽象和管理的是算力、内存带宽、存储层次和网络互联。它必须能动态、智能地分配计算任务,处理大规模分布式训练和推理中的通信与同步问题。
- 安全与可靠性新维度:AI系统引入了模型安全、数据隐私、对抗性攻击等新挑战,底层软件需要从架构层面集成相应的安全原语和可信执行环境。
四、 人工智能基础软件开发的巨大机遇
正是在这场“重做”的浪潮中,人工智能基础软件开发迎来了历史性机遇。这不仅仅是修补或适配,而是从零开始构建新一代计算基础设施的黄金窗口。
- 核心工具链开发:开发更智能的编译器、调试器、性能分析工具,让开发者能像用高级语言写程序一样,轻松部署和优化AI模型。
- 标准化与中间层:在多样化的硬件之上,建立开放的、标准化的软件接口和中间表示层(如ONNX的深化发展),成为连接上层应用与底层硬件的“粘合剂”,价值巨大。
- 垂直领域全栈优化:在自动驾驶、科学计算、生物医药等特定领域,从算法、框架、系统软件到硬件进行协同设计与深度优化,打造极致性能的解决方案。
- 开源与生态建设:历史表明,基础软件的胜利往往是生态的胜利。积极参与和引领开源项目,构建繁荣的开发者社区,是确立技术领导地位的关键。
###
陆奇的判断,揭示了人工智能不仅是一场应用创新,更是一场深刻的底层基础设施革命。芯片与底层软件的“重做”,是中国科技产业在核心技术上实现换道超车、构建自主可控技术体系的重要战略机遇。对于开发者、创业者和投资者而言,投身于人工智能基础软件这片广阔的“蓝海”,意味着参与定义下一个计算时代的规则与格局。这条道路固然充满技术挑战,但其成功所带来的产业影响力和战略价值,将是无可估量的。