刚刚,沐曦回应问询!
发布时间:2025-08-28 13:05 浏览量:1
近日,沐曦股份发布了“首次公开发行股票并在科创板上市申请文件的审核问询函的回复。”
1.关于产品与市场竞争
根据申报材料:
(1)发行人产品分为训推一体系列(GPU 板卡、GPU 服务器)、智算推理系列(GPU 板卡)、IP 授权及其他,直接下游为服务器厂商、集成商或智算中心建设方。报告期内,不同产品类型收入占比变化较大;
(2)针对不同客户的需求,除交付内嵌 GPU 芯片的板卡/模组外,发行人亦可向客户交付集成多个板卡后的服务器、一体机/工作站,以及由多个服务器、存储设备、网络设备等组成的智算集群,基础算力底座方面相继交付 9 大智算集群;
(3)全球范围 GPU 市场形成了由英伟达和 AMD 组成的寡头垄断格局,公司国内竞争对手除通用型计算架构(GPU)企业外,还包括华为海思、燧原科技、昆仑芯等专用型计算架构(ASIC/DSA)芯片设计企业;
(4)招股说明书中发行人与国际龙头企业及国内重点企业在市场竞争方面的比对情况做了简要披露,未充分说明公司的竞争地位。
根据公开材料:2025 年 7 月 15 日,英伟达宣布将恢复 H20 GPU 在中国的销售,并推出面向中国市场的全新且完全兼容的 GPU。
请发行人披露:
(1)发行人不同产品类型下主要细分产品型号、销量、收入、单价及毛利率情况,与同行业厂商在产品类型丰富度、细分产品类型、主要销售型号数量的比较情况、差异原因。报告期内不同产品类型收入结构变化较大、当前收入集中于曦云 C500 的原因,其他产品的研发、客户开拓及商业化进展,发行人未来主力产品计划;
(2)不同产品类型发行人与客户具体合作模式,如智算集群等;未来拟主要推广的产品类型或合作模式,服务器或集群业务是否会与现有客户形成竞争影响合作稳定性;目前交付的智算集群情况、涉及的产品自研外购情况、对应直接客户和终端客户、应用领域等;
(3)发行人产品终端客户类型,客户采购后的用途及使用点亮情况,各地对采购销售国产 GPU 的支持政策、客户采购公司产品的主要驱动因素。结合发行人报告期内产品结构变化、客户复购率及持续采购需求、当前国产 GPU 商业化拓展的难点及公司竞争优劣势等,说明公司主要发展方向及竞争策略;
(4)市场主流计算架构(如 GPU、ASIC/DSA 等)以及 GPU 不同产品类型(如计算、图形等)各自对应的市场规模、下游应用领域、行业参与厂商,公司产品覆盖的应用领域产品的市场空间、竞争格局及未来发展趋势;
(5)量化分析公司产品在境内市场的占有率情况,结合发行人与境内外同行业公司在产品布局、性能、业绩规模、市场份额、主要下游客户等情况的比较,分析公司与境外龙头的差距及在境内市场的竞争优劣势。评估境外 GPU 龙头对华产品销售政策变化可能对公司业绩及市场拓展产生的影响。
对此,沐曦股份回应如下:
(一)发行人不同产品类型下主要细分产品型号、销量、收入、单价及毛利率情况,与同行业厂商在产品类型丰富度、细分产品类型、主要销售型号数量的比较情况、差异原因。报告期内不同产品类型收入结构变化较大、当前收入集中于曦云 C500 的原因,其他产品的研发、客户开拓及商业化进展,发行人未来主力产品计划。
1、发行人不同产品类型下主要细分产品型号、销量、收入、单价及毛利率情况
发行人致力于自主研发全栈高性能 GPU 芯片及计算平台,主营业务是研发、设计和销售应用于人工智能训练和推理、通用计算与图形渲染领域的全栈 GPU产品,并围绕 GPU 芯片提供配套的软件栈与计算平台。报告期内,发行人实现销售收入的 GPU 产品主要包括训推一体系列和智算推理系列,其中训推一体系列主要为 GPU 板卡和 GPU 服务器的销售,具体型号包括曦云 C500 和曦云 C550,智算推理系列 GPU 板卡具体型号包括曦思 N100、曦思 N260。
报告期各期,发行人不同产品类型下主要细分产品型号、销量、收入、单价及毛利率情况如下表所示:
2、与同行业厂商在产品类型丰富度、细分产品类型、主要销售型号数量比较情况、差异原因
发行人与同行业可比公司在产品类型丰富度、细分产品类型、主要销售型号数量的比较情况如下:
2023 年度、2024 年度和 2025 年 1-3 月,发行人训推一体曦云 C 系列产品(含板卡和服务器)收入分别为 1,546.81 万元、72,173.52 万元和 31,359.27 万元,占同期主营业务收入的比例分别为 30.09%、97.28%和 97.87%,最近一年一期收入占比较大。因成立时间、发展战略、业务和产品结构演变过程、所处发展阶段等方面的差异,发行人当前收入主要来源于人工智能芯片产品,而同行业可比公司主营业务产品还包括图形渲染芯片、CPU 芯片等;
此外,在人工智能芯片产品型号数量方面,发行人目前主要在售产品型号包括曦云 C500、曦云 C550、曦思N260 和曦思 N100,其中曦云 C500、曦云 C550 为主力产品,与同行业可比公司主要在售的产品型号数量没有显著差异。发行人当前产品类型丰富度、产品型号数量与当前人工智能芯片行业发展趋势、芯片研发迭代周期客观规律相符,当前收入主要集中于曦云 C 系列产品与人工智能芯片研发特点、行业发展趋势和同行业可比公司情况相符,具有合理性,具体分析如下:
(1)发行人目前产品矩阵、收入结构符合同行业可比公司整体趋势
具体而言,同行业可比公司普遍成立时间早于发行人。部分同行业可比公司在成立初期的主要产品并非人工智能芯片,近年来方才逐渐布局人工智能芯片产品。例如,英伟达成立于 1993 年,早期专注于图形芯片设计业务;超威半导体成立于 1969 年,在早期阶段主要专注于微处理器市场,主要从事 CPU 的研发与销售;海光信息则成立于 2016 年,成立早期专注于高性能通用处理器 CPU 产品的研发和销售。
随着近年来生成式 AI 和大模型领域的市场需求呈现爆发式增长,部分同行业公司逐步调整产品战略,向人工智能芯片相关产品转型,人工智能芯片相关业务的收入占比呈上升趋势。根据英伟达公开披露的财务数据,英伟达 2020 财年数据中心产品(通用 GPU)占营业收入的比例约为 43%,此时 AI 市场需求尚未全面爆发,英伟达的游戏业务仍占主导地位;2022 财年,生成式 AI 概念初显,英伟达发布 H100 GPU,当年数据中心产品业务超越游戏业务成为其最大的业务板块,2023 年,ChatGPT 的出现推动算力需求激增,英伟达算力 GPU 出货量大幅增加,至 2024 财年,英伟达数据中心产品收入占比已达到约 89%。另根据超威半导体公开披露的财务数据,其数据中心产品近年来收入占比也呈现出持续攀升的趋势,从 2022 财年的约 25.6%上升至 2024 财年的约 48.9%。
发行人成立于 2020 年,创始人团队凭借对人工智能芯片行业未来市场潜力的敏锐洞察,在公司设立之初便明确将人工智能训练推理芯片作为核心产品的研发方向。近年来,随着人工智能芯片市场需求的持续大幅增长及发行人核心产品实现量产,发行人训推一体系列产品的销售收入及占比均呈现显著上升态势。与发行人情况相似的是,寒武纪自 2016 年成立以来,便专注于人工智能芯片产品的研发与技术创新,其应用于人工智能场景的云端产品线收入占比也较高,2024年占比达到 99.30%。
综上所述,同行业可比公司成立时间普遍早于发行人,发展历程较长,产品类型演变经历了较长时间,因此同行业可比公司与发行人在产品类型丰富度方面的差异具有合理性。随着近年来生成式 AI 和大模型领域的市场需求大幅增长,英伟达、超威半导体等可比公司产品重心也呈现出向人工智能芯片产品转变的特征,人工智能芯片产品销售收入占比呈上升趋势。发行人自成立起即专注于人工智能芯片产品的研发,当前核心产品集中在曦云 C500 系列,与行业整体趋势不存在重大差异。
(2)发行人当前主要产品型号数量与人工智能芯片迭代周期客观规律相符
发行人训推一体系列产品主要型号包括曦云 C500、曦云 C550,智算推理系列产品主要型号包括曦思 N100、曦思 N260,曦云 C 系列(包括曦云 C500 及曦云 C550)收入占比较高,是发行人目前主要销售的产品型号。其他同行业可比公司中,英伟达数据中心产品通用 GPU 主力产品主要包括 B200、H100、A100等;超威半导体 GPU 产品主要型号包括 MI325X、MI250X 等。英伟达和超威半导体同时期大规模销售的主要为其先进架构和制程的最近两代的产品,例如英伟达目前主力销售产品为 B200、H100,同时英伟达基于满足美国出口管制要求的目的,推出了 A800、H800、H20 等中国市场特供版,但均系基于原有芯片架构的功能受限版(A800 基于 A100、H800 和 H20 基于 H100)。寒武纪、海光信息等境内可比公司成立时间较早,其人工智能芯片产品线已经历多轮迭代,产品型号数量略多于发行人。
通常而言,人工智能芯片的研发和迭代周期受到技术发展、市场需求、供应链稳定性等多重因素影响,同行业公司寒武纪在其招股说明书中披露,其云端智能芯片的迭代周期通常在 2 年左右,边缘智能芯片的迭代周期通常会在 2-3 年左右。英伟达、超威半导体凭借其绝对领先的行业地位、技术实力和稳定的供应链,产品迭代周期也需 2 年左右。以英伟达为例,其 2020 年推出基于 Ampere 架构的核心产品 A100、2022 年推出基于 Hopper 架构的核心产品 H100、2024 年推出基于 Blackwell 架构的核心产品 B200,平均每 2 年完成一次重大架构升级。报告期内,发行人克服供应链限制等外部不利因素,用 3 年时间即实现两款芯片一次流片并成功量产,核心产品曦云 C500 于 2023 年 6 月首批芯片回片,2024 年 2月正式量产,正式量产至今尚不足两年,下一代基于国产供应链的曦云 C600 系列已于 2025 年 7 月回片。
综上所述,曦云 C500 系列为发行人当前主力销售产品与芯片产品迭代周期的客观规律以及发行人所处发展阶段相符。
3、报告期内不同产品类型收入结构变化较大、当前收入集中于曦云 C500
的原因
报告期内,发行人营业收入主要来自于训推一体系列 GPU 板卡、训推一体
GPU 服务器、智算推理 GPU 板卡以及 IP 授权。总体来看,报告期内,发行人主要产品类型由智算推理系列向训推一体系列转变,产品的具体交付形式方面,2025 年第 1 季度训推一体 GPU 服务器收入占比降低。具体而言,发行人报告期内不同产品类型收入结构变化较大、当前收入集中于曦云 C500 系列的主要原因如下:
(1)核心产品曦云 C500 系列正式量产叠加生成式 AI 市场需求大幅增长,公司训推一体系列产品收入大幅增长并成为公司主要收入来源
报告期内,发行人训推一体系列产品的收入占比从 2023 年的 30.09%上升至2025 年第 1 季度的 97.87%,智算推理系列产品收入占比从 2022 年的 100.00%下降至 2025 年第 1 季度的 1.25%,整体呈现出训推一体系列产品收入占比大幅上升,而智算推理系列产品收入占比大幅下降的趋势。
公司创始团队拥有深厚的 GPU 技术积累及全流程量产经验,在国际领先
GPU 公司负责设计并量产了多款高性能计算 GPU 和高性能渲染 GPU,具备敏锐的市场洞察能力、前瞻性视野和国内稀缺的万卡大集群落地经验。公司成立之初即已确立了重点优先发展应用于训推一体和通用计算的 GPU 芯片和板卡产品的发展战略,于 2021 年上半年先后完成了曦思 N100 系列和曦云 C500 系列的研发立项。2023 年 4 月,公司智算推理 GPU 芯片曦思 N100 系列正式量产,曦思 N100芯片从设计、流片到量产,为公司打通了从研发到生产再到销售的全业务流,完善了产品、生产供应链和销售渠道的储备资源,奠定了公司的经营模式和商业模式,也为后续曦云 C500 系列的研发和量产积累了经验。
2023 年以来,随着 AI大模型的技术突破,生成式 AI 商业化进程加速,市场对训推一体 AI 芯片的需求大幅增加。与此同时,公司应用于训推一体和通用计算的曦云 C 系列 GPU 产品进入研发、量产的关键时期,至 2024 年 2 月曦云 C500 系列正式量产,契合了市场需求从传统的AI推理场景向更为复杂的AI大模型训练与推理一体化场景转变的时机,曦云 C500 系列产品在较短时间内取得下游客户的认可并实现商业化,出货量和销售收入大幅增加,成为公司目前核心主力产品。
(2)曦云 C500 系列产品契合行业需求,综合性能得到客户广泛认可,产品实现大规模出货
近年来全球人工智能算力建设进入加速通道,叠加持续升级的地缘政治风险促使国产替代进一步加速,大模型训练和推理对高性能 GPU 需求迫切。发行人训推一体 GPU 产品的量产契合了下游爆发增长的需求,该系列产品在性能层面对标英伟达 A100,部分应用场景下的核心指标已比肩国际主流产品;通过兼容CUDA 生态大幅降低客户应用迁移成本与开发门槛,并凭借自研的 MetaXLink互连技术,精准响应大型客户对集群计算效能的核心诉求,算力网络覆盖国家人工智能公共算力平台、运营商智算平台和商业化智算中心。发行人 GPU 产品深度赋能众多行业应用场景,已率先布局教科研、金融、交通、能源、医疗健康大文娱等行业,产品赋能真实应用场景的竞争力和交付能力得到充分验证。
曦云 C500 系列产品在单卡性能、集群性能及稳定性等多维度方面具有领先的产品表现力,在产品的通用性、易用性等方面得到了下游客户的广泛认可,自正式量产以来快速实现了商业化、规模化落地。因此,发行人曦云 C500 系列产品卓越的产品力和商业化能力与下游大幅增长的行业需求相契合,是该系列产品收入大幅增长并成为公司主要收入来源的核心因素。
(3)GPU 芯片研发投入大、周期长,发行人当前收入集中于曦云 C500 系列具有合理性
GPU 是现代半导体工业中设计最复杂的芯片之一,其研发过程具有典型的
“高投入、长周期”特点,一款全新的 GPU 芯片,从立项、设计、验证到最终成功流片并实现量产,通常需要 2 至 3 年,甚至更长的时间,需要巨额的前期投入和流片成本。因此,发行人在公司业务发展的早期阶段,将相对有限的资金、技术和人力投入到旗舰产品的研发,是发行人综合考虑芯片产品研发“高投入、长周期”的客观规律,同时聚焦高价值 AI 训练核心赛道、顺应市场需求和国家政策方向的战略选择,曦云 C 系列产品上市后出货量和销售收入大幅增长,也进一步表明公司战略选择的正确性。
此外,包括英伟达在内,同行业公司产品结构也呈现出同一时期内收入主要来源于旗舰产品的特点,例如英伟达 A100 于2020 年上市后,是英伟达 2021 财年、2022 财年数据中心业务主要的收入来源;H100 于 2022 年 3 月发布后,根据英伟达 2022 年 Q4 业绩电话会,至 2022 年第四季度,英伟达 H100 收入已实现大幅增长并且已远超过 A100,成为其数据中心业务主要收入来源。
(4)GPU 板卡是发行人主要的产品交付形态
具体到训推一体系列内部的产品结构,2024 年和 2025 年 1-3 月,发行人训推一体 GPU 服务器销售收入占比分别为 28.29%和 0.32%,2025 年第 1 季度训推一体 GPU 板卡收入占比上升至 97.55%,训推一体 GPU 服务器收入占比大幅下降,一方面是因为 2025 年第 1 季度期间较短,发行人当期的收入结构不能完全反映发行人总体的收入结构变化趋势,另一方面根据发行人发展战略,发行人核心产品交付形态将以 GPU 板卡为主。
发行人致力于为国家人工智能公共算力平台、运营商智算平台、商业化智算中心等提供基础算力底座,高性能通用 GPU 板卡产品是发行人的核心产品交付形态,发行人下游产业链条参与者还包括服务器整机厂商、智算中心、大模型厂商等。长期以来,国内人工智能芯片市场被英伟达等境外厂商垄断,国产 GPU上市销售后,下游客户对于国产 GPU 产品的性能以及在集群环境下的可用性、可靠性尚存在疑虑。发行人训推一体 GPU 板卡推出之后,智算集群客户在服务器层面、集群整体层面均需要发行人作为 GPU 板卡原厂提供直接的技术支持,同时要求发行人以 GPU 服务器整机的形式交付,以降低国产 GPU 智算集群建设过程中的不确定性。因此,在训推一体 GPU 板卡面世后的早期阶段,发行人为了与客户建立良好的合作关系、更直接地响应客户需求,与国内知名服务器 OEM厂商合作,委托服务器 OEM 厂商将发行人 GPU 板卡集成为服务器整机,发行人向智算集群客户直接交付 GPU 服务器整机,以满足客户集群建设的要求。
自训推一体 GPU 板卡产品推出以来,发行人已与整机服务器、操作系统、
运维管理平台、主流 AI 框架、主流大模型等上下游生态广泛适配,核心 GPU 板卡产品已应用于多个智算集群并稳定运行,GPU 板卡将是发行人未来主要的产品交付形态。
在分享国产GPU普及难点时,沐曦总结说,从行业整体来看,当前国产 GPU 在商业化拓展过程中的主要难点如下:
1)面临国际巨头的竞争压力,产品性价比存在差距
当前国内 GPU 厂商以初创企业为主,在技术积累、人才密度、经营规模及
资金实力各方面与英伟达等国际巨头存在明显差距,叠加制程工艺限制,短期内难以突破其高性价比产品构筑的全球市场壁垒。国内市场方面,由于国际巨头的高端产品被禁售,其可售产品与国产 GPU 的差距在不断被缩小,但考虑到海外政策的不确定性,未来国产 GPU 仍面临和国际巨头高端产品竞争的可能性。
2)商业客户严苛的服务水平要求及准入门槛拉长产品导入周期
为保障既有业务稳定运行和未来算力长期供给,以互联网企业为代表的商业客户对 GPU 产品的综合性能及稳定性要求极高,而国产 GPU 因新产品众多、综合性能与兼容性需经历多轮严格测试,导致客户采购决策周期较长,商业化进程迟缓。目前国内互联网企业采购 GPU 仍以可售的国际产品为主,国产 GPU 占比较低且多数集中于推理场景,训练场景需要更大规模集群测试的时间与资源投入,因此国产 GPU 产品导入较慢。
3)国产 GPU 软件生态相对薄弱,客户迁移成本较高
当前人工智能技术尚处于快速迭代阶段,不断涌现的各种大模型算法对于底层算力持续提出了新的需求,然而人工智能芯片的研发周期相对较长,软件适配层面更是需要时间积累。虽然国产 GPU 依托通用型架构优势,具备兼容 CUDA的理论基础及路径可行性,但生态适配、迭代和培育建设是一项长期、复杂的系统性工程,短时间内预计无法改变国产 GPU 相较国际产品生态薄弱的困境,增加了国产 GPU 商业化拓展的难度。
4)客户关于能否保障供应链持续稳定有所担忧
近年来,随着地缘政治持续紧张、国际形势愈发复杂,全球半导体产业链核心环节受到较大的行政干预和出口管制。我国集成电路行业整体起步较晚,尤其是在生产制造环节目前与境外顶尖的设备、技术水平还存有显著差距,国产供应商仍需努力追赶。对于互联网企业等部分客户,国产 GPU 的供应链稳定性也是影响其采购决策的主要考虑之一。
在分享公司优劣势时,沐曦表示:
发行人秉承严谨务实的工程师文化,在初期的商业拓展过程中,坚持扎实做好每一次具体场景的产品测试,依靠过硬的技术指标及测试数据,逐步获得客户的认可和信任,目前已与多个国家人工智能公共算力平台、运营商智算平台和商业化智算中心建立紧密业务合作,行业知名度与品牌影响力不断提升。发行人产品在通用性、单卡性能、集群性能和 CUDA 兼容等方面均具有国内领先优势,详见本题回复前述内容中关于“客户采购公司产品的主要驱动因素”相关说明,
除此之外发行人在市场开拓层面的其他一些竞争优势补充说明如下:
首先,基于对包括 GPU IP、GPU 指令集和架构在内的一整套 GPU 底层核心技术的完全自主掌握,发行人在应对国家人工智能公共算力平台等标杆客户组织的每次产品性能测试比选过程中,能够根据客户的技术标准要求和考察内容变化,快速迭代、优化公司产品的软硬件技术组合方案。这也是相较国内其他友商,发行人持续深耕通用 GPU 领域的技术实力和纵深度体现。
其次,在商业化算力服务领域,发行人可以提供高性价比、多形态(PCIe
板卡、OAM 模组,支持各类组网模式和散热模块)的各种产品选择,帮助商业化智算中心实现更优 PUE(数据中心电源使用效率)的运营水平。此外,发行人联合各大高校、科研院所等生态伙伴,围绕人工智能大模型创新应用,聚焦真实场景的算力需求,帮助智算中心客户主动引流,打造生态共赢圈。
第三,相比其他国内 GPU 厂商,发行人较早地启动了国产供应链布局和具
体规划,首款国产供应链产品曦云 C600 已完成回片点亮并正式发布,性能测试结果及市场反响良好。依托自主可控、稳定的国产供应链优势,发行人该款产品预计未来将在信创市场实现规模化应用,同时也已受到多家互联网企业的高度关注。
关于竞争劣势,发行人主要是目前在互联网企业客户开拓及产品导入方面,相比部分国内友商进度有所滞后。如前所述,互联网企业的采购决策高度市场化,出于对产品性价比和生态竞争力的考虑,其第一选择仍然是国际产品,而在部分推理场景下可能会使用国产算力芯片,但通常也是优先选择自有产品,或者扶持其投资的生态链企业。对发行人而言,一方面是暂时缺乏互联网企业股东背景及相应业务支持,另一方面则由于前述友商的产品多数为 ASIC 架构,其通过针对特定任务进行硬件定制化设计可实现较高的能效比,因此在模型和算子相对固化的推理场景下更具优势。
在问到与境外龙头的差距时,沐曦分析说:
自 2020 年成立以来,发行人坚持以自主技术创新为导向,持续深耕 GPU 行业,经过“从零到一”全自研的技术沉淀,在国内云端智算市场率先实现了“技术-产品-市场”的产业化应用,产品在部分性能指标上已经接近或达到国际先进水平,但与境外龙头相比仍存在一定差距。
技术水平与产品性能上,境外龙头英伟达长期引领行业技术方向,已形成了深厚的技术底蕴和丰富的行业经验,其产品在硬件架构、单卡算力、互连拓扑、软件生态、大规模集群建设等方面都建立了明显的领先优势;而 AMD 亦紧随其后不断迭代和优化产品性能。
1)在单卡性能方面:经过两个大代际、五个小代际流处理器架构的迭代升
级,发行人已形成了全面覆盖计算(人工智能训练、推理、通用计算)和渲染场景的核心 GPU IP,打造了由超过 600 条计算 GPU 指令、800 条渲染 GPU 指令组成自主安全可控的 MXMACA 指令集,单卡算力已接近英伟达主流产品。但受限于工艺制程和研发周期,包括发行人在内的绝大部分国内厂商与英伟达最新产品均仍存在一到两代差距。
2)在集群通信方面:发行人自主研发的 MetaXLink 高速互连技术突破了传统 PCIe 总线在带宽和延迟方面的限制,达到了与英伟达 4nm 制程工艺下旗舰产品(H200)相当的互连带宽性能,是国内厂商中率先将与英伟达 NVLink 技术的差距缩小到一代以内的 GPU 供应商。
3)在软件生态方面:英伟达是软件生态建设的先行者与领导者,全球英伟
达 CUDA 开发者已达数百万。而发行人 MXMACA 软件栈截至 2025 年 7 月 31日的注册用户超过 15,000 人。发行人在软件生态的建设方面与之相比还存在较大的发展空间。
产品布局与商业化上,依托持续的行业深耕,发行人在经营规模上取得了快速成长,但尚处于发展初期阶段,整体产品数量、业绩规模、市场份额、客户数量仍然偏小,相较境外龙头仍存在明显差距。在地缘政治冲突大背景下,境外龙头先进计算芯片产品在国内市场受到一定限制,为国内厂商创造了发展空间。发行人将把握市场机遇,持续进行产品迭代和技术创新,加速市场拓展,进一步丰富产品矩阵、提高技术创新能力、扩大市场影响力,通过发展先进封装、互连通信等技术、扎根国内需求市场,与境外龙头错位竞争。
在分享未来发展趋势时,沐曦表示:
1)训练芯片与推理芯片需求持续激增,人工智能计算市场国产替代正当时
随着人工智能技术持续突破,全球范围内实现了新一轮 AI 普及,推动全球
人工智能竞赛再次加速,下游对算力的需求激增。GPU 公司正迎来结构性市场机遇,传统由超大规模云厂商主导的集中式算力需求模式正逐步演进为由头部云厂商为主、各行各业中小企业为辅的人工智能生态。更多中小企业和开发者借助模型微调、蒸馏、强化学习等技术积极投身人工智能领域,这类庞大的客户群体为 GPU 公司开辟了新的重要增长极。与此同时,在地缘政治不断升级和国家人工智能产业链自主可控需求的驱动下,国内 GPU 市场的国产化率将显著提升,逐步实现对进口产品的替代,这为具有领先技术实力和商业化进展的国产厂商创造了巨大的发展空间。
从人工智能芯片的需求场景来看,当前正处于人工智能技术探索阶段,算力需求主要来源于模型训练。训练芯片相较推理芯片的设计难度和价值量都更高。根据 IDC 数据,训练型 AI 服务器中 GPU 的价值占比可达 73%,而推理型 AI 服务器中 GPU 的价值占比约为 25%。发行人用于训练场景的曦云 C 系列产品已在多元化应用场景商业化落地,未来也将作为发行人的业绩基石,随着市场需求的爆发而快速增长。
未来,随着训练模型的完善与成熟,模型和应用产品逐步投入生产,推理端的人工智能服务器占比将随之攀升,推理需求也将下沉至不同的应用场景。因此,随着 AI 技术的不断进步,推理算力将成为推动产业发展的第二重驱动力。发行人本次募集资金投向之一的“新一代人工智能推理 GPU 研发及产业化项目”专为生成式 AI 推理市场设计,将为发行人注入新的增长动能。
算法创新将推动人工智能技术使用门槛不断降低、赋能千行百业,更多中小企业能够便捷地获取先进技术、积极投身人工智能应用与转型,因此训练芯片和推理芯片的需求都将呈现爆发式增长趋势。据 IDC 预测,预计未来五年内,国内训练和推理算力的年复合增速将分别达到 50%和 190%。基于在人工智能训练市场的市场优势和在人工智能推理市场的技术与产品储备,发行人将在智算产业链国产替代进程中充分受益。
2)云边端融合发展,通用型计算芯片与专用型计算芯片将共同构建一体化
生态
由于人工智能行业处于快速发展期,人工智能算法尚在不断开展前沿技术探索,因此也涌现了处理不同人工智能任务的芯片。关于通用型计算芯片和专用型计算芯片的差异对比情况,具体参见招股说明书之“第五节 业务与技术”之“二/(三)/3/(1)/3)人工智能芯片技术路径”。长期来看,未来通用型计算芯片和专用型计算芯片将各有侧重,共同构建一体化生态,具体如下:
云端作为资本开支最大、算法迭代最快、计算能力要求最高的需求场景,将成为人工智能训练和推理的“智能大脑”,处理重量级人工智能任务,如通用基础大模型的训练、垂直大模型的复杂推理等。由于算法正处于不断发展演进的过程,模型结构并未固化,迭代创新日趋频繁,快速迭代的算法和大量非传统模型结构的出现需要通用型计算芯片(GPU)完成高效迁移与适配。随着云端智算集群的需求快速扩张以及后训练、推理等阶段新模型结构的快速演变,具有更强通用性、灵活性和可扩展性优势的 GPU 架构将长期成为云端智算的主流方案。
端侧(边缘端、终端)则是综合平衡性能和负载的选择,作为“小脑”和“四
肢”处理即时、轻量级人工智能任务,如简单推理,将以更多元的形态进入千家万户,包括 AI 手机、AI PC、AI 眼镜、AI 玩具、AI 机器人等。由于端侧对功耗、负载的敏感度亦新增了对专用型计算芯片的需求,专用型计算芯片可针对固定模型结构及特定应用场景提供更具能效比的解决方案,将成为通用型计算芯片的有效补充。
综上所述,发行人主要产品所处的 GPU 市场空间广阔、成长潜力巨大;在
增速强劲的国内人工智能计算市场中,发行人具有领先技术实力和商业化进展,已形成一定市场地位和品牌知名度;在具有稳定需求的图形渲染 GPU 市场中,发行人亦已规划并研发对应的产品线。发行人采用的通用、灵活的 GPU 架构将长期成为云端智算的主流方案,符合行业技术发展趋势。发行人的产品规划与市场需求发展趋势高度匹配,将长期保持增长潜力,不断提高市场份额。