AI正在淘汰“中间层”!昆仑万维方汉:要么冲进前10%,要么学会“向下兼容”

发布时间:2025-06-22 10:34  浏览量:3

采访 | 霍太稳

编辑 | Tina

过去一年,全球科技巨头都把宝押在了 AI 上。像 Meta、微软、亚马逊、谷歌 这些大公司,今年光是在 AI 基础设施上就打算砸 3,250 亿美元,秉持“先烧钱、后吃肉”的战略,推动大模型技术快速发展。在这一波浪潮中,DeepSeek 等企业在大模型上的创新,更是把各路玩家卷得不行,甚至逼得 OpenAI 都打起了价格战。

面对全球激烈的竞争态势,中国企业不仅没有被拉开差距,反而在多个 AI 领域实现了反超,尤其是一批敢于投入并抢先布局的企业正迅速崛起。以昆仑万维为例,他们始终紧抓行业风口,业务已覆盖全球 100 多个国家和地区。从早期的音乐社交平台 StarMaker,到成功收购全球互联网巨头 Opera,再到现象级 AI 音乐产品 Mureka,昆仑万维的布局广泛且有前瞻性。

到了 2025 年第一季度,昆仑万维的总营收达到了 17.6 亿元,同比猛增了 46%,其中 94% 的收入都来自海外。旗下 AI 音乐业务年化流水约 1,200 万美元,单月流水突破 100 万美元。另外,短剧平台 Dramawave 的 ARR 更是高达 1.2 亿美元。昆仑万维的 AI 业务在海外取得的盈利,不仅证明了中国企业在国际 AI 赛道上的竞争力,也为其他希望“出海”的企业树立了一个榜样。

现在,AI 竞技的焦点正从“谁的模型更强”转向“谁能更好地落地场景、抢占市场”。近期,InfoQ 在 AICon 全球人工智能开发与应用大会上海站上,特别专访了昆仑万维董事长兼 CEO 方汉,他将带来独家解读。

采访嘉宾:

方汉,昆仑万维董事长兼 CEO。毕业于中国科学技术大学近代物理系,曾任职于中国科学院高能物理研究所、拓林思、亚信以及千橡互动,2008 年 3 月协助周亚辉先生创立昆仑万维。

方汉先生拥有 30 年互联网从业经验,从 1994 年开始参与和倡导开源运动,是中文 Linux 奠基人、中文 Linux 四剑客之一,著作国内第一本 Linux 书籍《Linux 实用大全》;也是国内最早的网络安全专家,曾负责三大电信运营商的全网安全审计,负责研发了国内市场占有率最高的网页游戏《三国风云》,为中国互联网最资深的参与者。

1 “程序员反而是最不容易被淘汰的”

InfoQ:我记得此前有一篇报道中你提到过:“我一开始低估了 AI,以为它只是颠覆内容行业。现在我觉得它将超越互联网和移动互联网。”是什么促使你对 AI 的判断发生了如此大的转变?

方汉:我觉得原因其实很简单。电脑本质上是人脑的延伸,它能帮助人类完成大量重复性工作,这一点我们早就习以为常了。但 AI 的不同之处在于,它已经开始具备协助人类完成非重复性工作的能力。

可以说,电脑带来了“信息化”,而 AI 则正在推动“智能化”。而且是实打实的智能化,它正在显著提升各行各业的效率。

比如,像文生图、文生视频这样的技术,已经让我们这些做内容的人切实感受到效率上的飞跃。而且像谷歌 DeepMind 在科研方面的进展也非常惊人。我大学时学的是核物理,还有不少同学现在在从事科研工作,他们告诉我,一些研究团队已经开始用 AI 来辅助物理研究了。

所以我觉得,AI 就像一个“催化剂”,能够全面提升行业效率,对整个社会的影响也会非常深远,甚至不亚于当年电脑刚刚问世时带来的变革。

InfoQ:所以说,AI 已经不仅仅是一个技术本身了。从您的角度来看,未来会有哪些超越技术周期的重大机会?

方汉:我觉得 AI 就像一个“催化剂”。人类整个科技发展的架构,其实就是从基础科学到应用科学这么一条路径。而 AI 正好在这两个层面都开始发挥作用。在应用科学层面,比如说写代码变轻松了,编程门槛降低了,做视频、做音乐也都更容易了,这些变化已经开始显现出来了。

但更重要的是,在基础科学领域——比如物理、化学、数学,AI 也开始展现出潜力。像著名数学家陶哲轩,他现在就用 AI 来帮助他进行数学证明。也就是说,AI 能够在基础科学和应用科学之间全面发挥催化剂的作用,让整体效率大幅提升。

而且你会发现一个很有意思的现象:AI 在每个行业里都会产生类似的结构性变化。最顶尖的那 10% 的从业者,他们的工作效率会成倍、成 10 倍的上升;而刚入行的 20% 到 30% 的人,在 AI 的帮助下,原本需要两三年才能积累的经验,现在可能两三个月就能掌握,迅速成长起来。相对来说,冲击最大的是中间那一层不上不下的从业者。

所以我认为,AI 会在每个行业中加速优胜劣汰的过程,但从整体上看,它带来的效率提升是指数级的。

InfoQ:我也代表很多 InfoQ 的用户问一个问题。其实我理解,现在很多 InfoQ 的读者正处在你刚才说的“不上不下”的那个阶段——要么冲过去,要么可能就会被淘汰。从你的角度来看,他们有没有什么办法可以比较高效地冲出这个困境?

方汉:我觉得核心还是一句话:拥抱变化。因为我们没有办法去对抗这种变化,那就只能选择拥抱它。

那什么叫“拥抱变化”?就是心态上要更开放一点。其实我认为,真正阻碍那些“不上不下”人的,不是 AI 本身,而是他们对学习的态度。有句话不是说得特别好吗?“活到老,学到老”。要不断从一些高质量的渠道去学习,去了解 AI 的最新进展,去看各种优秀 AI 项目的源代码。学习是手段,它的目的是什么?就是提升你的工作效率。只要你不断提高效率,你就不会被淘汰。

而且现在 AI 还处在一个多数人认知还没跟上的阶段。程序员其实是最早一批能真正理解 AI 的人。就算你不一直做程序员,你也能够把你的认知传达给其他的工种其他行业的人,所以说我觉得程序员反而是最不容易被淘汰的,但前提是你得终身学习。

InfoQ:我们看到,无论是国外的大厂,还是国内的大厂,最近都在大量裁员,很多技术人员被推向了市场。从你的角度看,这背后的逻辑是什么?是因为这些人真的没有进步空间了吗,还是另有原因?

方汉:因为这些企业都是上市公司,而上市公司在财报上最容易呈现效果的方式,就是“减员增效”。他们通常会认为,自己原本就养了很多冗余的人力资源,尤其是一些只从事基础代码编写工作的岗位。而现在有了 AI,这些重复性强、质量要求不高的工作完全可以被替代。与此同时,他们也需要向资本市场交代业绩,所以裁撤这部分人就成了自然的选择。

但我们也要看到,即便没有 AI,在经济周期下行的情况下,这批人本来也很可能是第一批被裁掉的。现在的问题在于——你是否具备“上”和“下”的能力。也就是说,你既要能在行业景气时抓住机会“上”,也要能在行业低谷时适应环境“下”。你不能总觉得自己是大厂出身,就不愿意去小厂,更不能因为离开大厂了就不敢创业。

所以我觉得,关键还是在于你能不能“下得来”。因为任何一个行业都会经历周期波动,有高峰也有低谷。在低谷期,你要有能力找到自己的位置,活下来。而且我认为,这不只是程序员面临的问题。其实程序员已经算是很有优势的一类了。因为这一波 AI 应用在各行各业落地,程序员反而是最有条件、最有可能抓住这个机会的群体。

我用一个比喻来总结:当汽车出现时,确实会导致马车夫失业。但什么样的马车夫不会失业?是第一个学会开汽车的那位马车夫。所以,我们程序员其实就是“旧时代的马车夫”。我们最好的选择,就是尽量转变成“汽车驾驶员”,而不是死守着马车,等着下一家马车行来雇佣我们。相反,我们应该主动去寻找驾驶汽车的机会——这是我的看法。

InfoQ:我觉得这个观点对我们很多的技术人或者程序员来说,是一个非常好的鼓励。

2 目前的问题不是“AI 市场太大”,而是“它还太早期”

InfoQ:下面这个问题可能更和你作为 CEO 的身份有关。现在很多公司都在强调“单点突破”,但我们看到昆仑万维选择了多点并进,布局了 AI 大模型、AI 搜索、AI 游戏、AI 音乐、AI 视频、AI 社交六个方向。作为董事长兼 CEO,你是如何进行资源分配的?这些方向之间有没有优先级之分?

方汉:我觉得其实很简单,有句话叫“是驴子是马拉出来遛遛”。我们看中的这些方向,是基于我们的判断认为它们更接近应用、离用户更近、离商业化更近,所以我们会优先投入去尝试。当然,不同的方向也和我们过往的经验有关,比如我们做过游戏,所以会切入 AI 游戏;我们也运营过音乐社交平台 StarMaker,所以在 AI 音乐上也有一定积累。这些领域我们都有一定的数据优势,能帮助我们快速切入。

但从整体来看,我们的策略是一开始广泛探索,然后依靠市场反馈来调整节奏。比如我们现在在做的短剧相关产品,用户增长非常快;有些方向增长慢,那我们就会及时调整。早期最重要的就是“快速试错”(fast fail),避免错过风口。

另外,从行业发展看,过去三年,大家都在“卷模型”,可以说是“千模大战”;现在又开始“卷 Agent”。但我认为现在还是要从用户角度出发,让用户真正感知到产品的价值和可用性。所以我们布局的这几个方向,其实都在尝试中,最终还是看用户反馈来决定。

此外,我们的整体脉络也比较清晰,一方面是 AGI,另一方面是 AIGC,我们目前的重点是 AIGC 。AIGC 主要包括音乐、视频、游戏这些内容行业的应用;而像搜索这样的方向,则偏 To B,更像是 API 服务。总之,六大方向我们都会持续探索,但最终资源分配和优先级,一定是由市场反馈来决定的。

InfoQ:是不是你们也会觉得,现在整个 AI 市场的机会太大了,如果只专注于一个方向,可能就会错失其他的可能性?

方汉:我觉得目前的问题不是“AI 市场太大”,而是“它还太早期”。正因为早期,才更难判断哪些方向最终会成功。如果这个市场已经足够成熟,反而更容易判断出哪些赛道是值得投入的,那时候选一个点专注也许更合适。而在当前阶段,没有人能拍着胸脯说,哪个方向一定能跑出来,只能根据经验去做判断。比如我们判断 AI 短剧、AI 视频生成可能是最大的市场之一,但这也还需要靠市场去验证。

这其实也涉及技术成熟度的问题。像视频生成目前还不够成熟,导致现在的 AI 视频产品在商业化上还没有那么快、用户接受度也没那么高。但一旦视频生成的拐点到来,可能瞬间整个市场就爆发,大家都开始用 AI 视频来做内容。

所以我们现在的策略,更多还是快速试错。因为我们是一个中等规模的企业,去年营收是 56 亿,研发投入有 15 亿,投入比例算是很高的。这样的投入也让我们有能力在多个方向上同时探索,进行多点突破。

3 出海不是 PPT 上画出来的,是一把手蹲在前线打出来的

InfoQ:刚才您也提到了 StarMaker,其实这一仗打得非常漂亮,现在在全球市场的占有率也很高。我昨天刚好还在杭州参加了阿里云的中期出海大会,感觉现在大家都把出海当作一个非常重要的战略方向。而昆仑万维好像有 94% 的收入都来自海外。从您的视角来看,在全球范围内推进大模型商业化,中国企业的主要优势体现在哪些方面?

方汉:首先我想说,中国企业在 AI 领域的技术实力其实已经不容小觑。我现在经常看 AI 相关的论文,十篇里面起码有八篇作者里有中国人的名字。很明确,这一轮的 AI 竞争已经是“中美双强”的格局。无论是技术积累、人才储备,还是大模型的实际表现,中国和美国基本是全球前两名。甚至可以说是“前两断层领先”,没人真正关心谁是第三名,因为差距太大了。

这种局面的形成,和我们国家早期在人才培养、科研投入上的持续建设密切相关。当然,我们也必须看到现实的一面:中国现在整体的风险投资环境偏冷,导致中国 AI 企业拿到的融资规模和数量明显比美国同行少。但我认为,这其实也是一体两面,也倒逼了中国企业必须在商业模式和产品形态上进行更多创新。因为没法“烧钱跑模式”,那就只能一开始就想怎么赚钱。你会看到,美国的公司可能在大模型的科研层面走得更快,但在产品化落地、商业模式探索上,反而是中国企业走得更实、更快。

这其实也是中国传统互联网和移动互联网企业的一贯优势——在这些领域,我觉得中国企业的进步是非常快的,这些领域也是我们中国企业能够大显神通的地方。其实你看中国的移动互联网领域的商业模式创新,美国同行都得学。所以说我觉得在这方面我们还是比较有信心的。

InfoQ:所以说,当年 DeepSeek 出来的时候,很多人还调侃,说这家公司一方面技术不错,另一方面也是因为没别的选择了,只能靠极致优化来降低成本。

方汉:这种情况我们常说“穷人的孩子早当家”。现在我们没法轻易拿到充足的算力资源,那就只能拼命去优化算法。但好在中国最不缺的就是科研人才,尤其是 AI 方向的人才,在数量上中国绝对是全球第一,所以你会发现,我们面临的这些困难,往往最后都能变成推动创新和前进的动力。

InfoQ:想请教一下关于教育的问题。很多年前,大家常常谈论美国教育有多先进,而中国的应试教育似乎存在很多问题。但让人好奇的是,为什么在这样一种应试教育体系下,中国却能培养出如此多的 AI 人才?

方汉:我不是教育学家,没法系统地评价哪个国家的教育质量更好。但作为一名物理出身的理工科背景从业者,我有一个基本判断:很多事情,首先要看“数量”。质量当然也重要,但评判标准比较主观,而数量是客观的、第一性的。比如质量的标准可能是你能否读到博士、硕士,或者本科毕业,这些是阶段性的指标;但从数量来看,最直接的就是每年培养出多少工程技术人才,也就是 STEM 人才,就是工程师。

如果以大学本科毕业生为例,中国每年大约培养出 370 万到 390 万名工程师,是全球第一;第二名是印度,约 320 万;第三名是美国,只有约 80 万。其他国家年产工程师的数量,基本都远低于 80 万。

再看“存量”,中国的工程师总数大约是 6000 万人,而印度是 2000 万人左右。这个庞大的工程师基数,才是中国科技产业爆发的根本原因。也就是说,存量 6000 万工程师,然后每年还以 370 万到 390 万的速度增长,这才是说美国人没法跟中国去竞争世界工厂的原因。正是因为有这样的人才供给,中国才能成为“世界工厂”。说起世界工厂的迁移,我认为全球最后只有两个国家有可能,一个是中国,一个是印度,其他国家都没戏。因为工程师数量不够,这是一个铁律。世界工厂要看两个核心要素:一是电力供应,二是人才供应。在这两个方面,中国都是全球第一。

当然,如果再看科研层面,比如博士这个维度,中国确实还与美国存在差距。我们来看博士存量:目前中国大约有 110 万博士,而美国大概是 340 万,这才是中美在高端科技人才方面的差距所在。不过这个差距正在快速缩小。过去,中国每年大概培养 9 万名博士,美国也是 9 万。但今年,中国的博士招生数已经达到 17 万,意味着未来几年内,我们的高层次科研人才储备也将快速赶上。如果放眼全球,除了美国的 340 万博士以外,其他国家——比如德国、日本等——大多只有 60 万到 80 万。也就是说,从整体科研力量来看,中国已经稳居世界第二。

但在 AI 这个特定领域,情况又有些不同。AI 是我们并不落后的一个关键技术领域。前面我也提到,我经常看 AI 领域的论文,十篇里至少有八篇有中国人署名,华裔博士在 AI 领域可能占据六成以上。甚至可以说,在 AI、CS 等特定方向,中国博士的数量可能已经超过美国。所以我认为,中国在 AI 领域不落后的根本原因,就是我们在这一领域具备强大的人才基础和快速增长的科研力量。

InfoQ:之前有一个段子说,在硅谷创业时,如果团队里有一个华人工程师,投资人可能会犹豫,因为“那谁来干活呢?”这当然是个玩笑。

我们刚刚也聊到“出海”这个话题。昆仑万维作为一家上市公司,目前 94% 的收入来自海外,在出海这条路上可以说走在了前列。因此,很多也在布局出海的企业会非常关心你们的经验。能否请方老师介绍一下,昆仑万维目前在出海方面是否形成了相对成熟的方法论?有哪些经验可以分享?

方汉:谈不上非常成熟的方法论,但我们确实在出海这条路上走得比较早、时间也比较长。总结下来,我认为有几个关键点:

第一,选市场。这个其实本质上不复杂,可以从人均 GDP 来做初步判断。T0 市场无疑是欧美日韩,这些地区人均收入高,付费能力强;T1 市场包括中东、东南亚和南美;T2、T3 市场则是像南亚、非洲等人均收入相对较低的地区。不同类型的企业要根据自身业务的特点选择适合自己的市场。对我们这种做软件和互联网的企业来说,T0 和 T1 市场更适合,T2、T3 做起来会困难很多。

当然,除了看市场本身的潜力,还要看竞争情况。竞争激烈的地方,资源实力不足的企业可能很难打得进去。那就可以从竞争较小的地区切入,从边缘市场起步。选市场,这是第一步。

第二,我认为一定要强调本地化,要做到强烈的本地化。这里说的本地化,不是指产品运营或研发的本地化,而是指需求的收集和本地运营,这一点必须做好。如果不了解当地用户的需求,就没办法做出好产品。比如说,企业的经营者最好能够常驻当地,同时也要在本地组建一支优秀的团队,由本地员工来负责需求收集、市场开拓和客户支持等工作。

我认为本地化非常重要。但现实中,很多中国企业由于处在自己的“舒适区”,存在一些天然障碍:比如英语水平有限,或者不懂当地的小语种,就不愿意走出去,更倾向于留在国内,或者去东南亚这些华人较多、相对熟悉的地方。我觉得要跳出舒适区,尽可能去一些市场潜力大、但中国企业相对较少涉足的地区。在这些地方,竞争往往也会小一些。所以我认为,第二个关键点就是:真正把本地化做好。

第三,我觉得其实和是不是出海没有太大关系,关键还是要做好产品的差异化,也就是差异化竞争。同时,在商业模式上要多做创新,能够快速实现商业化的平衡。我认为,基本上也就是这些要点,差不多都围绕在这几个方面。

InfoQ:您现在一年大概有多长时间在国外?

方汉:以前出国的时间比较多,最近因为 AI 的研发主要在国内,所以待在国内的时间相对多一些。不过在我们开拓某个新市场的时候,确实会在当地呆很久。比如我们当初在非洲开市场时,我在尼日利亚就待了将近三个月,还是挺艰苦的。

InfoQ:那三个月里,你一般都会做些什么?

方汉:主要就是和当地人交流,收集本地信息。很多信息只有到了现场你才会知道,比如我们到了之后才了解到,当地网络普及情况是全国覆盖了 3G,而大城市则普及了 4G。3G 和 4G 的网络差异会影响我们的技术策略,比如我们后来就发现使用 QUIC 协议、TCP、UDP 这些,在当地网络环境下非常有帮助,成功率提升得很明显。

InfoQ:像这种情况,让工程师过去亲身感受不就可以了吗?

方汉:工程师的感受和管理层的感受是不一样的。我觉得华为有句话说得特别好——“让听得见炮声的人呼唤炮火”。如果你不在第一线,就很容易产生认知偏差,只有真正身处前线,才能消除这种偏差。

对企业的一把手来说,还是应该多去前线,最好是能和当地一线工程师直接沟通。因为受限于公司架构,一线工程师往往没办法直接向管理层反馈。但如果你亲自到了现场,大家能坐在一起沟通,很多问题就能直接解决了。所以我觉得,多去当地、深入一线是非常重要的。

4 当年网站能换奥迪,如今网页 200 块一单,AI 也逃不过这条老路

InfoQ:这也让大家更有信心了。但与此同时,其实 AI 赛道也有很多质疑,比如大家会说模型太贵、用户留存难、场景也难以跑通。你怎么看待这些声音?

方汉:AIGC 商业化落地其实相对比较简单。我认为 AIGC 的用户容忍度是比较高的。比如你生成一张图,可能多长了一根手指或者少了一根手指,或者视频里手的动作有点歪,其实用户都是比较能接受的。但如果是用在严肃任务场景,比如财报分析,那就完全不一样了。如果出错一个小数点,可能就是巨大的运营损失。所以我觉得 AIGC 的应用场景是相对更容易落地的。

另外,在 AIGC 相关领域,比如图像、音乐、音效这些,技术水平已经可以达到人类 95% 左右的能力,替代人类工作已经相对容易。但像视频这类复杂的内容,现在可能只能达到人类百分之五六十的水平,还没有达到可大规模替代的门槛。所以我认为 AIGC 领域的确是更容易先跑出来的方向。

至于你说的 AI 的商业模式,其实我觉得天底下没有什么新鲜事。关键是如何用传统经验,在 AI 领域不断摸索出适合自己的商业模式。C 端这边可能还是要烧钱、跑马圈地;而 B 端虽然见效快、能带来收入,但增长相对慢。

我觉得对于那些经历过移动互联网创业的人来说,AI 的商业模式没有什么本质区别。互联网刚兴起那会儿,做一个网站都能换辆奥迪,成本也挺高的,但互联网不也发展起来了么?我经常开玩笑说,任何技术都有一个“白菜化”的过程——早期都很贵,后来就便宜了,现在写个网页挣 200 块钱都很正常。

所以说,AI 现在确实很贵,但我相信它的价格会迅速下降,这是技术发展的必然路径。

InfoQ:为什么现在很多 AI 生成的视频长度往往只有 5 秒左右,有的最多也就 8 秒?背后的主要原因是什么?

方汉:这其实还是模型本身的局限性,不是因为算力问题。目前主流的视频生成模型在训练阶段,通常是将视频裁剪成 5 到 8 秒的小片段来训练的。所以在生成的时候,也只能生成 5 到 8 秒的视频。超过这个长度后,生成就会变得不可控,导致质量下降,所以才受限在这个范围内。

但这个问题其实并不难解决。比如我们在 SkyReels 这个短剧模型上就做了一些改进,现在已经可以一次性生成长达 40 秒、带剧本的视频了。其实现在已有很多优化方法可以应用,我相信随着视频模型的快速迭代,这个问题很快就能被解决。

InfoQ:那你怎么看待未来的发展?比如说现在短视频基本上是一分半到三分钟不等,您觉得大概什么时候我们能做到:我给一个脚本,模型就能快速生成一个完整的三分钟视频?

方汉:我认为快的话 1 到 2 年内就可以完全实现。如果慢一点,那可能是指电影级别的内容,那可能要 3 到 5 年。像您说的这种 1 到 2 分钟的短视频,我觉得在 1 到 2 年内,AI 就能完全胜任,甚至可以完全替代人工制作。

InfoQ:对于很多做短视频的来说这是一个福音。另一个问题,您提到了 B 端的“降本增效”和 C 端“谁能更高效地供给多巴胺”这两条路径,您认为这两条路都非常可行。那您怎么看,真正可行的突破口大概在哪里?

方汉:C 端肯定是视频,我之前说过,视频是“文盲也能看懂”的,对吧?而短剧是一种新的娱乐形式。所以我认为视频领域最大的突破口就是短剧。

最早落地的一定是广告,因为广告一般就 15 秒左右,而广告素材的需求是无穷无尽的。大多数广告平台都是支持你一口气上传几万个素材,然后平台通过算法不断地测试、爬坡,最终爬出一两个爆款。这正是 AI 生成内容非常适配的场景。

第二个是短剧市场。短剧基本上单部剧也就 5 分钟,都是竖屏的,对产品的精细度要求也不高,非常适合 AI 生成。最难的当然是电影,因为电影对精度的要求最高。所以我觉得这是个“先易后难”的过程,先从容易的领域突破。

B 端其实是内容制作工具这条线。我觉得这块谈不上“突破口”不“突破口”,更多是它的商业模式天花板比较有限。比如说内容制作工具的天花板,大概就是 Adobe 全家桶这种水平。Adobe 一年也就一两百亿的收入规模,所以我觉得这块是一个比较稳健的市场,但它的天花板不会特别高。

InfoQ:我想引申一个话题。现在很多做 SaaS 的公司也在尝试加入 AI,你认为 AI 能够“拯救”整个 SaaS 行业吗?

方汉:我觉得 SaaS 行业的问题不在于“拯救”不“拯救”。美国 SaaS 公司确实是一个好生意,但在中国 SaaS 模式问题就相对多一些。我觉得主要还是和竞争态势有关,跟有没有 AI 加持关系不大。

AI 能提升效率,这是肯定的。但 SaaS 这个模式,更多的是行业的使用习惯。在中国,这种行业习惯本身对 SaaS 的发展就不太有利。我认为中国市场的特殊性是导致 SaaS 行业不景气的根本原因,而不是 AI 有没有加持的问题。

InfoQ:那从用户的销售习惯、使用习惯来看,SaaS 有可能迎来所谓的“春天”吗?

方汉:我觉得挺难的。但 AI 出现之后,反而可能带来一个新的局面。中国人一向倾向于“自己搞一套”,那么未来可能每个企业都用 AI 去定制一套属于自己的 SaaS。

如果企业想拥有一套自己的系统,以前做定制开发很难,现在有了 AI 的加持就变得更容易了,私有化部署反而会因为 AI 的加持而蓬勃发展。我个人是这么看的。而且以前系统集成公司是没什么编程能力的,现在有了 AI,他们也可以做定制开发了,这其实是个很大的变化。

InfoQ:那新一代创业者崛起后,因为他们思想更西化、也更能接受 SaaS 模式,会不会带来一些变化?

方汉:云厂商不也在年年增长嘛,对吧?所以我觉得每个市场都有自己的特点。中国的主体用户也在逐步转变,整个 IT 信息化过程也在持续推进。我个人认为,SaaS 在中国起不来的根本原因,还是企业的信息化程度不够。信息化是基础,只有先实现了信息化,才有可能进一步走向 SaaS 化。所以这个过程其实也在逐步改善中。

5 从 Linux 到大模型:开源精神与商业价值的三十年演进

InfoQ:接下来几个问题可能和你十几年前做 Linux 的经历比较相关。你作为中文 Linux 的奠基人之一,三十年前就开始推动开源,强调工程师的自治和共享精神。现在,在大模型时代,包括昆仑万维也在推广自己的开源大模型。在这两波浪潮中,你认为开源的核心驱动力和生态格局发生了哪些重要变化?

方汉:三十年前我还是一个很纯粹的工程师,就是埋头干活那种。而现在作为一家上市公司的负责人,我更多是从商人和企业的角度来看待这些事情。但我觉得,三十年前我们推动开源,更多是一种朴素的共享精神。

那时候我们觉得写代码就应该互相共享,最牛的程序员像 Linus Torvalds、Richard Stallman,让我学到了很多东西。可以说,三十年前的开源是基于学习兴趣、出于对技术的热爱产生的朴素共享精神,这在全球范围内其实都是一样的,没有太大区别。

到了三十年后,我们会发现,开源已经和商业结合得更紧密了。以前我们搞开源的,看不上闭源,对商业化也有些抵触。但今天再回头看,我们会发现,其实开源也是一种非常好的商业模式。比如 MongoDB、Spark 这些都是从开源发展起来并最终上市的。

尤其是现在整个云计算产业,几乎完全是建立在开源基础设施上的。从企业的角度来看,开源有两个特别大的好处。

第一个好处是:它能满足大量长尾需求。一个行业里一定存在大量用户需求,但企业不可能面面俱到,你只能满足主流需求。对于那些长尾需求,企业自己甚至都不知道具体是什么、在哪里,因为距离太远。但如果用开源模式,那些拥有一定能力的用户,就可以基于你的开源代码进行二次开发或修改,来满足他们自己的长尾需求。久而久之,社区也就形成了。

这样一来,在满足长尾需求方面,开源产品的迭代速度就会远远快于闭源产品。

我举个例子:基于 Stable Diffusion,ControlNet、Railway 这些二次开发产品就让开源生态在迭代速度上反超了闭源产品,因为它能快速满足多样化、定制化的需求。

而且,满足长尾需求后,还会带来很强的用户粘性。比如现在 GPT-4o 已经推出了新的图像编辑能力,但很多企业内部的文生图链路依然是基于此前的开源服务构建的。这就是因为开源满足了他们特定的需求,让他们绑定在了这个平台上。

所以我认为,开源是满足长尾需求的唯一方式。

第二个好处是:开源可以带来大量销售线索。为什么这么说?因为开源项目虽然好用,但并不是每个用户都有能力在本地部署、买很多推理卡来自己用。那怎么办?他肯定还是要找供应商,而第一选择就是开源项目的发布者,因为他们最懂这个产品。

比如我们的 SkyReels 短剧生成大模型开源之后,就带来了大量订阅用户。很多人试用了模型,觉得不错,但又觉得自己部署太麻烦,就直接订阅了我们官方提供的 API 服务。这个量是暴涨的,而且遍布全球。

对初创企业来说,这种“销售线索”是极其宝贵的。你去一个个跑客户很难,买流量也贵得离谱,现在流量成本已经让很多公司承受不起了。而开源就像一个天然的引流入口,为你带来真实的使用者和潜在客户。

所以现在中国也出现了很多基于开源的成功企业,比如我们投的 PingCAP,中国最好的数据库公司之一,他们就是靠开源获得了大量销售线索。

总结两点:第一,开源是满足长尾需求的唯一办法;第二,开源可以为商业模式带来大量高质量的销售线索。这两点,是企业选择拥抱开源的重要理由。完全可以说,在商言商,开源是值得做的好生意。

InfoQ:PingCAP 是我们 TGO 最早期的会员之一,东旭还是我们 TGO 硅谷分会的会长。刚才我们聊到开源,在 Linux 时代,这种模式是成立的——我们可以看到,它从最初的理想主义驱动,逐步演变成全球关键产业的基础设施。那么你怎么看大模型的开源?它会不会也出现类似的发展路径?

方汉:大模型和当年还是有点区别的。因为大模型的训练目前需要大量的算力和基础设施,成本仍然比较高。不过我认为,随着算法不断优化、Scaling Law(扩展法则)逐渐放缓,训练大模型未来是有可能慢慢变得平民化的。到那时候,真正的大模型开源也会迎来爆发。

打个比方,在 Linux 的早期,它为什么能发展起来?是因为 PC 的普及——一开始所有 Unix 系统都运行在小型机上,普通人是接触不到的。这跟现在的大模型场景其实挺像的。但当 PC 这种廉价硬件出现后,人人都能自己装个 Linux,玩起来了。

我认为大模型也会走向类似的局面——一旦硬件成本降低、算法效率提升,未来可能只需要自己买一台机器,就能自己训练和跑模型。那个时候,大模型的开源生态就会真正大规模涌现出来。

InfoQ:你刚才也提到,大模型开源正在迅速平民化。但这里有一个很关键的问题,我们也观察到,很多开源社区越来越受到大公司和算力结构的主导。有人因此认为,这其实是一种“类开源”甚至“伪开源”的趋势。你怎么看待这种对 AI 开源生态的质疑?

方汉:我觉得这种质疑是很正常的。因为现在大多数所谓的开源,并不开放数据,也不开放训练方法,更多是从论文层面发布,最终开源的主要是模型权重,但即使是这样,对于真正想基于这些成果去做商业化的人来说,有了权重,其实就已经足够用了。我们行业内都明白这一点。

所以我认为这种开源现状,对从事 AI 创业的人并没有什么本质影响。至于从学术角度来说,你是不是一定需要拿到代码和数据,才能真正学会和复现,那是另一个问题。现在的确是,想通过别人的训练代码和数据来深入学习训练方法变得更困难了,这是客观现实。

但我们也在推动一些改变。比如我们公司就开源了 Skypile,这是目前最好的中文开源数据集之一。开源数据集的增长速度其实是最快的。另外,现在每年也有大量论文发布,很多论文背后也附带了开源代码。总体来看,我觉得这个局面是在逐步改善,生态也在朝着更好的方向演进。

InfoQ:昆仑万维是如何在基础主权和生态之间保持平衡,同时保持技术核心竞争力,并营造开源生态的?

方汉:其实比较简单,不用刻意去想闭源能保持多久的优势。更多时候,应用创新、产品模式创新和商业模式创新才是关键。这些创新其实和开源、编程关系不大。我们拥抱开源,但真正的核心竞争力还是在产品创新和商业模式创新上。

我们的护城河,除了技术之外,主要还是市场份额。用户的使用习惯才是最重要的护城河。最终用户其实不太关心你背后用的是什么技术,他们关心的是自己的用户体验是不是最好。

InfoQ:现在开源已经成为趋势,大家都在走开源路线。您在开源领域也待了很多年,您觉得未来开源模式还需要改进哪些方面?或者目前有哪些做得还不够好的地方?

方汉:我觉得目前的问题是,现在做 AI 算法的人太多了,但真正把开源产品推向市场的领导者却比较少。为什么强调“产品上市”?因为用户和开发者的需求,往往和做算法、做模型的人是南辕北辙的。怎么打通这中间的关系非常关键。

举个例子,Stable Diffusion 生态里,ControlNet、Railway 这些开源项目之所以受欢迎,是因为它们抓住了用户的痛点,比如可控性、分层、光线追踪等。这些精准解决了商业用户的需求,所以用户才大量采用它们的开源方案。

所以我觉得,单纯做算法研究,如果没有产品意识,做出来的东西往往是“叫好不叫座”。一个算法既叫好又叫座才是最重要的,而要做到“叫座”,一定要有产品思维。没有产品思维,是做不出受欢迎的产品的。

我建议,现在做开源的同学,还是要从用户需求出发去做东西。早期的开源作者,比如 Linux,就是因为看到了用户需求——PC 上没有好用的操作系统,才去做的。而有些开源项目,如果固步自封,不重视用户需求,结果就不好。

比如最著名的 X Server,用户体验差、性能慢、功能支持不足,最终被 Wayland 取代,这也是顺理成章的。

你会发现很多开源项目能持续活跃,是因为它们最能满足用户需求,且对需求响应迅速。比如 FFmpeg、QEMU 这些项目,至今依然活跃,正是因为作者快速响应用户的需求。

6 “AI 这波浪潮里我也很痛苦,但不学就会被时代甩下”

InfoQ:我能从方老师身上看到,一个典型的技术人、程序员,如今成长为一家上市公司的负责人、董事长兼 CEO。你觉得在这几十年的历程中,有哪些让您感触特别深的地方?对现在很多技术人员来说,上升通道应该怎么走?您有什么建议可以分享?

方汉:首先我觉得,对于我们所有技术人员来说,很多人选择技术这条路,就是因为技术工作相对纯粹,不用跟人打太多交道。但如果你一直这样,其实很难走得更高。说实话,要往上走,不是“对付人”的问题,而是你需要提升自己对产品的理解,对商业的思考。你作为一个程序员,如果不去思考你做出来的东西到底是谁在用,那你就很难做出真正好的产品。

所以我认为,所有做技术研发的人,一定要训练好自己的产品思维和商业思维。这个才是能让你走得更高、看问题角度更全面的重要原因。

我觉得想走上去的人,不一定要擅长和人打交道,但你一定要愿意接触用户,要愿意思考客户需求,要理解商业模式。你可以不跟人打交道,但你必须和“用户”打交道,必须多思考商业模式和产品模式,这样你才能走得更远。

第二点,我觉得就更直接了。在这一波 AI 浪潮里,我个人感觉非常痛苦。为什么?因为全是全新的知识,我以前也没学过,那怎么办?说实话,唯一的办法就是每天读论文、每天和别人交流,从中获取新的知识。

我的感受是,如果我这一波不这么拼命去学,我肯定就被淘汰了。对吧?所以第二个建议就是:要终身学习、拥抱变化。否则你真的会被落下,变成那个“马车夫”。

你想,我就像一个马车夫,看到汽车来了,我赶紧去学怎么开车——现在总算会开车了,对吧?那我觉得自己被淘汰的风险就小一些。

所以总结一下,我认为两个最关键的点:第一是要熟悉产品和商业模式,第二是要拥抱变化、终身学习。这两点对所有程序员来说,都是需要长期坚持的习惯。

InfoQ:最后一个问题,很多人说 AI 是这一代技术人的终极一战。首先,你认不认同这种说法?另外,站在今天这波技术浪潮的前沿,您最想对年轻一代的技术人说些什么?

方汉:第一个,我觉得“终极一战”这个概念,某种程度上是自己吓自己。技术总是在不断演进的。爱因斯坦之后量子力学发展出来了,但这是不是物理的终点?显然不是,之后还会有新的理论、新的逻辑。人类的认知是一直在进化的,一旦停止进化,也就意味着这个文明的终结。所以我不认同“终极一战”的说法,我觉得不存在这种事。

大家不用焦虑。说到底,这件事取决于你能活多久。你活得越久,就越可能看到下一轮技术的变化。我认为 AI 的这波浪潮,的确是一个将持续二三十年,甚至三四十年的长期趋势。但如果你活得够久,也许还能看到下一波浪潮的到来。

至于年轻人,我觉得这代年轻人有一个显著特点:他们从小接触的信息比我们那个年代多太多了。他们不是在电脑上长大的,而是在移动互联网、甚至是 AI 时代长大的。他们获取信息的速度、质量、广度,远超我们这一代。

但他们也面临一些问题,这些问题不完全是他们自身造成的。我觉得现在最大的问题是信息高度碎片化、媒体化。很多人已经没有耐心去看长篇大论的内容了。我们观察到,短剧兴起的一个很重要原因,就是短视频把大家的注意力从两个小时压缩成了几分钟。这种碎片化,会对年轻人在学习上的专注力造成影响。

我们常说,小孩如果不能集中注意力,就无法好好学习。那放在成年人身上也是一样的道理。所以我觉得,对于年轻人来说,在这个碎片化、信息爆炸的时代,如何找到适合自己的、甚至是高效的学习方法,是每一个人都需要去钻研的事情。

因为一个人最终能到达的高度,关键就在于你的学习速度。而今天的碎片化内容,反而在某种程度上拖慢了我们的学习效率。这是一个值得每个人深思的问题。

今日好文推荐

53万美金训练出顶级AI?揭秘MiniMax的「省钱」绝招

国产芯片比英伟达整体效率更高!?华为 CloudMatrix384 超节点首曝论文,跑 DeepSeek 效率超越英伟达

多模态需求井喷,智能视频云如何靠分布式处理破局?

从 3 个月业余项目到全球第一语言!Python 之父坦言:当年“将就”的代码,如今全都真香了

6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!