业界动态

再造“DeepSeek时刻”:中国大模型的集体突围与梁文锋现象

2025-07-31 11:36:49 快照小生 阅读:129
再造“DeepSeek时刻”:中国大模型的集体突围与梁文锋现象

7月底的上海,酷热之外的热闹来自WAIC(世界人工智能大会)。作为近年来规格最高、规模最大的AI盛会,2024年的WAIC不仅吸引了参展商暴涨60%,连AI领域的“教父”辛顿也首次现身,令会场门票一度炒至千元一张。某种意义上,这已成为国内AI公司最接近全球聚光灯的一刻。

而在热浪之下,一场围绕“谁能复制DeepSeek”的隐形较量正悄然展开。

“DeepSeek之路”能否重走?

7月11日,月之暗面发布Kimi K2,引发不小震动。其采用万亿参数的MoE混合专家结构,总参数达1.04万亿,激活参数则控制在320亿,成功在效率与能力之间找到平衡。行业普遍认为,K2架构本质上是DeepSeek-V3的“同门兄弟”,甚至有开发者表示,“Kimi K2基本是DSv3的复刻版,只是更狠地拉满了参数。”
这不是唯一一个沿袭DeepSeek路径的国产模型。7月28日,智谱推出GLM-4.5,宣称“挑战全球巨头”,并选择走开源路线。更早前,MiniMax、阶跃星辰也均回归基础模型研发,言语之间,DeepSeek几乎成了“行业共识”。
从研发哲学、模型结构到开源逻辑,越来越多中国AI公司正在不约而同地“借鉴”DeepSeek,但复制容易,超越极难。

DeepSeek到底改变了什么?

在正式推出R1模型前,DeepSeek长期是圈内的“隐秘高手”。其口碑并非来自营销轰炸,而是实打实的技术积累与价格战策略。甚至最早的API价格战,就是由DeepSeek率先打响的。
公司本身低调至极——几乎不对外融资,没有公关团队,CEO梁文锋极少露面,更多存在于同行口中的传说里。罗永浩曾在一次活动中提到他,“远远看去就像个读研的程序员。”
DeepSeek之所以能一战成名,关键在于其绕开了行业对“烧钱堆算力”的路径依赖。它选择强化下游能力,通过高强度RL训练(强化学习)倒逼模型优化策略。相比那些在预训练阶段就砸钱豪赌的公司,DeepSeek更像是AI时代的“务实派”,用手艺人式的打磨换来了实用场景下的惊艳表现。

新爆点:下一个“o1”在哪里?

当前大模型赛道,仍处在一个“后o1时代”——即OpenAI发布GPT-4(即o1)之后,行业出现的集体技术迭代。
DeepSeek R1正是基于此节点,以独特的MoE结构和强化学习策略,掀起国内模型范式革新。而如今,包括Kimi、智谱、MiniMax等纷纷试图打造属于自己的“R1时刻”,但要想实现下一个“技术阶跃”,难度比复制前人路径要高出几个量级。
更大的挑战来自预期之中的“GPT-5时刻”。据称,该版本预计在2025年8月前后问世,不再是单一任务的性能升级,而是尝试将推理、多模态交互、智能体逻辑全面整合,构建真正的“统一智能系统”。
GPT-5或将取消当前需要用户手动选择不同模型(如4o、3.5)的界面,转而由系统智能调度。比如在用户提出复杂代码问题时,模型可自动激活更强的推理引擎,反之则用轻量模型处理闲聊与应答。
这对中国模型厂商而言,既是压力也是机遇:一方面必须紧跟OpenAI技术节奏,另一方面也需找出属于自己的“硬核创新点”,而不是永远作为追随者。

不是人人都能成为DeepSeek

在“模仿DeepSeek”逐渐成为行业默认操作时,真正具备创新精神与执行能力的公司,其实并不多。
比如Kimi在K2中坦言,“在结构实验阶段,几乎所有不同于DSv3的架构设计都未能显着超越,最终决定不再‘为了不同而不同’。”这种务实态度值得肯定,却也说明当前技术发展已触碰短期天花板。
阶跃星辰更像是另一种范式实验者,其多模态策略被寄予厚望;字节跳动则在幕后频频调整路线,张一鸣本人也在全球多地调研,寻求突破口。
但问题的核心从未改变:没有自己的“o1时刻”,就无法真正改变格局。

写在最后:梁文锋不是终点,是起点

如果说OpenAI代表着AI行业的“美式梦幻路径”,那么DeepSeek则代表了“技术本位”的中国可能。
它不讲故事,不拉融资,不靠人设,只用模型说话。其CEO梁文锋几乎成了这个行业最低调却最具象征意义的人物:既是AGI信仰者,也是执行派代表。
越来越多企业开始意识到,真正的爆点不在短期流量或一场展会,而在于有没有扎实的技术方法论与长期主义的组织能力。DeepSeek之后,中国大模型的“黄金窗口期”也许就只剩下最后一年。谁能成为下一个被全行业“模仿”的对象?或者说,谁能被别人致敬?
答案仍未揭晓,但时间已经开始倒数。

相关文章

小米“太子”王腾突遭辞退:从荣耀巅峰到黯然离场
业界动态

小米“太子”王腾突遭辞退:从荣耀巅峰到黯然离场

2025-09-11 18:29:57 阅读:27
东方甄选扭亏为盈,自营业务成亮点,但挑战才刚开始
业界动态

东方甄选扭亏为盈,自营业务成亮点,但挑战才刚开始

2025-09-09 16:02:26 阅读:44
养了一个月AI宠物,我看清了这门“新生意”的真相
业界动态

养了一个月AI宠物,我看清了这门“新生意”的真相

2025-09-08 16:35:40 阅读:47
百度 百度热点
抖音热榜 抖音热榜
新浪微博 新浪微博
今日头条 今日头条
腾讯新闻 腾讯新闻
知乎热搜 知乎热搜
36氪 36氪
雪球网 雪球网

最新帖子

节省90%时间的网站搭建方案:网站克隆工具详解
产品运营

节省90%时间的网站搭建方案:网站克隆工具详解

2025-09-12 11:57:50 阅读:24
出海品牌别栽在 “翻译” 上:一个词错译,可能丢了亿级全球市场
用户研究

出海品牌别栽在 “翻译” 上:一个词错译,可能丢了亿级全球市场

2025-09-12 11:40:17 阅读:23
抖音 “银发浪潮”:中老年用户活跃度反超年轻人,背后藏着怎样的数字生活革命?
数据分析

抖音 “银发浪潮”:中老年用户活跃度反超年轻人,背后藏着怎样的数字生活革命?

2025-09-12 11:21:30 阅读:22
399元买“豪门闺蜜圈”?向太直播卖课背后的生意经
产品运营

399元买“豪门闺蜜圈”?向太直播卖课背后的生意经

2025-09-11 20:41:05 阅读:27
小米“太子”王腾突遭辞退:从荣耀巅峰到黯然离场
业界动态

小米“太子”王腾突遭辞退:从荣耀巅峰到黯然离场

2025-09-11 18:29:57 阅读:27
数字未来三大核心:生成式 AI 重构消费、平台韧性扛住风险、专业投资赢得先机
用户研究

数字未来三大核心:生成式 AI 重构消费、平台韧性扛住风险、专业投资赢得先机

2025-09-11 10:44:41 阅读:21