
春节将至,科技圈的年味不是饺子香,而是算力燃烧的"烟火气"。
就在大家忙着抢回家的车票时,AI江湖却传来重磅战报:DeepSeek V4即将在春节前后发布,内部测试显示其代码生成能力已超越OpenAI的GPT和Anthropic的Claude两大国际顶尖模型。这不是演习,而是国产大模型在底层技术架构上的一次"弯道超车"。如果把AI比作新能源汽车,之前的我们还在讨论续航里程,现在DeepSeek直接换了一块固态电池。
一、DeepSeek V4的"记忆革命":给AI装上海马体
要说这次DeepSeek V4最硬核的技术突破,得从Transformer架构的"阿喀琉斯之踵"说起。当前所有主流大模型,从GPT-4到DeepSeek-V3,本质上都是Transformer架构。这尊"AI神坛"有个致命缺陷:没有原生知识查找机制,像个只能靠死记硬背应付考试的学生,而不是精准翻找笔记的学霸。
1月13日,DeepSeek创始人梁文锋署名的新论文悄然上线,提出了名为"Engram"(记忆痕迹)的条件记忆模块。这项技术就像给大模型装上了生物级的海马体,让AI真正实现了"过目不忘"。更关键的是,1月21日开发者在DeepSeek开源的FlashMLA代码库中发现了28个"MODEL1"相关引用,证实这项技术已集成到即将发布的V4模型中。
如果说Engram解决了"记不住"的问题,那么另一项名为"mHC"(流形约束超连接)的技术则解决了"算不准"的难题。传统超连接架构在模型扩大时会面临信号增益失控的问题,就像高速公路车速越快越容易失控。DeepSeek的mHC技术相当于给这条路装上了红绿灯,将放大倍数从3000倍严格控制在1.6倍左右。在27B参数模型的测试中,这项技术让复杂推理任务准确率从43.8%提升到了51.0%,而训练时间仅增加6.7%。
这意味着什么?DeepSeek V4将能处理超过100万token的超长上下文,相当于一次性理解整本《红楼梦》并记住每个人物的细微关系。对于程序员来说,这意味着可以一次性将整个大型项目的代码库输入AI,而不用担心它"忘"了前面定义的变量和函数。这种"项目级全局感知"能力,正是当前GitHub Copilot和Cursor等AI编程工具最缺乏的。
二、国产AI芯片"真武"出世:算力自主化再进一步
就在DeepSeek亮出软件底牌的同时,硬件层面也传来好消息。1月29日,阿里巴巴旗下平头哥半导体正式发布"真武810E"AI训练推理一体芯片。这款曾在2025年9月央视新闻中意外出镜的PPU芯片,性能定位介于英伟达A800和H20之间——恰好是目前国内能合法采购的最高端AI芯片区间。
这相当于在高端显卡的"铁幕"上撕开了一道口子。虽然单卡性能尚未完全比肩英伟达最新旗舰,澳洲幸运5app下载但"真武"系列的意义在于证明了国产AI芯片在先进制程受限的情况下,依然可以通过架构创新实现可用、好用。配合阿里云此前宣布的未来三年3800亿元云计算和AI投资计划,这意味着从芯片到云服务的全栈自主化正在加速成型。
华为方面也不甘示弱。1月初的消息显示,华为昇腾人工智能芯片2025年出货量增长了四分之一,并已调整销售价格策略应对市场变化。中芯国际正在全力推进2纳米节点技术研发,2025年投资额高达300亿美元。天数智芯在1月26日发布了激进的三年路线图,宣称2026年将推出对标甚至超越英伟达Blackwell架构的芯片。
三、大厂"春节档"混战:Kimi开源、字节加码、百度备战
除了DeepSeek这个"搅局者",其他国产AI玩家也在春节前密集出牌。
1月27日,月之暗面正式发布并开源了Kimi K2.5模型,宣称这是Kimi迄今为止最智能、最全能的模型。与DeepSeek V4的"闭源蓄力"不同,Kimi选择了开源路线,在Agent、代码、图像、视频等多模态任务上全面发力。这就像是Android对iOS的策略——用开源生态对抗闭源精品。
字节跳动则在1月29日的全员会上亮出了AI战略底牌。CEO梁汝波将2026年关键词定为"勇攀高峰",称AI至少是"PC+Web"级别的高峰,短期目标就是"豆包/Dola助手应用"。更值得注意的是,字节计划2026年投资140亿美元购买英伟达芯片。这个数字是什么概念?相当于把一座中型城市的年度财政收入全部砸向算力基建。这种"大力出奇迹"的打法,显示出字节不甘心在AI时代只做流量分发者,可提现游戏平台app而是要成为底层规则制定者。
百度方面,旗下昆仑芯已在元旦期间正式向港交所递交上市申请,估值达210亿元人民币,是目前国内估值最高的人工智能芯片设计公司之一。这意味着百度正在将AI芯片业务独立资本运作,效仿阿里平头哥的路径,打造软硬一体的AI生态。
四、A股映射:哪些公司站在技术浪潮之巅?
对于二级市场投资者而言,技术突破最终要落到上市公司业绩层面。从这波AI技术浪潮中,我们可以梳理出几条清晰的投资主线:
{jz:field.toptypename/}第一,算力基建线。阿里三年3800亿元的投资不是小数目,将直接利好数据中心建设和运维服务商。数据港作为阿里云核心合作伙伴,有望承接大量数据中心建设订单;万国数据在第三方数据中心领域布局深厚,也将受益于云厂商资本开支扩张。此外,浪潮信息作为国内服务器龙头,将持续受益于AI服务器需求爆发。
第二,华为昇腾生态线。随着华为昇腾芯片出货量持续增长,产业链上下游公司将迎来业绩释放期。拓维信息作为华为昇腾生态的重要合作伙伴,在AI服务器和智能计算中心领域布局深入;软通动力凭借与华为的深度绑定,在AI应用开发和系统集成方面具备先发优势;中芯国际作为华为芯片的代工方(通过N+3工艺),虽然面临技术挑战,但国产替代逻辑明确。
第三,AI应用落地线。阶跃星辰近期宣布获得超50亿元融资,并引入千里科技董事长印奇出任董事长,显示出AI大模型与产业资本加速融合的趋势。科大讯飞的星火大模型在教育、医疗等垂直领域持续渗透;同花顺、东方财富等金融科技公司正将AI能力深度整合到投顾服务中;用友网络、金蝶国际则在企业级AI应用方面布局已久。
第四,端侧AI线。随着Kimi K2.5等开源模型推动轻量化部署,端侧AI应用有望迎来爆发。瑞芯微、全志科技等在AIoT芯片领域具备优势;漫步者、科大讯飞等在智能语音交互硬件方面布局完善;中科创达作为智能操作系统龙头,将受益于端侧AI对操作系统智能化升级的需求。
五、结语:从"跟跑"到"领跑"的技术自信
回望2025年,DeepSeek R1以557万美元的低成本训练实现对标GPT-4的性能,曾引发全球科技市场震动。如今V4还未发布,Reddit技术板块72小时10万条讨论、X平台48小时2000万次话题阅读量的热度,已经显示出全球开发者对这款"中国智造"的期待。
更重要的是,DeepSeek代表的技术路线——通过Engram记忆架构和mHC超连接优化,而非单纯堆叠参数和算力——正在证明:中国AI公司完全可以在底层架构创新上与硅谷巨头同台竞技。这就像是新能源汽车时代的"换道超车",当传统巨头还在内燃机(算力堆砌)的红海里厮杀时,我们已经悄然布局三电系统(架构创新)。
春节档的这场AI大战,表面是模型性能的比拼,实则是技术路线自信的象征。当DeepSeek V4在代码生成能力上真正超越GPT-Claude双雄时,国产AI将从"可用"走向"好用",从"替代"走向"引领"。对于A股市场而言,这不仅是概念炒作,而是新一轮生产力革命的开端。
毕竟,在AI这个赛道,代码才是最好的财报,算力才是最硬的资产。春节快乐,但别忘了关注这场可能改变行业格局的技术发布——因为最好的投资,永远发生在大多数人还在吃年夜饭的时候。

备案号: