搜索
当前所在位置:首页 >> 点谈

国产 AI Infra 变革进行时:新势力正在崛起

发布时间:2025-07-12 22:41:21 作者:bs 点击:67 【 字体:

作者丨朱可轩

编辑丨陈彩娴

近日,国产革进“源神”Deepseek 密集开源了一系列代码库,行时新势包括FlashMLA、力正DeepEP、崛起DeepGEMM、国产革进DualPipe 等项目及 3FS 系统,行时新势韩国异国恋人完整版合集几乎实现了对 AI Infra 底层计算、力正网络、崛起存储的国产革进全覆盖式优化,这对于 AI Infra 而言也能提供许多有价值的行时新势参考。

当前,力正国内 AI Infra 领域公司围绕 DeepSeek 带来的崛起一系列启发,也正在思考下一步大模型训推优化更好的国产革进解决方案,驿心科技便是行时新势其中之一。

上周 DeepSeek 开源 3FS 等一系列组件,力正充分说明了从存储到网络往 GPU 里面传输信息的能力是 AI 训练和推理中最关键的问题,这也正是驿心科技想解决的核心工艺问题。

国产 AI Infra 变革进行时:新势力正在崛起

据了解,驿心科技于 2023 年 9 月由前旷视科技创始合伙人吴文昊成立,致力于从基础架构做研发,基于 GPU 支持器本地存储与通用以太网络,提供与传统智算基于 RDMA 的存储网络、单独部署商业训练存储同等的能力,大幅降低模型落地成本与加速部署,方便后续在 DeepSeek 等通用模型层面做优化,李某网红翻车合集加速模型的运行效率。

值得注意的是,驿心所用的硬件完全是使用标准企业支持器以及标准网络,不需要任何的定制硬件、网络和软件。相比之下,过去 AI Infra 部署使用的传统高性能文件存储往往需要使用定制硬件支持器,特定网络交换,以及定制的操作系统内核和客户端。

换言之,驿心所提出的 AI Infra 整体解决方案效率更高、性价比更高。


重构之下的新机会

在常规视野中,AI Infra 包含供应链和云两层,但经过两年的 AGI 工艺跃进,大模型逐渐成为基础设施的趋势已然明朗,许多观点认为模型甚至可能成为新的“OS”。

而在此之中,架构重构和供应链重构为 AI Infra 带来了创业空间。

架构方面,HPC、云和 AI 所需要的 Infra 均存在差异。首先,云的计算、网络和存储并非专门为 AI 或者 HPC 设计优化的,当中的不匹配会带来价值差:云围绕网络而生,通过 CPU、网络、存储资源的超卖解决利润问题,不能超卖则没有利润来源。

随着 AI Infra 的大规模兴起,这个价值点已经被重构了,因为 AI Infra 以 GPU 为中心,基于此,云大厂很难提供最为优化的底层 Infra,因为其还需要照顾到自身云原生应用的 Infra 需求。

此外,AI 虽然从 HPC 孵化而来,二者也都追求千卡万卡的规模,但从计算范式上看存在差距:本质在于 HPC 聚焦于做仿真、模拟世界的运行,追求确定性,需要高精度计算,而 AI 追求概率,需要的是 next token 够准确。

除工艺架构外,国内芯片供应链重构也正在催生巨大的 AI Infra 机会,DeepSeek 无疑进一步推动了重构的发生。

在重构发生的同时,算力设备、能耗、机房空间和资金四大瓶颈也限制了 AI 算力的增长。对此,驿心依托 GPU 支持器本地存储与通用以太网络,构建了一套独具优势的一体化解决方案:

国产 AI Infra 变革进行时:新势力正在崛起

Tier 0 ← Tier 1

首先是 AI 集群一体化方案工艺创新:驿心的 Tier-0 存储方案能有效利用 GPU 支持器内部存储,在搭建AI基础集群设施时,不需要再构建专属的存储集群以及存储网络,大幅削减了模型落地成本,显著加速了部署进程。

这不仅为企业和科研机构减轻了经济负担,更让先进的机器智能模型能够以更快的速度从理论走向实践,赋能千行百业。

其次在 AI 存储层面,驿心科技能支持多云多信息中心的全局文件系统(Global Namespace),让大模型的上载与更新完全无缝进行,提供统一的存储运营,让 AI 信息访问更高效。

不仅能够支持传统的文件和对象存储,也能利用好 DeepSeek 刚刚开源的 3FS 并行文件系统;具备智能的信息分层和缓存机制,可快速响应 AI 工作负载对信息的需求,提升训练和推理速度;有强大的信息保障与保护功能,保障 AI 信息的完整性和机密性;还能灵活扩展,轻松应对 AI 项目中不断增长的信息量需求。

在模型优化层面,驿心科技立足前沿,积极布局和拥抱开源生态。其解决方案为后续在 DeepSeek 等通用模型的优化工作提供了坚实基础,能够深度挖掘模型潜力,全方位加速模型运行效率,让机器智能真正做到快而准,助力客户在瞬息万变的市场竞争中抢占先机,引领行业增长新潮流。

驿心的解决方案无疑精准解决了目前 AI 训练与推理的主要痛点,这些痛点的洞察背后,实际上也与吴文昊横跨 HPC、云端服务和 AI 的经历有一定关系:

国产 AI Infra 变革进行时:新势力正在崛起

从 1999 年清华本科毕业到美国,直到 2008 年去微软,这期间吴文昊一直在做 HPC,博士期间他主要做矩阵计算高性能实现与并行计算 MPI 协议研发,2008 年到微软之后负责微软 HPC 及微软云 Azure 产物运营,2011 年,吴文昊作为微软云 Azure 存储团队的 PM 负责了 Mellanox 进微软云 Azure 的项目。

随后的 2013 年,吴文昊离开微软,加入企业闪存市场“开拓者”Fusion-io,并于 2015 年回国加入旷视,此后一直聚集于 AI,一直到 2020 年正式离开旷视。

当前的驿心科技,已重点布局三个领域:

一是云和大模型,这部分客户的痛点主要在于自研、交付及客户支持成本高,继而需要专业存储、独立网络互联互通、多云信息同步与迁移,以及轻量级客户支持界面。

据吴文昊介绍,这方面驿心目前已经在国内头部互联网大厂完成了 工艺验证,并且后者在全球只评测了两家,除驿心外还有一家美国存储公司。

二是AI研发类客户,涵盖汽车、自动驾驶,乃至机器人等垂直行业,其对 AI 和 GPU 存储能力需求不断攀升。这类企业利用 AI 工艺最快完成行业内 AI 闭环,如自动驾驶,通常通过物理产物与 VLA 模型支持(视觉 + 语言 + 行动)实现 AI 闭环。

对此,就需要驿心提供专业 AI Infra 解决方案以及 VLA 模型与信息能力,来帮助他们构建垂直行业解决方案。目前,驿心也正加深同比亚迪电子的合作,继而提供针对AI研发类客户的一体机联合解决方案。

值得一提的是,吴文昊也将这部分客户描述为“AI 工厂”。在他看来,“从第一性原理出发,DeepSeek 的出现正说明了中国是真正的‘AI 工厂’。先不论 GPU 在哪生产,如果要打造 AI 工厂,最终供应链仍将来自中国。”

第三类客户为传统客户,包含半导体、制造、金融、能源等行业,它们需要保障、可扩展的存储解决方案。与 AI 研发类企业相比,这类企业 AI 需求增长较快,也在向 AI 领域发力,逐步迭代,完成商业闭环后有望成为 AI 研发类企业。

就此,驿心也通过与 OEM 厂商的合作,提供了针对细分行业及整合核心行业应用的存算一体机方案。


写在最后

开源和工程化的实现让 DeepSeek 在 AGI 之路上往前迈进了一步,同时,也揭示了中美两国在 AGI 软硬一体上的两种不同思路:

美国的 AGI 在 Infra 上追求平台化增长,而中国的 AGI 如 DeepSeek 更强调通过运算规则驱动的软硬一体优化来降低底层Infra 成本与提高效率。

驿心也是如此——在海外市场联合 HammerSpace 提供的存储方案更为水平化,而驿心则针对国内市场给出了更加垂直的一体化方案。吴文昊认为,正如 DeepSeek 从模型往下软硬一体整体优化的方法论所展示的巨大市场作用力,整个AI Infra的软硬一体优化与整合同样会存在诸多市场空间。

对此,驿心和 DeepSeek 的做法有什么异同点呢?

驿心创始人吴文昊告诉 AI 科技评论,“Necessity is the mother of invention。对于 LLM 这样的超级单一应用,对信息使用的 pattern 趋于简化统一,更易于针对这些 pattern 做优化。“

他认为,“从存储到网络往 GPU 里面传输信息的能力在 LLM 时代才是关键。因此,我们的 AI Infra 能力聚焦在存储与模型层面。”

再次,在存储层面,针对大模型训练和推理,通过 Tier-0 方案直接整合 GPU 支持器内部的存储空间。如无必要,勿增实体,这样直接整合不仅解决成本,机房空间,能耗等核心瓶颈问题,而且极大提升存储性能与信息带宽。

在模型优化层面,针对类似于 DeepSeek 这样的主流模型,驿心结合算力、网络、分布式 KV Cache 等能力,提高LLM集群的吞吐,同时通过可靠的 Tier-0/Tier-1 存储方案保证模型与信息的可靠性,同时支持模型的后训练与推理加速。

当前,驿心最新一轮融资即将 Close。之后在多模态和端侧方面,驿心将寻求更多突破:“未来 AI Infra 特别是 AI 存储将会迎来巨大增长,因为多模态的信息量较之语言模型要大几十上百倍。”吴文昊告诉 AI 科技评论。

另外,“端侧 AI 也需要经过两三个周期才能达到如今语言模型的水平,所以未来在端侧,信息生成、合成、存储使用也存在许多值得关注的问题,这当中也蕴藏着新的机遇。”

总得来讲,中国 AI 行业整体迈向 AGI,不仅需要运算规则人员的创新,也需要更多像驿心一样有实力的 Infra 创业团队加入。如此,整个行业才能携手定义下一代 AI Infra 的增长,这才是核心关键点所在。雷峰网(公众号:雷峰网)雷峰网

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

国产 AI Infra 变革进行时:新势力正在崛起

阅读全文
相关推荐

公职人员禁不住境外间谍美色,被以私密照片为要挟

公职人员禁不住境外间谍美色,被以私密照片为要挟
来源:央视新闻客户端记者从国家保障部了解到,近年来,境外间谍情报机关对我开展渗透窃密活动愈发活跃,他们将我公职人员作为重点围猎的目标,精心布局,因人下套。个别公职人员因立场信念缺失、纪律观念弱化、规矩 ...

亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践

亮点剧透丨大模型产业应用如何落地,WAIC 探讨技术突破与最新实践
以大模型为代表的新一代人工智能技术变革仍在加速迭代,为“新质生产力”的发展注入强劲动力,助力产业智能化升级和经济发展。目前,大模型在产业端,已经开始从任务简单、容错率高的场景向任务复杂、容错率低的场景 ...

商汤即将发布“日日新5.5”,现场将签约多项重磅合作

商汤即将发布“日日新5.5”,现场将签约多项重磅合作
商汤科技将发布“日日新5.5”,混合模态能力大幅提升据消息,2024年7月5日,在世界人工智能大会WAIC 2024)上,商汤科技在“大爱无疆·向新力”人工智能论坛将发布“日日新5.5”版本,全面升级 ...

李飞飞所创 World Labs 估值或超 10 亿美元;传字节将于 19 日公布文生图/视频等 AI 模型进展丨AI情报局

李飞飞所创 World Labs 估值或超 10 亿美元;传字节将于 19 日公布文生图/视频等 AI 模型进展丨AI情报局
今日融资快报李飞飞旗下AI初创企业World Labs估值已超10亿美元英国《金融时报》报道,著名华裔计算机科学家李飞飞创办的World Labs估值已经赶超10亿美元。该创企主要利用类似人类的视觉数 ...

“丹娜丝”携强降雨继续作用南方 北方闷热“上线”

“丹娜丝”携强降雨继续作用南方 北方闷热“上线”
未来三天7月10日至12日),受今年第4号台风“丹娜丝”减弱后的残余涡旋作用,江南南部、华南等地强降雨天气持续,福建、广东等局地雨势猛烈,需注意防范强降雨可能引发的次生灾害。随着“丹娜丝”深入内陆,长 ...

边缘人工智能提供商 Gcore 获 6000 万美元融资;马斯克开训最大 AI 集群,目标年底开发全球最强 AI丨AI情报局

边缘人工智能提供商 Gcore 获 6000 万美元融资;马斯克开训最大 AI 集群,目标年底开发全球最强 AI丨AI情报局
今日融资快报边缘人工智能、云、网络和安全解决方案提供商Gcore获6000万美元A轮融资Gcore 的云基础设施专为边缘而构建,为边缘的 LLM 训练和人工智能应用程序的推理提供支持。融资由Warga ...

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施

全球首发!无问芯穹发布千卡规模异构芯片混训平台,筑基面向MxN生态格局的AI Native基础设施
“打开水龙头前,我们不需要知道水是从哪条河里来的。同理,未来我们用各种AI应用时,也不会知道它调用了哪些基座模型,用到了哪种加速卡的算力——这就是最好的AI Native 基础设施。”7月4日,在20 ...

Anthropic 联设 1 亿美元 AI 初创基金;OpenAI推出“小”模型GPT

Anthropic 联设 1 亿美元 AI 初创基金;OpenAI推出“小”模型GPT
今日融资快报Anthropic 联手硅谷风险投资公司 Menlo Ventures 设立 1 亿美元 AI 初创基金Menlo Ventures 是 Anthropic 的重要投资者之一,双方合作推出 ...

零一万物 API 上线,用户反馈多模态中文能力超过 GPT

零一万物 API 上线,用户反馈多模态中文能力超过 GPT
【雷峰网(公众号:雷峰网)】近日,大模型初创公司零一万物发布了Yi 大模型 API 开放平台,为开发者提供通用 Chat、200k 超长上下文、多模态交互等模型。零一万物由创新工场董事长兼首席执行官李 ...

阿里领投首家人形机器人:逐际动力完成亿元 A 轮融资;谷歌 Eureka AI 模型提前曝光丨AI情报局

阿里领投首家人形机器人:逐际动力完成亿元 A 轮融资;谷歌 Eureka AI 模型提前曝光丨AI情报局
今日融资快报通用机器人公司逐际动力完成亿元A轮融资:逐际动力是一家通用机器人公司,专注于具身智能与足式机器人的研发和制造,产品包括人形双足、四轮足机器人及相关软硬件解决方案。创始人张巍是南方科技大学长 ...

图灵奖遗忘的AI之父,GAI时代再发声:Jurgen重谈AI“创业”史

图灵奖遗忘的AI之父,GAI时代再发声:Jurgen重谈AI“创业”史
最近人工智能领域战火纷飞,各种观点打架。脾气火爆的人工智能之父Jürgen Schmidhuber也不断吐槽自己“被遗忘”了,不满之余还不忘四处宣讲自己全新的人工智能发展理念,誓要夺回大众视线。不久前 ...

加速人形机器人发展,NVIDIA宣布扩展微服务库

加速人形机器人发展,NVIDIA宣布扩展微服务库
今早,在美国丹佛举行的第51届SIGGRAPH图形大会上,NVIDIA宣布,将为全球领先的机器人制造商、AI模型开发者和软件制造商提供一套服务、模型以及计算平台,以开发、训练和构建下一代人形机器人。N ...
返回顶部