| 代码 | 名称 | 当前价 | 涨跌幅 | 最高价 | 最低价 | 成交量(万) |
|---|
在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。
这篇论文由DeepSeek联合北大、清华共同撰写 ,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案 。
具体来说,新论文介绍了一个名为DualPath的创新推理系统 ,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升1.87倍 ,在线服务的每秒智能体运行数平均提升1.96倍。
论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划 、调用工具 ,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互 ,交互轮次可达数十甚至数百轮 。
上下文会跨轮次累积,最终长度可能达到极值。此时模型不需要大量计算,反而需要频繁从硬盘读取历史上下文的 KV-Cache;现有系统中 ,只有负责预处理的引擎会读取KV-Cache,它的网卡带宽被占满,而负责生成内容的解码引擎,网卡带宽基本闲置 ,导致整个系统速度被卡脖子。
因此,论文提出的DualPath,针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑 ,解决大模型做智能体任务时,速度被 “数据读取 ”拖慢的核心问题,重要的是把闲置的带宽资源利用起来 ,相当于给数据读取“多开了一条高速路”,实现速度的大幅提升 。
这一论文成果延续了DeepSeek一贯的风格,在工程化层面将性能优化推向极致。有从业者认为 ,DeepSeek做这类优化属于缺显卡的无奈之举,属于“脏活儿累活儿”,大家更期待团队在模型上做创新。
但也有人认为 ,即便有足够显卡,这类优化在降低成本、降低token费用方面也很有价值,因为只有足够便宜,AI才能走向大规模使用 。
相比这篇“务实”的论文 ,外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间,市场传闻已几经更迭。从最初传闻的2月春节前后,到外媒最新报道的“最快下周 ” ,再到业内人士预测的3月前后,传闻链条愈发扑朔迷离 。
就在近日,外网有网友爆料称 ,DeepSeek 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100万tokens ,并原生支持多模态推理。也有消息提及,DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权,以支持其优化处理器软件 ,确保模型在硬件上高效运行。然而,英伟达等厂商尚未获得类似权限 。
面对传闻,DeepSeek依旧保持其一贯的沉默,目前并未进行任何回应。但市场已进入“严阵以待”状态 ,部分投资机构担忧,新一代模型的发布会如同去年的版本发布时那样,引发市场的剧烈震荡。
(文章来源:第一财经)
股票配资公司一起配资网:正规配资平台有哪些-全球市场:纳指、标普携手英股创新高 比特币刷新纪录高位 加密货币概念股普涨
正规配资门户网站:有哪些正规股票的加杠杆平台-AI周报:DeepSeek论文登上《Nature》封面 英伟达宣布50亿美元入股英特尔
北京正规的股票配资公司:正规的股票配资平台-比DeepSeek风暴还惨烈!一文读懂:华尔街“抛AI”妖风祸从何来?
正规股票配资公司:实盘股票杠杆平台有哪些-彻底沸腾!暴涨超24%!AI突传重磅 摩根大通火线发声!
官网股票配资:正规合法的股票配资平台-DeepSeek-R1开创历史 梁文锋论文登上《自然》封面
股票配资公司平台:正规炒股平台有哪些-新一轮牛市已在路上?华尔街纷纷给美股定下高目标价
还没有评论,快来说点什么吧~