久久av免费看,日本久久二区,久久国产精品色av免费看,波多视频一区

首頁 > 原創知識 > 原創知識 > 解析梁文鋒署名DeepSeek新論文:讓記憶和計算分開

解析梁文鋒署名DeepSeek新論文:讓記憶和計算分開

發布時間:2026-01-15 11:34:20 來源: 18638159832

1月12日晚間,DeepSeek發布梁文鋒署名的新論文,主題為《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(直譯為基于可擴展查找的條件記憶:大語言模型稀疏性的新維度),這也是2026開年至今,DeepSeek團隊的第二篇重磅論文。

 

此前,在1月1日發布的論文中,DeepSeek提出一種名為“mHC”(直譯為“流形約束超連接”)的框架,可以有效解決大模型訓練中的穩定性問題。而在本次發布的論文中,DeepSeek聯合北京大學提出了“條件記憶”這一概念,直指當前大語言模型基礎架構Transformer在知識檢索方面存在的低效和算力消耗問題。

 

在這篇論文里,DeepSeek通過創新的Engram(直譯為:記憶痕跡)架構為模型規模化擴展提供了新的技術路徑,若以簡單的比喻來理解,就是DeepSeek設計了一種新架構,將大模型的“條件記憶”和“計算”分開,最終達到了降低錯誤、節省算力的目的。

 

預印本網站上DeepSeek的論文頁面截圖,紅框為梁文鋒名字。

 

大模型“痛點”:簡單問題需要復雜推理,容易“遺忘”

 

許多AI大模型用戶均曾在使用過程中發現過一個現象:AI會偶爾“忘記”自己曾經說過的話。對于這一問題,有AI聊天重度用戶曾對記者表示,可以通過再次“提醒”的方式來讓AI重復記起,ChatGPT等應用也對此進行過設置,讓用戶可以保存一些較為重要的信息到“長期記憶”中。

 

然而,這一切只能“治標”不能“治本”。究其原因,根據美國約翰斯·霍普金斯大學和中國人民大學的研究團隊2025年3月發布的論文《大型語言模型不具備類人工作記憶》(LLMs Do Not Have Human-Like Working Memory),大語言模型所依賴的“上下文窗口”與工作記憶存在本質區別。

 

根據研究人員測試,模型在處理超過5輪的多步驟邏輯推理任務時,會出現關鍵信息丟失的現象,在長文本生成場景下,前文設定的人物關系、情節線索極易發生偏差。

 

在實際應用中,這一缺陷有可能被無限放大。如在企業客服場景,模型無法長期記住用戶的個性化需求;在醫療問診場景,患者此前提及的病史、用藥禁忌可能被忽略;在代碼生成場景,跨文件的函數調用邏輯易出現混亂。可以說,記憶短板已成為大模型從 “通用工具” 邁向 “垂直領域專用系統” 的最大障礙。

 

究其原因,在多輪對話中,早期輸入的關鍵信息會隨著對話輪次增加而逐漸衰減,最終被新信息覆蓋。這種 “答后忘前”的現象,本質是模型的短時記憶無法有效轉化為長期可用的知識。另一方面,密集型注意力計算模式下,記憶存儲與邏輯推理共享算力資源,二者存在天然的資源競爭關系 —— 模型難以同時兼顧 “記住更多信息” 與 “精準完成推理”。

 

這一背景下,DeepSeek則保持了一貫的“省錢”作風,看到了這之中存在的算力消耗問題。梁文鋒署名的新論文表示,語言建模本質上包含兩類子任務:一類是組合式推理,需要依賴深層、動態計算完成;另一類是知識檢索,面向命名實體等相對靜態的內容,理論上可以通過簡單查找更高效地處理。然而,現有Transformer架構缺乏原生的查找組件,遇到這類靜態信息時往往仍要反復調用深層網絡進行重建,從而加劇算力浪費并推高推理成本。

 

DeepSeek在論文中指出,當前主流模型在內部運行方式上仍存在明顯低效。大量固定知識和常見語言模式并不需要復雜推理,但模型在推理時往往仍要通過多層計算重新構建相關信息,導致算力被大量消耗在記憶相關操作上。在長文本和知識密集型任務中,這一問題更為突出,重復靜態信息的重建會增加額外的推理開銷并拉長推理鏈路。

 

首創MoE+Engram雙稀疏軸架構,實現“推理+檢索”分工協作

 

那么,如何解決上述問題呢?

 

根據DeepSeek的論文,研究人員首次將條件記憶(Conditional Memory)作為混合專家模型(MoE)條件計算的互補維度,提出計算與記憶雙稀疏軸的設計思路,這也是此次研究的核心創新點。

 

所謂“條件記憶”,是指模型能夠基于輸入中的局部上下文模式,以常數時間從大規模參數化記憶中檢索并融合靜態知識表示,從而避免在推理過程中反復通過深層計算重建高頻、模板化信息,類似于人類在面對熟悉知識時直接調用既有記憶,而非重新推導。

 

Engram架構示意圖 來源:DeepSeek論文截圖

 

具體而言,條件記憶通過Engram模塊(記憶痕跡)實現靜態知識存儲與動態計算的分離,達成靜態模式的常數時間O(1)查找。其核心邏輯是為語言建模的兩類子任務進行分工:MoE專注處理需要深層思考的組合式推理任務,Engram則依托條件記憶機制負責靜態知識的快速檢索,從架構上優化了算力資源分配,改變了傳統模型用計算模擬記憶的低效模式。當大約20%至25%的稀疏參數預算分配給Engram,剩余部分留給MoE時(75% -80%),模型性能達到最佳。

 

這種稀疏性設計帶來兩大優勢:一是大幅降低算力消耗,靜默狀態的記憶資源不占用計算資源,提升模型運行效率;二是拓展記憶容量,稀疏存儲模式可支持更大規模的知識存入,突破傳統注意力窗口的物理限制。

 

論文給出了這一新方案在準確性上所得到的提升:在長上下文檢索方面,研究人員采用業內公認的兩個長上下文評測基準。實驗結果顯示,在32k上下文長度下,Engram-27B 在多項 Needle-in-a-Haystack(NIAH)任務中顯著優于MoE基線模型,Multi-Query NIAH的準確率從 84.2%提升至97.0%,Variable Tracking從77.0%提升至89.0%。

 

目前,該研究的代碼已開源,DeepSeek團隊在論文最后表示,“我們認為條件記憶函數是下一代稀疏模型中不可或缺的建模基元。”這一表述的背后,是行業對大模型技術演進方向的共識——當參數競賽進入瓶頸期,稀疏性設計將成為提升模型效率與能力的核心路徑,而條件記憶或許可以成為稀疏模型在記憶領域的關鍵突破。

 

在業界猜測DeepSeek下一代模型將于春節前發布的背景下,這篇論文的出現頗具風向標意義,論文提出的技術范式也為大模型的底層架構創新提供了新的思路。

原創知識更多>>

比亞迪海豹07 EV官圖!前臉生動,全新紫色,軸距2900mm定位中型車 前途陸群造車往事:拿著舊船票,找不到新大陸 全新阿爾法S5預售11.28萬起:重新審視年輕人的第一臺轎跑 駕駛BMW iX M70的體驗,竟然能秒殺大部分跑車 三駕馬車齊發力!車市淡季逆勢走強,吉利2月銷量再超20萬 車市承壓 奕派科技逆勢增長 前兩月同比增37% 2月新勢力銷量點評:悲喜并不相通,分化仍是主旋律 2026年從整車業務朝著自動駕駛、無人駕駛出租車、人形機器人等板塊瘋狂傾斜 過年開什么新能源車回家,親戚最不會問? 中東實測翻車,Robotaxi還是有點傻? 大眾Atlas換代在即,設計更新、主打七座SUV市場 無差別普惠 全維度守護 東風風行點亮返鄉路 眾泰的“重啟鍵”,這次真的按下去了嗎? 上汽大眾2026年“七箭齊發”,開啟“大眾更出眾”新篇章 趙明上車,印奇掌舵:千里科技的想象力,又被刷新了? 新起點 新征程 東風汽車奏響躍遷發展強音 特斯拉Cybercab或配備物理充電接口與攝像頭清洗系統 法雷奧斬獲高端汽車制造商車內照明訂單 華為乾崑科技旗艦大六座 寶駿華境S更多信息 外資Tier1廠商內部人士的直言,道破了不少外資零部件企業在華的生存窘境 特斯拉Model Y Juniper尾燈設計引爭議 因反光式布局致車主被警方攔停 合資車的2026:大反攻,還是大潰敗? 從關稅戰到價格承諾,中歐新能源合作開新局? 賦能千行百業|8.68萬元起,鄭州日產金銳騏榮耀上市 德邦穩盈增長被傳日“吸金”120億:公司回應 產品調整限購 解析梁文鋒署名DeepSeek新論文:讓記憶和計算分開 錨定“三化”戰略航向 中國黃金以硬核實力擘畫黃金產業新藍圖 貴州茅臺披露市場化運營方案,公布自營體系零售價格 年營收僅實現微增,老干媽的“后陶華碧時代”怎么辦? 2025年汽車市場|反“內卷”、闖關L3,十大熱詞看行業進化軌跡
久久av免费看,日本久久二区,久久国产精品色av免费看,波多视频一区
激情黄产视频在线免费观看| 日韩综合精品| 国产一区日韩欧美| 黄色在线网站噜噜噜| 国产传媒在线观看| 亚洲精品福利电影| 在线人成日本视频| 三级小说欧洲区亚洲区| 久久中文字幕一区二区| 九九九精品视频| 中文在线а√天堂| 激情欧美日韩一区| 亚洲一区二区三区四区电影| 日韩国产欧美视频| 欧美成人aaa| 日韩精品2区| 国产综合激情| 综合激情视频| 国产亚洲久久| 久久久久久一区二区| 99精品综合| 蜜臀久久99精品久久久久宅男| 日本亚州欧洲精品不卡| 日韩国产一区二| 精品亚洲二区| 在线日韩av| 日本免费在线视频不卡一不卡二| 国产精品乱战久久久| 黑森林国产精品av| 91精品1区| 日韩欧美高清一区二区三区| 国产精品久久久久久av公交车 | 免费看欧美美女黄的网站| 日本亚洲最大的色成网站www| 欧美黄页在线免费观看| 久久久五月天| 视频一区国产视频| 国产亚洲一区二区三区不卡| 在线天堂中文资源最新版| 99国产精品私拍| 69堂精品视频在线播放| 国产精品蜜芽在线观看| 国产亚洲激情| 国产乱码精品一区二区三区亚洲人| 在线亚洲人成| 日本中文字幕不卡| 日本免费久久| 亚洲日本欧美| 午夜欧美巨大性欧美巨大| 天堂久久一区| 秋霞影院一区二区三区| 视频一区日韩| 午夜影院一区| 欧美日韩亚洲一区在线观看| 日韩精品影视| 国产精品一国产精品k频道56| 成人av动漫在线观看| 国产精品亚洲人成在99www| 99精品视频精品精品视频| 日韩激情网站| 红桃视频国产精品| 精品国产欧美日韩| 最近国产精品视频| 午夜精品久久久久久久久久蜜桃| 日韩视频1区| 激情综合激情| 国产欧美午夜| 爽好多水快深点欧美视频| 久久久久免费| 国产日产高清欧美一区二区三区| 香蕉精品视频在线观看| 国精品产品一区| 91亚洲精品在看在线观看高清| 在线视频观看日韩| 精品成av人一区二区三区| 亚洲精品九九| 欧美日韩国产综合网| 97精品国产| 国产精品v日韩精品v欧美精品网站| 久久国产精品久久w女人spa| 高清不卡亚洲| 国产乱人伦丫前精品视频 | 色网在线免费观看| 国产精品嫩模av在线| 老鸭窝毛片一区二区三区| 麻豆精品蜜桃| 国产成人精品亚洲线观看| 日韩高清在线不卡| 爽好多水快深点欧美视频| 欧美日韩在线二区| 国产精品国产一区| 国产伦理一区| 欧美一区不卡| 日韩一区二区三区精品| 久久国产99| 久久久久午夜电影| 国产a久久精品一区二区三区| 青草久久视频| 老司机精品久久| 激情丁香综合| 午夜精品成人av| 中文字幕成在线观看| 精品久久久亚洲| 欧美91在线|欧美| 国产精品亚洲一区二区在线观看| 亚洲精品自拍| 亚洲天堂日韩在线| 一区三区视频| 亚洲欧洲另类| 香蕉精品999视频一区二区| 欧美日韩精品免费观看视完整| 麻豆成人av在线| 美女视频免费精品| 精品视频自拍| 国产成人精品一区二区三区在线| 精品精品国产三级a∨在线| 欧美成人精品一级| 国产精品三p一区二区| 欧美精品国产一区| 久久国产视频网| 国产调教精品| 91av一区| 国产精品三p一区二区| 国产探花一区| 国产精品视频一区二区三区四蜜臂 | 精品在线网站观看| 精品视频网站| 欧美男人天堂| 欧美日韩在线网站| 狠狠干成人综合网| 亚洲欧美日韩国产一区二区| 久久都是精品| 亚洲精品日本| 日本va欧美va精品| 国产美女撒尿一区二区| 精品一级视频| 日本精品黄色| 久久精品国产99久久| 日韩亚洲国产欧美| 午夜在线精品偷拍| 日本va欧美va精品| 国产精品美女午夜爽爽| 国产一区二区色噜噜| 日韩在线中文| 欧美另类专区| 日韩欧美中文字幕在线视频| 国产精品久久久久久久久久白浆| 精品久久中文| 欧美一区二区三区高清视频| 天堂成人免费av电影一区| 日韩av一区二区三区四区| 久久精品99久久久| 日产精品一区二区| 一本一本久久| 欧美亚洲一区二区三区| 久久精品国产在热久久| 久久久久久美女精品| 亚洲一区欧美| 国产精品66| 日韩精品影视| 综合激情五月婷婷| 久久午夜影院| 欧美日韩国产一区二区三区不卡| 在线精品国产亚洲| 青草国产精品| 欧美日韩免费看片| 91成人网在线观看| 欧美一区二区三区免费看| 日韩国产一区二区| 亚洲精品少妇| 久久久久久婷| 免费一级片91| 久久精品免视看国产成人| 欧美亚洲国产一区| 日韩午夜视频在线| 亚洲啊v在线| 亚洲69av| 日韩伦理在线一区| 日本亚洲不卡| 日本久久精品| 中文字幕av亚洲精品一部二部| 国产精品一区二区三区美女| 国产综合精品| 国产激情一区| 国产精品普通话对白| 久久丁香四色| 伊人久久大香线蕉av超碰演员| 国产精品免费大片| 欧美精品黄色| 久久99影视| 亚洲欧美日韩国产| 精品日韩在线| 视频一区日韩精品| 欧美精品高清| 国产私拍福利精品视频二区| 日韩天堂av| 国产精品毛片久久久| 亚洲一区二区成人| 国产伦久视频在线观看| 日韩精品成人|