国产办公室秘书无码精品99_免费无码中文字幕A级毛片_AA区一区二区三无码精片_久久青青草原亚洲av无码app

會員登錄 - 用戶注冊 - 設為首頁 - 加入收藏 - 網站地圖 DeepSeek的一次小更新:暴打OpenAI 追上Gemini!

DeepSeek的一次小更新:暴打OpenAI 追上Gemini

時間:2025-12-04 00:38:29 來源:企業錄(www.zj28.net)-公司信息發布,網上買賣交易門戶 作者:探索 閱讀:371次

壞消息,次打開源模型和閉源模型的小更新暴差距越來越大了。

好消息,次打DeepSeek 又出手了。小更新暴

12 月 1 日,次打DeepSeek 發布了兩款新模型 —— DeepSeek V3.2 和 DeepSeek-V3.2-Speciale。小更新暴

前者和 GPT-5 能打的次打有來有回,后面的小更新暴高性能版更是直接把 GPT 爆了,開始和閉源模型天花板 —— Gemini 打了個五五開。次打

還在IMO 2025(國際數學奧林匹克)、小更新暴CMO 2025(中國數學奧林匹克)等一系列比賽中拿下金牌。次打

這是小更新暴這家公司今年第九次發布模型,雖然大家期待的次打 R2 還沒有來。

所以,小更新暴DeepSeek 是次打怎么用更小的數據,更少的顯卡,做出能和國際巨頭來抗衡的模型?

我們翻開了他們的論文,想把這件事給大家講清楚。

為了做到這個目標,DeepSeek 又整了不少新招:

先是把咱們的老朋友 DSA —— 稀疏注意力給轉正了。

這東西在之前的 V3.2-EXP 版本里出現過,當時只是測了一下 DSA 會不會影響模型的性能,現在是真的把這玩意給放到了主力模型上。

大家平時和大模型聊天的時候會發現,你在一個對話框里聊的越多,模型就越容易胡言亂語。

甚至聊的太多了,還會直接不讓你聊了。

這是因為大模型原生的注意力機制導致的問題,在這套老邏輯的影響下,每個 token 出來,都要和前面的每一個 token 互相算在一起做一次計算。

這就導致了句子增長一倍,模型的計算量就得增加到原來的四倍,如果邊長到原來的三倍,計算量就變成了原來的九倍,非常麻煩。

DeepSeek 想這樣不行啊,于是就給大模型里加了固定頁數的目錄(稀疏注意力),相當于幫模型劃重點了。

而在有了目錄之后,以后每次只需要計算這個 token 和這些目錄的關系就行了,相當于就是看書先讀目錄,看完目錄,對哪一章感興趣,再去仔細看這章的內容就好。

這樣一來,就能讓大模型讀長文的能力變的更強。

在下面這張圖里可以看到,隨著句子越來越長,傳統的 V3.1 的推理成本是越來越高。

但是用上了稀疏注意力的 3.2 則沒什么變化。。。

屬于是超級省錢冠軍了。

另一方面,DeepSeek 開始重視起了開源模型的后訓練工作。

大模型這一套從預訓練開始,到考試打分的過程,其實有點像是我們人類從小學開始,一路讀書讀到高考的過程。

前面的大規模預訓練,相當于從小學到高二,把所有課本、練習冊、卷子全過一遍,這一步大家都差不多,不管是閉源模型,還是開源模型,都在老老實實的念書。

但到了高考沖刺階段就不一樣了,在模型的后訓練階段,閉源模型一般都會請名師,猛刷題,開始搞起各種強化學習,最后讓模型來考一個不錯的成果。

但開源模型在這塊花的心思就比較少了,按照 DeepSeek 的說法,過去的開源模型在訓練后階段計算投入普遍偏低。

這就導致這些模型可能基礎能力是已經到位的了,但就是難題刷少了,結果導致考出來的成績不太好。

于是,DeepSeek 決定這次自己也要上名師輔導班,設計了一套新的強化學習協議,在預訓練結束后,花了超過總訓練算力的 10% 來給模型開小灶,把之前缺的這塊給補上。

同時還推出了個能思考超長時間的特殊版本 —— DeepSeek V3.2 Speciale。

這玩意的思路是這樣的:

過去的大模型因為上下文長度有限制,所以在訓練的時候都會做一些標注懲罰的工作,如果模型深度思考的內容太長了,那就會扣分。

而到了 DeepSeek V3.2 Speciale 這兒,所以 DeepSeek 干脆取消掉了這個扣分項,反而鼓勵模型想思考多久就思考多久,想怎么思考就怎么思考。

最終,讓這個全新的 DeepSeek V3.2 Speciale 成功的和前幾天爆火的 Gemini 3 打的有來有回。

此外DeepSeek 還很重視模型在智能體方面能力。

一方面,為了提高模型的基礎能力,DeepSeek 構建了一個虛擬環境,合成了成千上萬條數據來輔助訓練。

DeepSeek-V3.2 用 24667 個真實代碼環境任務、50275 個真實搜索任務、4417 個合成通用 agent 場景、5908 個真實的代碼解釋任務做后訓練。

另一方面,DeepSeek 還優化了模型使用各種工具的流程。

以前幾代 DeepSeek 的一個典型毛病是:會把思考和用工具給分開。

模型一旦去調用外部工具,前面那段思考基本就算寫完收工了,等工具查完結果再回來,它往往又要重新鋪一遍思路。

這就導致一種很蠢的體驗——哪怕只是去查一下“今天幾月幾號” 這種小事,模型也會從頭開始重建整套推理鏈,非常浪費時間。。。

在 V3.2 這里,DeepSeek 忍不了了,直接把這套邏輯推翻重做。

現在的規則變成:在一整串工具調用的過程中,模型的“思考過程”會一直保留下來,只有當用戶發來一條新的提問時,才會重置這一輪推理;而工具的調用記錄和結果,會像聊天記錄一樣一直留在上下文里。

通過這修改模型架構,重視后訓練,強化 Agent 能力的三板斧,DeepSeek 才終于讓自己的新模型,有了能和世界頂尖開源模型再次一戰的能力。

當然,即使做了這么多改進,DeepSeek 的表現也算不上完美。

但托尼最喜歡 DeepSeek 的一點,就是他們愿意承認自己的不足。

而且還會直接在論文里寫出來。

比如這次論文就提到了,這次的 DeepSeek V3.2 Speciale 雖然能和谷歌的 Gemini 3 Pro 來打的五五開。

但是要回答相同的問題,DeepSeek 需要花費更多的 token。

我自己也測試了一下,從“人類的最終考試” 的題庫里隨便抽了道題目,同時丟給 Gemini 3 Pro 和 DeepSeek V3.2 Speciale 這兩個模型。

題目是:

蜂鳥類在足形目中獨特地擁有雙側成對的橢圓形骨,這是一種嵌入在膨脹的十字翼腱膜的尾狀骨中,嵌入壓低多粒骨的尾狀骨。這塊籽骨支撐著多少對對腱?請用數字回答。

結果發現 Gemini 只要 4972 個 Tokens 就能把問題給答出來。

而到了 DeepSeek 這邊,則用了 8077 個 Tokens 才把問題給搞明白。

光看用量的話,DeepSeek 的的 Tokens 消耗量高了快六成,確實是有不小的差距。

但是話又說回來了。

DeepSeek 雖然消耗的 token 多,但是人家價格便宜啊。。。

還是剛才那個問題,我回頭仔細看了眼賬單。

DeepSeek 8000 多個 tokens,花了我 0.0032 美元。

但谷歌這邊,5000 個 tokens 不到,給我干掉了 0.06 刀?這塊要比 DeepSeek 高了有 20 倍了。

從這個角度上來看,怎么感覺還是 DeepSeek 更香一些。。。

最后,讓我們回到論文的開頭。

正如 DeepSeek 所言,最近半年來,開源模型和閉源模型的差距正在不斷加大。

但他們還是用自己的方式,在不斷追趕這份差距。

而 DeepSeek 的各種節省算力,節約數據的操作,其實讓我想到了上個月,一場關于 Ilya Sutskever 的訪談。

這位 OpenAI 曾經的靈魂人物認為,只靠一味的給模型堆參數,是沒有未來的。

AlexNet只用了兩塊GPU。Transformer剛出現時的實驗規模,大多在8~64塊GPU范圍內。按今天的標準看,那甚至相當于幾塊GPU的規模,ResNet也一樣。沒有哪篇論文靠龐大的集群才能完成。

比起算力的堆砌,對算法的研究也一樣重要。

這正是 DeepSeek 在做的事情。

從 V2 的 MoE,到 V3 的多頭潛在注意力(MLA),再到如今 DeepSeek Math V2 的自驗證機制,V3.2 的稀疏注意力(DSA)。

DeepSeek 展現給我們進步,從來都不是單一的,依靠堆砌參數規模所帶來的提升。

而是在想辦法,如何用有限的數據,來堆積出更多的智能。

巧婦狂作無米之炊

所以,R2 什么時候來呢?

(責任編輯:焦點)

相關內容
  • 真我15 Pro《權力的游戲》限定版國行官宣:12月8日正式發售
  • 國產超節點操作系統將于2025年底正式上線
  • 國內外乒乓球愛好者樂聚南京 “為愛益起乒”
  • 專家學者:“遷臺記憶”檔案印證兩岸歷史淵源
  • 單輪1000馬力!奔馳打造全球最強輪轂電機原型
  • (粵港澳全運會)綜合消息:潘展樂捍衛榮譽 香港七橄隊摘金
  • 盤點你沒見過的筆記本貓膩:看完恍然大悟
  • 2025年國際藝術體操邀請賽收官 中國小花斬獲季軍
推薦內容
  • 《瘋狂動物城2》總票房破21億:徹底引爆電影市場
  • 派拉蒙籌備《星際迷航》新片
  • 希臘男子為打賭生吞整個漢堡后進ICU:醫生直言基本沒救了
  • (粵港澳全運會)乒乓球成年組首金出爐 林高遠/劉詩雯混雙奪冠
  • 日本北海道根室半島附近海域發生5.2級地震 多地有震感
  • 阿什利體模Cos《漫威爭鋒》隱形女 太性感撩人了
国产办公室秘书无码精品99_免费无码中文字幕A级毛片_AA区一区二区三无码精片_久久青青草原亚洲av无码app

      大荫蒂性生交片| 91aaa精品| 久久婷婷中文字幕| 日本熟妇人妻xxxx| 中文字幕在线观看日 | 久久久亚洲精品无码| 亚洲第一天堂久久| 黄色片视频在线播放| 国产精品自拍合集| 无码中文字幕色专区| 天天操天天爱天天爽| 国产肉体ⅹxxx137大胆| 九九九九九国产| 一女被多男玩喷潮视频| 成人在线观看www| 中文字幕av不卡在线| 欧美成人xxxxx| www.在线观看av| av不卡在线免费观看| 亚洲一级免费在线观看| 日韩欧美亚洲天堂| www.成年人视频| 久久久久久久久网| 在线观看日本一区二区| www.xxx亚洲| 久久综合九色综合88i| 17c丨国产丨精品视频| 国产精品12p| 手机av在线网站| 潘金莲激情呻吟欲求不满视频| 色一情一乱一伦一区二区三区日本| 无码播放一区二区三区| av免费看网址| 久久99久久久久久| 国产精品日韩三级| 日韩欧美视频免费在线观看| 好色先生视频污| 国产av不卡一区二区| 青青草原国产免费| 中文字幕av久久| 蜜臀av.com| 91免费视频污| 97人人爽人人| 污网站在线免费| 色www免费视频| 日日噜噜噜噜久久久精品毛片| 黄色一级一级片| 日韩视频免费在线播放| 精品久久久久久无码国产| 黄色一级大片在线观看| 亚洲精品中文字幕无码蜜桃| 久久国产乱子伦免费精品| 国产精品少妇在线视频| 91在线视频观看免费| 欧美男女交配视频| 91丨九色丨蝌蚪| 亚洲一区二区中文字幕在线观看| 波多野结衣网页| 免费久久久久久| 日本a级片在线播放| 国产日本在线播放| 国产极品粉嫩福利姬萌白酱| 久草青青在线观看| 国内自拍视频网| 亚洲欧美日韩一二三区| 中国一级大黄大黄大色毛片| 亚洲色成人www永久在线观看| 日韩在线综合网| 91国产精品视频在线观看| 中文字幕精品一区二区三区在线| 中文字幕第一页亚洲| 97视频在线免费| 国产日韩成人内射视频| 在线免费黄色网| 精品国产一区二区三区无码| 国语对白做受xxxxx在线中国| 日韩大片一区二区| 国产内射老熟女aaaa| 国产l精品国产亚洲区久久| 亚洲第一狼人区| 成人毛片100部免费看| 国产精品秘入口18禁麻豆免会员| 亚洲第一狼人区| 欧美中文字幕在线观看视频| 成人在线观看a| 黄色a级三级三级三级| 无码 制服 丝袜 国产 另类| 欧美精品性生活| 日本福利视频网站| 婷婷六月天在线| 欧美极品少妇无套实战| 免费看a级黄色片| 麻豆传媒网站在线观看| 熟女人妇 成熟妇女系列视频| 黄色免费高清视频| 日韩av在线综合| 日本女人高潮视频| 黄色一级大片在线观看| 国产精品igao激情视频| 日韩肉感妇bbwbbwbbw| 精品一区二区三区无码视频| 黄色aaa级片| 黄页网站大全在线观看| 波多野结衣国产精品| 99热在线这里只有精品| 国产盗摄视频在线观看| 蜜臀视频一区二区三区| 青青青青在线视频| 欧洲在线免费视频| 国产女女做受ⅹxx高潮| 免费看欧美黑人毛片| 91看片破解版| www日韩在线观看| 国产美女主播在线播放 | aaa一级黄色片| 亚洲精品无码久久久久久| 在线观看成人免费| 午夜在线观看av| 欧美在线观看www| 麻豆映画在线观看| 手机免费看av网站| 中文字幕欧美人妻精品一区| 日本a视频在线观看| 99热这里只有精品7| 岛国毛片在线播放| 国产情侣av自拍| 能在线观看的av| 老太脱裤子让老头玩xxxxx| 午夜啪啪福利视频| 亚洲黄色片免费看| www.久久av.com| 欧美三级理论片| 国产97色在线 | 日韩| 草草久久久无码国产专区| av网站手机在线观看| 国产精品无码电影在线观看| 欧美日韩亚洲国产成人| 亚洲人视频在线| 午夜视频你懂的| 成年人免费大片| 免费在线观看毛片网站| 国产资源在线视频| 国产原创中文在线观看| 日韩精品久久一区二区| 蜜桃网站在线观看| 国产精品久久久影院| 免费成人进口网站| 国产av第一区| 亚洲精品天堂成人片av在线播放 | 国产一级片黄色| 日本成人在线免费视频| 成人一级片网站| 国产l精品国产亚洲区久久| 免费国产黄色网址| 欧美综合在线播放| www国产黄色| 91在线视频观看免费| 奇米影音第四色| 日本免费色视频| 黄色a级三级三级三级| 精品日韩在线播放| 日韩美女爱爱视频| 国产精品无码av在线播放| 久久久久久久激情| 天天爱天天操天天干| 久久久精品高清| 中文字幕第一页亚洲| 污污污污污污www网站免费| 国产自产在线视频| 99热成人精品热久久66| 成年网站在线播放| 亚洲男人天堂2021| 欧美交换配乱吟粗大25p| 成年人看的毛片| 日本三级免费观看| 色婷婷.com| 亚洲中文字幕无码一区二区三区| 日韩五码在线观看| 狠狠热免费视频| 成人免费黄色av| 男的插女的下面视频| 37pao成人国产永久免费视频| 天天爽夜夜爽一区二区三区| 肉色超薄丝袜脚交| 国产九色porny| 欧美一级片中文字幕| www.桃色.com| 国产美女主播在线播放| 亚洲激情在线观看视频| 国产农村妇女精品久久| 免费无码毛片一区二三区| 天堂av在线网站| 亚洲高潮无码久久| 日韩av在线综合| av不卡在线免费观看| 91传媒久久久| www.亚洲自拍| 日日碰狠狠添天天爽超碰97| 无尽裸体动漫2d在线观看| 青青草国产免费|