|
12月2日消息,外頂日前DeepSeek低調發布了DeepSeek V3.2正式版以及長思考加強版eepSeek-V3.2-Speciale,解決命名上繼續小步快跑。差距 但DeepSeek V3.2整體表現不錯,算力受限按照官方的外頂說法,推理類Benchmark測試中達到GPT-5水平,解決僅略低于Gemini-3.0-Pro,差距并拿到了IMO國際數學奧賽、算力受限中國數學奧賽CMO等多個數學比賽的外頂金牌水平。 這兩天從各路大V及網友的解決評測體驗來看,DeepSeek V3.2比之前的差距版本是有很大進步的,考慮到價格的算力受限關系,其綜合表現還是外頂讓人驚喜的。 但也要承認一點,解決DeepSeek V3.2這次沒有達到當前頂級AI的差距水平,編程領域比肩Claude、Gemini-3.0-Pro不太行。 對于當前的情況,DeepSeek官方也是很清楚的,在這次的論文中他們承認了與Gemini-3.0-Pro等閉源大模型有一些局限性,首先是總訓練FLOPS較少,導致世界知識廣度不如領先的專有模型,預計在未來的迭代中通過擴展訓練來解決這一差距。 其他因素還有標記效率要比Gemini-3.0-Pro差,以及解決復雜任務能力不如前沿模型,這些都需要改進基礎模型及訓練后處理方案。 從DeepSeek的表態靠近,V 3.2存在的問題說到底還是3.X版的基座大模型已經有點落后了,要想達到當前的頂級AI水平,需要投入更高的算力和數據。 對于這一點,相信DeepSeek是有準備的,V4及不一定存在的R2今年一直沒發布,但DeepSeek絕對會在準備更強大的算力和數據資源了。 按照之前的慣例,估計今年春節前后DeepSeek V4/R2就要陸續發布了。 |