您的當前位置:首頁 > 時尚 > 科大訊飛登上Nature子刊:AI解化學奧賽題超越人類選手平均水平 正文
時間:2025-12-19 22:35:28 來源:網絡整理 編輯:時尚
近日,國際學術期刊《通訊-化學》Communications Chemistry)刊發了一項引發業界關注的研究成果。來自科大訊飛研究院與認知智能全國重點實驗室的聯合團隊,構建了一套面向化學領域的多模態
近日,科大刊國際學術期刊《通訊-化學》(Communications Chemistry)刊發了一項引發業界關注的訊飛研究成果。來自科大訊飛研究院與認知智能全國重點實驗室的登上聯合團隊,構建了一套面向化學領域的解均水多模態評測基準,系統檢驗了當前主流大模型的化學科學推理能力,并首次揭示了AI在處理科學圖像時存在的奧賽“視覺失配”現象。
這一發現被認為對未來科學智能的題超發展具有重要參考價值。
讓AI“看懂”化學圖表,越人難在哪里?類選
化學研究離不開分子結構式、反應機理圖、手平實驗裝置示意圖等視覺信息。科大刊與普通圖像識別不同,訊飛理解這些科學圖像需要AI同時具備符號解析與邏輯推演能力——這恰恰是登上當前多模態大模型的薄弱環節。
研究團隊構建的解均水USNCO-V評測基準,收錄了二十余年美國化學奧林匹克競賽中的化學473道圖文結合題目,覆蓋分子結構、實驗裝置、反應曲線等多種類型。這一基準填補了AI for Science領域在化學視覺推理系統性分析方向的空白。
測試結果:頂尖模型超越人類選手平均成績
研究對包括GPT-5、OpenAI o3、Gemini-2.5-Pro在內的40款主流多模態大模型進行了系統評估。結果顯示,表現最佳的GPT-5以93.2%的準確率位居榜首,顯著超越參賽選手44.6%的平均成績。
然而,研究也發現了一個耐人尋味的現象:部分模型在移除圖像輸入后,答題準確率反而提升。這一“視覺干擾效應”表明,當前AI在處理科學圖像時,視覺與語言模塊尚未實現真正的協同工作。
業內專家指出,這一發現對于改進下一代多模態模型具有重要指導意義。
人工智能國家隊的AI for Science版圖
作為國內人工智能領域的代表性企業,科大訊飛近年來在AI for Science方向持續布局。依托認知智能全國重點實驗室和國家新一代人工智能開放創新平臺,該公司已在多個科學領域取得進展。
據公開資料顯示,科大訊飛與中國科學院共建的“星火科研助手”平臺,目前已服務全國1300余所高校的17萬余名科研人員;在化工領域,其與中科院大連化物所合作研發的智能化工大模型已迭代至3.0版本;在核聚變研究方向,其團隊聯合中國科學技術大學在《Nuclear Fusion》發表的PaMMA-Net模型,突破了等離子體磁測量演化建模的技術瓶頸。
值得關注的是,科大訊飛在推進全國產技術路線方面的努力。該公司強調其星火大模型實現了全棧自主可控,從底層算力到上層應用均采用國產化方案,這在當前國際技術競爭背景下具有特殊意義。
從“語言理解”到“科學理解”
有分析人士認為,此次研究成果的發表,標志著國內大模型企業正從通用智能向科學智能縱深拓展。當AI不僅能夠處理日常對話,還能理解復雜的科學圖表、進行專業領域的邏輯推演時,其應用價值將發生質的飛躍。
不過,研究也坦承當前技術仍存在明顯短板——在分子結構識別與實驗裝置理解等任務上,即便是最先進的模型也表現欠佳。這意味著AI真正成為科學家的得力助手,仍有相當長的路要走。
隨著國內多家科技企業加速布局AI for Science賽道,這一領域的競爭正在升溫。而此次Nature子刊論文的發表,或許只是國內人工智能國家隊在科學智能領域發力的一個縮影。
崔保華一審獲刑14年 受賄所得財物及孳息已全部追繳2025-12-19 22:22
芯更強 價更香!銳龍筆記本2025雙11最后一波沖刺2025-12-19 21:36
斯諾克冠中冠賽:趙心童連勝強敵晉級四強2025-12-19 21:31
美團宣布騎手委屈關懷計劃正式發布:最高5萬元委屈安撫金2025-12-19 21:30
小轎車高速上定速巡航、剎車失靈!115km/h時速跑490公里 耗干油箱才停下2025-12-19 20:55
性能最激進!三星Galaxy S26搭載雞血版驍龍8E5+最快內存2025-12-19 20:37
中國光伏行業協會聲明:與惡意做空光伏斗爭到底2025-12-19 20:36
雷神推出AMD版MIX II迷你主機:銳龍AI9 HX370 / 7 H255首發3103元起2025-12-19 20:32
強悍便攜 折疊新生 三星Galaxy Z TriFold正式開售2025-12-19 20:30
(粵港澳全運會)十五運會開幕式“鰲”游天海揭秘2025-12-19 20:24
江中制藥推出健消火鍋底料 客服:只是食品 沒有藥效2025-12-19 22:30
華為Mate80系列影像模組設計亮相:采用對稱環形布局2025-12-19 22:27
不叫筆記本電腦!新款智能鍵盤用上AMD/Intel CPU2025-12-19 21:43
存儲芯片漲價風暴前所未有!大摩上調三星、SK海力士目標價2025-12-19 20:58
特朗普要求美國人2028重返月球 還要部署核反應堆2025-12-19 20:52
雙十一折疊屏換機首選!華為折疊家族全系熱銷:多形態滿足全場景需求2025-12-19 20:51
重大突破!AMD公布Zen 7架構:首款AI原生x86處理器 首發兩大新技術2025-12-19 20:23
(粵港澳全運會)樊振東談晉級八強:不管對手是誰,先準備好自己2025-12-19 20:18
影像新標桿!曝小米17 Ultra支持3×2025-12-19 20:09
降價別想!三星、SK海力士和鎧俠計劃提高NAND價格 并削減產量2025-12-19 19:55