深度求索發布DeepSeek-V4預覽版 模型性能領先開源界別

內地人工智能(AI)初創企業深度求索(DeepSeek)近期宣佈,正式推出其全新大型語言模型系列DeepSeek-V4的預覽版本,並同步採取開源策略。市場普遍認為,此舉有望進一步推動開源AI社區的發展,並為全球開發者提供更多創新工具。據介紹,DeepSeek-V4系列將涵蓋Pro和Flash兩大版本,主打百萬字級別的超長上下文處理能力,並在智能體(Agent)能力、世界知識儲備及推理性能等多個關鍵指標上,展現出在內地及全球開源領域的領先地位。 其中,DeepSeek-V4-Pro版本在Agent能力方面的提升尤為顯著。根據官方評測,該模型在Agentic Coding測試中已達到當前開源模型中的最佳水平,同時在其他多項Agent相關評測中亦表現優異。據透露,DeepSeek-V4已成為深度求索內部員工在Agentic Coding任務上的主要工具,有內部評測回饋指出,其使用體驗優於Anthropic旗下的Sonnet 4.5,且交付質量接近Opus 4.6的非思考模式,儘管與Opus 4.6的思考模式仍存在一定差距。 在世界知識測評方面,DeepSeek-V4-Pro大幅領先其他開源模型,其表現僅稍遜於全球頂尖閉源模型、谷歌的Gemini-Pro-3.1。此外,在數學、科學、技術、工程及數學(STEM)以及競賽型代碼等多個高難度測試中,DeepSeek-V4-Pro更是超越了所有已公開評測的開源模型,取得了與世界頂級閉源模型媲美的優異成績,彰顯其強大的綜合實力。 至於DeepSeek-V4-Flash版本,雖然在世界知識儲備方面略遜一籌,但由於其模型參數規模較小,啟動速度更快,旨在提供更為快捷且經濟高效的API服務,以滿足不同應用場景的需求。在Agent測評中,Flash版本在高難度任務上的表現與DeepSeek-V4-Pro仍有一定差距,但其在效率和成本上的優勢使其在特定商業應用中具有潛力。
TimeNews
04-24 14:39港元定存戰升温 近半港銀調整息率 一年期高見2.7釐吸資
04-24 14:38台灣金管會放寬基金投資單一公司股票上限 台積電股價勁揚推升台股創新高
04-24 14:37中國駐泰國大使館發嚴正警示:籲公民慎防泰緬邊境電訊詐騙陷阱
04-24 14:37瑛泰醫療(01501)現大手交易 64萬股以每股36.8元易手涉資逾2355萬元
04-24 14:37日本巖手縣大槌町山火持續逾兩日未受控 當局調派應急力量
04-24 14:37中國石油股份(00857)錄得大手成交 涉資逾2567萬元
04-24 14:37屈臣氏集團晉身全球零售商15強 倪文玲闡述O+O競爭策略
04-24 14:37英倫銀行警告股市面臨諸多風險 預期市場出現調整
04-24 14:37港燈5月燃料調整費每度電降至26仙 惟料年中起將顯著上調
04-24 14:36阿里巴巴-W (09988) 盤中錄得大手成交 涉資逾3200萬港元
04-24 14:36銀河娛樂(00027)午後錄大手成交 涉資逾3300萬元
04-24 14:36盈富基金 (02800) 錄16宗大手成交 涉資逾10億元
04-24 14:36騰訊控股(00700)錄得逾3,000萬港元大手成交
04-24 14:36花旗香港財富管理業務內地客增長強勁 「五一」黃金周推多重優惠並延長分行服務
04-24 14:36建設銀行(00939)盤中錄大手成交 涉資逾2,200萬元
04-24 14:36小鵬擬擴大海外佈局 洽談合作並規劃新建工廠
04-24 14:35伊朗革命衞隊據報護送貨船入港 霍爾木茲海峽向友好國家豁免通行費
04-24 14:35日本巖手縣大槌町山火持續逾兩日未受控 逾千公頃土地焚毀
04-24 14:35日本政府宣佈5月起分階段釋出第二批戰略石油儲備 涉約580萬千升
04-24 14:06OpenAI推出全新GPT-5.5模型 智能與直觀性大幅提升