DeepSeek發布DeepSeek-V4預覽版 實現百萬上下文能力 邁向AGI目標

內地人工智能(AI)公司DeepSeek宣佈,已正式推出全新系列模型DeepSeek-V4的預覽版,並同步開源,標誌著其在實現通用人工智能(AGI)的道路上邁出重要一步。據公司表示,即日起,1M(一百萬)上下文將成為DeepSeek所有官方服務的標準配置,大幅提升模型的處理和理解能力。 市場消息指,DeepSeek-V4已率先應用為公司內部員工使用的Agentic Coding模型。根據內部評測反饋,該模型在用户體驗方面表現優於Sonnet 4.5,且交付質量已接近Opus 4.6的非思考模式。然而,與Opus 4.6的思考模式相比,仍存在一定差距,顯示出持續改進的空間。 值得一提的是,在數學、科學、科技、工程和數學(STEM)以及競賽型代碼的測試評估中,旗艦模型DeepSeek-V4-Pro展現出卓越性能,超越當前所有已公開評測的開源模型,並取得與世界頂級閉源模型匹敵的優異成績。 在技術創新方面,DeepSeek-V4引入了一種全新的注意力機制。該機制透過在token維度進行壓縮,並結合DSA(DeepSeek Sparse Attention)稀疏注意力技術,成功實現了全球領先的長上下文處理能力。相較於傳統方法,這項創新顯著降低了對計算資源和顯存的需求,提升了模型的運行效率和可擴展性。 DeepSeek強調,公司將始終秉持長期主義的原則理念,在不斷嘗試與深度思考中穩步前行,持續努力向實現AGI的最終目標不斷靠近。此舉亦反映出AI業界在模型能力提升及技術創新方面的激烈競爭。
TimeNews
04-24 14:06OpenAI推出全新GPT-5.5模型 智能與直觀性大幅提升
04-24 14:06華夏恆生科技 (03088) 午後錄兩宗大手成交 涉資達1.24億元
04-24 14:05OpenAI發布全新AI模型GPT-5.5 強調智能及直觀體驗
04-24 14:05恆生中國企業(02828)錄兩宗大手成交 涉資約3.59億元
04-24 14:05智譜 (02513) 錄大手成交 涉資逾3,100萬元
04-24 14:05台灣加權平均指數勁升3.23% 收市報38932點
04-24 13:38港股午後曾見倒升 芯片股受Intel績佳刺激逆市揚 中芯國際升逾一成 「AI三寶」回吐壓力顯著
04-24 13:38國際局勢與經濟動向兼備:白宮指中國竊取AI技術 花旗看好內地樓市企穩
04-24 13:38美股高位調整 道指上週四挫逾百點 標普納指破頂後倒跌 分析料中東局勢影響有限 籲伺機吸納AI產業鏈
04-24 13:38港燈五月燃料調整費下調 惟預警年中起料顯著攀升
04-24 13:37港元定存息戰趨烈 多間銀行搶推高息優惠吸納資金
04-24 13:37商湯-W現大手成交 涉資3,900萬元
04-24 13:37寒武紀完成DeepSeek V4模型適配及優化 業界料有助推動國產AI晶片發展
04-24 13:37中國平安 (02318) 錄得大手成交,單筆交易涉資逾5,835萬元
04-24 13:36華潤置地(01109)錄大手成交 涉資逾5,498萬元
04-24 13:36中芯國際(00981)錄得3宗大手成交 涉資逾1.27億元
04-24 13:36聯想集團 (00992) 午後錄大手成交 涉資逾2,500萬元
04-24 13:36中國財險(02328)錄大手成交 涉資約2977萬元
04-24 13:36銀河娛樂 (00027) 錄得大手成交 涉資3,301萬元
04-24 13:35盈富基金(02800)盤中錄五宗大手交易 涉資近1.6億元