DeepSeek-V4預覽版模型開放 百萬字超長上下文成「標配」

人工智能領域的最新技術突破持續吸引市場目光。據市場消息指,深度學習公司DeepSeek近日正式推出了其全新系列模型DeepSeek-V4的預覽版本,並同步進行開源。此舉預計將進一步推動大型語言模型(LLM)技術的普及與應用,特別是在處理複雜及長篇幅文本任務上的潛力。 DeepSeek方面表示,DeepSeek-V4模型的核心亮點在於其具備高達百萬字(1M)的超長上下文處理能力。公司強調,這項創新技術使其在Agent能力、世界知識儲備及推理效能等多個關鍵指標上,均達到了國內乃至開源領域的領先水平,展現出其在人工智能前沿領域的強勁實力。 據悉,DeepSeek-V4系列模型根據規模大小區分為pro和flash兩個版本。其中,DeepSeek-V4-Flash版本被定位為更為快捷高效的經濟之選,旨在平衡性能與成本,以滿足不同用户羣體對AI模型的差異化需求。 在技術層面,DeepSeek透露,DeepSeek-V4開創了一種全新的注意力機制。該機制透過在token維度進行數據壓縮,並巧妙結合其自主研發的DSA稀疏注意力(DeepSeek Sparse Attention)技術,成功實現了全球領先的長上下文處理能力。業界分析指,此項創新不僅大幅提升了模型對複雜語義的理解與生成能力,同時亦顯著降低了對計算資源和顯存(GPU Memory)的需求,有效優化了模型運行效率,為大規模應用奠定了基礎。 DeepSeek進一步表示,從即日起,百萬字(1M)上下文處理能力將成為DeepSeek所有官方服務的「標配」。這預示著未來其產品線將全面具備此項高端功能,有望為用户帶來更為卓越、連貫的AI互動體驗,例如在長文寫作、會議紀要整理、複雜代碼分析等場景中發揮關鍵作用,持續引領人工智能應用走向新的高度。
TimeNews
04-24 14:39港元定存戰升温 近半港銀調整息率 一年期高見2.7釐吸資
04-24 14:38台灣金管會放寬基金投資單一公司股票上限 台積電股價勁揚推升台股創新高
04-24 14:37中國駐泰國大使館發嚴正警示:籲公民慎防泰緬邊境電訊詐騙陷阱
04-24 14:37瑛泰醫療(01501)現大手交易 64萬股以每股36.8元易手涉資逾2355萬元
04-24 14:37日本巖手縣大槌町山火持續逾兩日未受控 當局調派應急力量
04-24 14:37中國石油股份(00857)錄得大手成交 涉資逾2567萬元
04-24 14:37屈臣氏集團晉身全球零售商15強 倪文玲闡述O+O競爭策略
04-24 14:37英倫銀行警告股市面臨諸多風險 預期市場出現調整
04-24 14:37港燈5月燃料調整費每度電降至26仙 惟料年中起將顯著上調
04-24 14:36阿里巴巴-W (09988) 盤中錄得大手成交 涉資逾3200萬港元
04-24 14:36銀河娛樂(00027)午後錄大手成交 涉資逾3300萬元
04-24 14:36盈富基金 (02800) 錄16宗大手成交 涉資逾10億元
04-24 14:36騰訊控股(00700)錄得逾3,000萬港元大手成交
04-24 14:36花旗香港財富管理業務內地客增長強勁 「五一」黃金周推多重優惠並延長分行服務
04-24 14:36建設銀行(00939)盤中錄大手成交 涉資逾2,200萬元
04-24 14:36小鵬擬擴大海外佈局 洽談合作並規劃新建工廠
04-24 14:35伊朗革命衞隊據報護送貨船入港 霍爾木茲海峽向友好國家豁免通行費
04-24 14:35日本巖手縣大槌町山火持續逾兩日未受控 逾千公頃土地焚毀
04-24 14:35日本政府宣佈5月起分階段釋出第二批戰略石油儲備 涉約580萬千升
04-24 14:06OpenAI推出全新GPT-5.5模型 智能與直觀性大幅提升