清華大學聯合生數科技發表中國首個文字生成影片大模型Vidu

在4月底的中關村論壇年會未來人工智能先鋒論壇上,清華大學聯合生數科技發表了中國首個文字生成影片的大模型Vidu。清華大學教授、生數科技首席科學家朱軍表示,Vidu和OpenAI的Sora相似,能夠根據用户提供的文字描述,而一鍵生成,直接產生解像度達到1080p的高品質短片。 Vidu能夠模擬真實物理世界,具備多鏡頭生成、時空一致性高之外,還強調特別理解中國元素,例如能夠產生熊貓、龍等短片。不過,Vidu暫時只能產生16秒長的短片,與Sora的1分鐘相比,仍然有頗大差距。 朱軍表示,Vidu的突破,源自研發團隊在貝葉斯機器學習和多模態大模型的長期累積和多項原創性成果。研發團隊早在2022年9月提出其核心技術U-ViT架構,是全球首個將Diffusion和Transformer融合的架構。而在今年2月中OpenAI發表Sora之後,團隊基於對U-ViT架構的深入理解,以及長期積累的工程和數據經驗,再進一步突破關鍵技術,顯著提升Vidu產生影片的連貫性和動態性。 朱軍又稱,將這個國產影片大模型取名Vidu,是因為其發音和Video相似,也藴含We do的寓意,未來希望與產業鏈上下游企業、研究機構加強合作,共同推動影片大模型進展。
TimeNews
05-18 20:17新地(0016)元朗站上蓋The YOHO Hub II 首輪銷售報捷,次輪銷售再創佳績
05-18 16:05新地(0016)元朗 The YOHO Hub II 次輪銷售火熱,市場購買力持續釋放
05-18 14:44美股道指再創新高,港股ADR比例指數升84點
05-18 13:29荔枝角碧海藍天錄蝕讓成交 1016萬元
05-18 11:18新地(0016)旗下元朗The YOHO Hub II次輪銷售火熱 逾9,000票爭搶213夥
05-18 04:30小鵬汽車(9868)進軍香港,引入SUV G6及純電動7人車X9
05-18 04:30港股持續上升,北水入市助力恆指收市升0.91%
05-18 04:30阿里巴巴股價急升7% 刺激對衝基金、沙特主權基金及超級富豪增持
05-18 04:30碧桂園入稟清盤案件聆訊延期至6月11日
05-18 04:30比亞迪電子成功「染藍」加入恆生指數,碧桂園服務被剔除
05-18 04:30冒險王國控股有限公司斥資逾1億元購入荃灣地廠
05-18 04:30盈信控股旗下ONE WOOD ROAD推新盤,市區豪宅成交持續活躍
05-18 04:30樓市續反覆爭持,CCL微跌0.14%至146.09點
05-18 04:30長情業主沽貨勁賺,二手物業市場熱度不減
05-18 04:30文藝復興科技抄底網紅股 GameStop 和 AMC,Reddit與OpenAI達成合作協議
05-18 04:30財政部發行30年超長期特別國債,市場預期符合票面利率2.57釐
05-18 04:30瑞士歷峯集團2024財年銷售創新高,任命新行政總裁進行改組
05-18 04:30內地經濟增長放緩,政府加強財政刺激以達目標
05-18 04:30惠譽:中國地方政府融資平台參與住房置換計劃或導致淨槓桿率增加
05-18 04:30金管局副總裁阮國恆任期延長至正常退休年齡後兩年