日本一级片在线播放_亚洲九九精品_日本一区二区三区国产_日韩免费高清视频

首頁 > 汽車生活 > 汽車生活 > AI首次實時生成視頻!尤洋團隊新作,網(wǎng)友:這是新紀元

AI首次實時生成視頻!尤洋團隊新作,網(wǎng)友:這是新紀元

發(fā)布時間:2024-06-29 16:41:19

這是團隊在Open-Sora上,使用5個4s(192幀)480p分辨率視頻進行的測試。

新方法名為Pyramid Attention Broadcast(PAB),由新加坡國立大學尤洋以及3位學生推出。

 

具體來說,PAB通過減少冗余注意力計算,可實現(xiàn)高達21.6FPS10.6倍加速,并且不會犧牲基于DiT的流行視頻生成模型(包括Open-Sora、Open-Sora-Plan和Latte)的質(zhì)量。

作為一種免訓(xùn)練方法,PAB可為將來任何基于DiT的視頻生成模型提供實時功能。

看完效果對比,網(wǎng)友們紛紛驚嘆:

這將是新紀元。

 

也引來了眾多專業(yè)人士的轉(zhuǎn)發(fā)和點評,如MIT博士Yilun Du表示:

是一個展示了如何將視頻生成加速到實時速度的酷炫工作!可能會為視頻策略和模擬的現(xiàn)實世界用例開辟新的領(lǐng)域。

 

那么,新方法具體如何破解實時生成視頻這個難題的呢?

減少冗余注意力計算

一開始,團隊比較了當前擴散步驟與前一步驟的注意力輸出差異

這些差異通過均方誤差(MSE)進行量化,并對每個擴散步驟的所有層進行平均。

團隊捕捉到兩個關(guān)鍵信息

  • 隨著時間推移,注意力差異遵循U形模式,中間70%差異較小
  • 注意力差異的排序為:空間>時間>交叉

 

具體而言,不同時間步驟的注意力差異呈現(xiàn)出U形模式,在第一步和最后一步的15%步驟中發(fā)生顯著變化,而中間70%的步驟非常穩(wěn)定,差異很小。

其次,在穩(wěn)定的中間部分,不同類型的注意力表現(xiàn)出差異:空間注意力變化最大,涉及高頻元素,如邊緣和紋理;時間注意力顯示出與視頻中的運動和動態(tài)相關(guān)的中頻變化;跨模態(tài)注意力最為穩(wěn)定,它將文本與視頻內(nèi)容聯(lián)系起來,類似于反映文本語義的低頻信號。

對此,團隊正式提出用PAB來減少不必要的注意力計算

 

PAB通過根據(jù)每種注意力的差異將注意力輸出到不同的后續(xù)步驟,從而節(jié)省計算量。

舉個例子,就像廣播電臺把一個信號發(fā)送給多個聽眾一樣,如果某個步驟的注意力結(jié)果在接下來的幾個步驟中仍然適用,就不需要重新計算,而是直接使用之前的結(jié)果。

團隊發(fā)現(xiàn),即使沒有后期訓(xùn)練,這種簡單策略也能實現(xiàn)高達35%的加速,并且質(zhì)量損失可以忽略不計。

為了進一步增強PAB,團隊基于動態(tài)序列并行(DSP)改進了序列并行。

 

序列并行通過在多個GPU上分割視頻以降低延遲,但DSP帶來的時間注意力需兩次全對全通信,導(dǎo)致高通信開銷。

而PAB由于時間注意力不再需要被計算,使這些通信開銷減少了50%以上,從而優(yōu)化了實時視頻生成的分布式推理效率。

借助并行功能,PAB可實現(xiàn)高達21.6FPS10.6倍加速,并且不會犧牲基于DiT的流行視頻生成模型(包括Open-Sora、Open-Sora-Plan和Latte)的質(zhì)量。

汽車生活更多>>

華為HDC2025展示AppGallery數(shù)字藝術(shù)展,50余策展人講述App故事 歐洲汽車業(yè)機器人裝機量達2.3萬臺,德國占三成 2025世界人形機器人運動會將于8月在北京舉辦,規(guī)則正式公布 中國“太空之家”工作周記不斷“更新” 機器人“小航”實力“搶鏡” 精準抓取、像人手一樣有“觸覺” 我國機器人仿生手研究獲新突破 特斯拉無人駕駛出租車要來了? 武漢經(jīng)開區(qū)——加速構(gòu)建人工智能產(chǎn)業(yè)生態(tài) 2025 WBBA云網(wǎng)寬帶發(fā)展大會 | 更智能的基礎(chǔ)設(shè)施:AI與寬帶融合發(fā)展 2025百度城市大會——AI營銷@鄭州:AI賦能中小企業(yè),流量變留量的破局之道 榕樹家健康生態(tài)戰(zhàn)略發(fā)布會圓滿落幕:以AI賦能產(chǎn)業(yè)革新 北京聯(lián)通楊力凡:未來網(wǎng)絡(luò)天地一體、AI智能體為核心 取樣精度達0.01克,AI+自進化稱重機器人可大幅提高實驗效率 FPGA 40周年:全世界最不為人知的重要技術(shù) AI時代煥發(fā)第二春 “AI魯迅”回故鄉(xiāng)啦!“2025大運河文化閱讀行”在紹興精彩起航 我州舉行高校畢業(yè)生專場招聘會 寧夏日報報業(yè)集團2025年公開招聘專業(yè)技術(shù)人員辦公室綜合管理崗、人力資源部綜合管理崗、會計崗面試成績公告 提供千余工作崗位,貴陽學院2025屆畢業(yè)生離校招聘會舉辦 “夜經(jīng)濟+人才服務(wù)” 這場招聘會人氣爆棚 通遼舉辦東西部就業(yè)促進協(xié)作專場招聘會 云南省百家僑企進校園專場招聘會在昆舉辦 海淀多所中小學招聘教師,一起來看 北京150場招聘月底前密集啟動,大量放崗搶人!找工作的速來圍觀 吉利銀河星耀8:以豪華平權(quán),再創(chuàng)“爆款” 奇瑞混動技術(shù)大秀,沖擊1升油耗 上汽之夜:技術(shù)平權(quán)定義出行文明,中國方案重構(gòu)全球汽車秩序 汽車智能化狂飆遭質(zhì)疑,上汽要用更懂用戶的方式步入下半場 50萬買奧迪S5,修車比保養(yǎng)還勤,奧迪售后該醒醒了! 智能化內(nèi)卷時代,英仕派的“恰到好處”才是真香 盤點:奇瑞汽車混動之夜上發(fā)布的新技術(shù)和新產(chǎn)品 奇瑞混動之夜:中國技術(shù)定義全球標準,開源計劃引領(lǐng)產(chǎn)業(yè)革命