技術(shù)編號(hào):39729604
提示:您尚未登錄,請點(diǎn) 登 陸 后下載,如果您還沒有賬戶請點(diǎn) 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本申請涉及圖像處理,具體涉及基于文本信息借助三維渲染生成視頻的方法及系統(tǒng)。背景技術(shù)、隨著人工智能技術(shù)的快速發(fā)展,文本到視頻生成已經(jīng)成為一個(gè)熱門研究領(lǐng)域。通過利用ai大模型,可以實(shí)現(xiàn)從自然語言文本自動(dòng)生成與之對應(yīng)的視頻內(nèi)容。傳統(tǒng)文生視頻技術(shù)原理,即大規(guī)模深度神經(jīng)網(wǎng)絡(luò)組成的大模型來實(shí)現(xiàn)自然語言文本向目標(biāo)結(jié)果的轉(zhuǎn)換,期間采取噪音數(shù)據(jù)擴(kuò)散出模仿訓(xùn)練樣本體系文與視頻關(guān)聯(lián)關(guān)系的成果。、現(xiàn)有技術(shù)中,基于transformer架構(gòu)的擴(kuò)散模型所合成畫面幀視頻會(huì)存在生成內(nèi)容分辨率低、一致性差,生成內(nèi)容不可控等缺...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。