近日我們從外媒獲得消息,位于莫斯科的三星AI中心和Skolkovo科學技術研究所的研究人員發(fā)表了一篇新論文,詳細介紹了從單個靜止人像照片生成3D動畫人像的創(chuàng)建。與此前能夠生成照片般逼真肖像的人工智能AI系統(tǒng)不同,這項新技術可以產生移動的說話人像動圖,雖然不是很完美,但卻非常逼真。
創(chuàng)建的過程解析
新發(fā)表的研究解釋說,“實際場景”要求系統(tǒng)只能使用少數甚至單個人進行生成,而不是廣泛的圖像數據集。為了滿足這一要求,研究人員創(chuàng)建了一個系統(tǒng),盡管需要調整數以千萬計的參數,但“訓練可以僅基于少量圖像并快速完成”。
通過使用生成對抗網絡,研究人員能夠制作除了圖像之外的彩繪肖像,還可以生成蒙娜麗莎的談話,移動版本。正如詳細介紹該研究的視頻所示,最終結果在質量和現實性方面各不相同,有些可能與真實視頻無法區(qū)分(至少在低分辨率下)。
實際效果展示的GIF圖
研究人員指出,這類系統(tǒng)還存在其他一些問題,包括靜止圖像中的人與用于動畫肖像的說話人之間存在“顯著的個性不匹配”。研究人員解釋說,“如果有人想制作”假“木偶操作視頻而沒有這種不匹配,那么就需要進行一些具有里程碑意義的改編。
該技術仍然可用于不一定需要個性匹配的目的,而是僅作為一小部分靜止圖像存在的角色的簡單動畫。到目前為止,該技術僅適用于臉部和軀干的上半部分。目前尚不清楚研究人員是否計劃將系統(tǒng)擴展到包括其他身體部位。
三星的研究加入了NVIDIA基于人工智能的肖像作品,以及非肖像AI圖像生成,包括今年早些時候推出的NVIDIA系統(tǒng)- 能夠將簡單草圖快速轉換為復雜風景圖像的系統(tǒng)。