字級:
A+
|
A-
繼OpenAI影片生成模型Sora橫空出世後,阿里巴巴最新也推出了生成式AI模型EMO。只要輸入一張照片和音訊,生成的影片不僅嘴型能跟聲音同步,人物的表情也會跟著說話內容有所變化。但由於EMO目前沒有提供大眾測試用的版本,無法確定影片是否能夠一鍵生成。
美妙歌聲、搭配豐富表情,仔細看,開口唱歌的竟然是照片!
中國網路巨頭阿里巴巴智能計算研究所,近日推出生成式AI模型EMO,只需要輸入一張照片和音訊,就能讓照片中的靜態人物說話及唱歌。逼真的表情動作,讓人不禁想起,OpenAI近期推出的影片生成AI 模型Sora。
手機王總編輯張利安:「Emo它是你只要放一個靜態的圖片,它就可以生成動態的影片。它這個動態影片,其實主要還是著重在人的臉跟表情的部分,它這個影片其實不會是像Sora,可能可以直接讓人做移動,它還是在一定的範圍裡面去講話。」
將Emo和Sora兩者攤開做比較,手機王總編輯張利安指出,相較於EMO,Sora可能對產業的衝擊會比較大,因為Sora能夠根據文字製作動畫;反觀EMO,就算能從圖片變成影片,也還是在固定範圍內去做變化,在使用上仍存在一定的侷限性。
手機王總編輯張利安:「(EMO)可能比較適合用來像AI的主播,或者是說做教育訓練,拿來做播報或是唱歌,或者是說做一些表演。比較是像這種口語的表演的部分。通過這樣的方式,其實可以很快的跟手機上面做一個結合。」
張利安表示,其實要想製作對嘴影片,網路上已有許多類似的APP,只是在應用上面,可能不是那麼精準。如今有了AI模型的加持,若能再結合手機,將能更好的去分享知識與歌聲。(記者楊珩、林家弘/台北採訪報導)