「一隻毛茸茸的小怪物跪在融化的紅色蠟燭旁邊,他睜大眼睛、張開嘴巴凝視火焰,神情天真又俏皮,就好像第一次探索周圍世界一樣,氣氛驚奇又好奇。(註1)」當你看到這段文字時,腦海中浮現什麼畫面呢?這個由Open AI全新生成式AI模組「Sora」生成的影像有沒有超越你的想像?
很懂你想看什麼!Sora轉化影片超精緻
Open AI上周重磅展示自家新的黑科技「Sora」,只要一段文字敘述,就能生成最長60秒的影片,形容Sora對語言有深刻理解,並能引人注目的內容,表達充滿活力的情感,還特別在官網上標註「所有影片均由Sora直接生成,未經修改」,蓋過競爭對手Google在同日發表的Gemini 1.5,成為討論度最高的話題。
除了官網釋出超過10支風格迥異的影片,Open AI執行長奧特曼還在自己的X平台上向網友募集創意,來滿足大眾現在還沒辦法玩到Sora的好奇心,無論是「一隻半鴨龍載著一隻穿著冒險裝備的倉鼠,在美麗的夕陽中飛翔」、「兩隻黃金獵犬在山頂主持Podcast」、「動物運動員騎著自行車在海上自行車比賽」等等,Sora都有求必應。
驚人的成果震撼市場,輝達AI科學家Jim Fan表示Sora是影片生成的「GPT-3時刻」,馬斯克也評論「gg humans(人類心服口服)」。AI影像生成的競爭對手更是磨刀霍霍,Runway執行長Cristóbal Valenzuela直接以「Game On(比賽開始了)」來回應,Pika創始人郭文景更興致勃勃的表示「這是個振奮人心的消息,我們已經在籌備直接衝、對標Sora。」
中國CPO先吹飆風 光聖、訊芯-KY後來居上
繼Chat GPT之後,Open AI再度對市場投下Sora這顆震撼彈,尤其官網上釋出的報告除了解釋訓練原理,還提及Sora不是只有「文字轉影片」的功能,還能創建「完美循環影片」、將靜態圖像向前/向後擴展影片,類似手機原況照片的功能,甚至還能將兩個影片「無縫融合」。
這讓目前影音創作者最依賴的Adobe首當其衝,聞訊當日暴跌7%,並連續3天下滑,圖片素材庫Shutterstock也在3天內跳水8%。但生成式AI由文字、圖片進入影片階段,不只刺激AI算力需求,也帶動連網與高速傳輸需求成長,除了AI晶片、AI伺服器仍是受惠第一順位,光通訊及矽光子也強勢崛起,成為新一代AI飆股題材。
CPO題材由中國市場率先起風,三大巨頭中際旭創、新易盛、天浮通信19日同步飆漲20%,鎖住漲停,並迅速將飆風吹向台灣光通訊產業,包括光收發模組廠光聖、前鼎,光跳接線廠上詮,共同封裝光學元件廠訊芯-KY、聯鈞,以及光通訊設備廠華星光等本周都接連開飆,更有多檔直接改寫掛牌新高。
就連加密貨幣也受惠,奧特曼共同創立的加密貨幣Worldcoin(WLD)從不到4塊美金的價格,一路突破8美元(2/22),7天飆漲170%,去中心化影片串流網路Livepeer(LPT)7天也大漲超過1倍,CoinGecko數據顯示,目前生成式AI相關的加密貨幣市值已經超過174億美元,商機驚人。
DeepFake防不勝防 Sora也藏安全隱患
Sora取名來自日文「天空」,卻被網友發現展示影片的日文錯漏百出。/翻攝自Sora
Sora就如同前輩ChatGPT一樣,帶來驚奇的同時,也掀起AI對人類安全及就業問題的辯論,未來因AI而失業的範圍恐怕要從文字創作、文書處理、數據分析等領域,擴大到影音創作的幕前與幕後,從業人員可能得學著習慣與AIGC做「同事」,否則就可能被淘汰。
不過,大眾最擔心的還是Sora驚人的能力,恐怕將使虛假訊息更難分辨,甚至會淪為製作仇恨內容的工具,過去的經驗顯示,這些幾可亂真的假訊息與影音,都會影響民眾認知,DeepFakeAI(FakeAI)近7日暴漲超過11倍,就能可看出市場認為Sora問世,可能會對「深度偽造」的假影音有推波助瀾的效果。
對此,OpenAI表示Sora仍是未完成品,現在正與紅隊成員( 錯誤訊息、仇恨內容和偏見等領域的領域專家)合作,以對抗性方式測試模型,也會利用現有的安全技術來減少市場擔憂。此外,Sora的影片目前是「靜音模式」,且難以準確模擬複雜場景的物理原理、可能混淆指令中的空間細節等問題也仍待改善,但對於相關技術已無疑是重大的飛躍。
------
註1:此為編輯整理過後指令,小怪物影片在Sora官網上的完整提示為:
動畫場景是特寫一個毛茸茸的小怪物跪在融化的紅色蠟燭旁。
藝術風格是3D和現實,重點是燈光和紋理。
這幅畫的氣氛是一種驚奇和好奇,怪物睜大眼睛、張開嘴巴凝視著火焰。
它的姿勢和表情傳達出天真和俏皮,好像它第一次探索周圍的世界一樣。
暖色調和戲劇性燈光的使用進一步增強了影像的舒適氛圍。