字級:
A+
|
A-
去年11月推出ChatGPT的OpenAI周一(25)宣布,該聊天機器人將達到可看、可聽且可說的程度,或至少能理解口語談話,並用合成語音回答並處理影像,這些功能將在未來兩周向付費用戶推出,但語音功能將僅限於iOS 和Android系統的應用程式,《CNBC》報導,這是OpenAI自推出GPT-4以來最大的一次功能更新。
科技網站《iTECH POST》報導,OpenAI表示,語音和影像將提供使用者在生活中使用ChatGPT的更多方法,使用者將能在手機應用程式上選擇進行語音對話,並選擇5種人工合成聲音其中之一,作為ChatGPT回應查詢的說話方式,使用者說出提示後,ChatGPT 將問題轉換為文字並在得到答案後轉換為語音,使用者還能跟ChatGPT共享影像,並聚焦想討論的部分或進行分析。
但OpenAI也指出潛在風險,像是可能有人惡意使用來冒充公眾人物或進行詐騙,但這家新創公司保證,已採取技術措施限制ChatGPT分析關於人們強調尊重個人隱私言論的能力,專家則對人工合成聲音表示擔憂,擔心可能以假亂真、深度偽造,因為已經有駭客和研究人員開始探索如何利用深度偽造技術,滲透網路安全系統並成為詐騙的新工具。
針對這些擔憂,OpenAI則回應稱合成聲音來自跟該公司直接合作的配音員,OpenAI也在語音互動指南中表示,OpenAI不會保留用戶的音訊片段,但稱語音轉錄將被認為是輸入,可以用來改進大型語言模型(LLM)。