OpenAI 已開始為其流行的人工智慧聊天機器人 ChatGPT 推出新的語音和圖像功能。
這些新功能可讓您透過與 ChatGPT 交談並向其顯示影像來進行更自然的對話。
這使得在日常生活中可以有更多的方式使用 ChatGPT。 例如,在旅行時,您可以向 ChatGPT 發送一張地標照片並進行有關它的即時對話。
同樣,在家裡,您可以拍攝冰箱裡的物品的照片並討論膳食想法或詢問逐步食譜。
在未來幾週內,OpenAI 將向 Plus 和 Enterprise 用戶推出這些功能。 語音功能將在行動應用程式上提供,而影像功能將在所有平台上提供。
語音輸入可實現雙向對話
新的語音功能可讓您與 ChatGPT 進行對話,ChatGPT 現在可以用五種合成語音之一進行可聽回應。
您可以使用 iOS 和 Android 行動應用程式設定來啟動語音。
據 OpenAI 稱,語音功能使用了在配音演員樣本上訓練的高級文字轉語音模型。 對於語音識別,它利用 OpenAI 的開源語音系統 Whisper。
談論圖片提供視覺背景
現在您可以向 ChatGPT 顯示一張或多張影像,以提供視覺上下文並集中對話。
例如,分享損壞裝置的照片可以幫助 ChatGPT 診斷問題並提出解決方案。 在行動裝置上,繪圖工具可讓您繪製圓圈或指向影像的特定部分。
影像特徵使用 GPT-3.5 和 GPT-4 模型的多模態版本,經過調整以推理視覺輸入。 OpenAI 在發布前廣泛測試了影像功能以檢測安全風險。
逐步部署,注重安全
OpenAI 指出,它正在採取分階段的方法來推出這些功能。
新的語音技術開啟了創意應用,但也帶來了冒充等風險。 為了降低風險,語音目前僅限於對話式聊天。
對於影像,OpenAI 表示,它限制了 ChatGPT 直接分析照片中人物的能力,並在未經驗證的情況下阻止高風險用例。
總結
ChatGPT的新語音和圖像功能為使用者提供了更自然的方式與AI系統互動。
然而,OpenAI 正在採取謹慎的方法來實施它們,由於潛在的風險,限制了初始存取和功能。
隨著這些功能的擴展,請注意 ChatGPT 的限制,並避免未經驗證的高風險應用程式。
特色圖片:Ahmed_Rizq/Shutterstock