ChatGPT 聽起來比以往更人性化。
ChatGPT 製造商 OpenAI 週一舉行的活動揭示了人工智慧的下一階段:適應用戶需求的情感表達技術。
這次活動中最重要的公告是一種名為GPT-4o 的新人工智慧模型,該公司表示,該模型可以透過自拍照了解你的感受,輔導孩子們解決數學問題,並與多人毫無延遲地交談。
它甚至可以處理句子中間被打斷的情況並進行即時翻譯。
GPT-4o 讓 ChatGPT 聽起來像一位朋友——超級友好。 有一次,它在現場演示中說:“哇,你穿的襯衫真漂亮”,沒有文字或口頭提示。
向 GPT-4o 打個招呼,這是我們的新旗艦模型,它可以實時跨音頻、視覺和文本進行推理:https://t.co/MYHZB79UqN
今天在 API 和 ChatGPT 中推出文字和圖像輸入,並在未來幾週內推出語音和視訊。 pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) 2024 年 5 月 13 日
正如活動中的演示所演示的那樣,新模型將文字、視覺和音訊整合到一個平台中,並且可以無縫切換。
在一次現場演示中,ChatGPT 在與 OpenAI 前沿研究負責人 Mark Chen 交談時,用歌聲、機器人聲音和戲劇性聲音聽起來充滿感情。
OpenAI 剛剛發布了「GPT-4o」。 它可以用聲音、視覺和文字進行推理。
模型比 GPT-4 Turbo 速度快 2 倍,便宜 50%,速率限制高 5 倍。
它將透過 API 供免費用戶使用。
語音模型甚至可以感知情緒並產生… pic.twitter.com/X8zqN9bxFp
— Lior✓ (@AlphaSignalAI) 2024 年 5 月 13 日
在另一個演示中,OpenAI 訓練後團隊負責人 Barret Zoph、ChatGPT 扮演了導師的角色。 Zoph 轉動相機,讓 ChatGPT 幫他解決線性方程式問題。 該機器人甚至解釋了為什麼數學在現實世界中很重要。
OpenAI CTO Mira Murati 表示:「GPT-4o 最好的一點是,它為每個人帶來了 GPT-4 等級的智能,包括我們的免費用戶。」她指出,超過 1 億人使用 ChatGPT。 “我們擁有僅免費用戶可以使用的先進工具,至少到目前為止是這樣。”
Murati 表示,GPT-4o 將在未來幾週內向免費和付費用戶推出。 付費用戶的容量限制最多可達免費用戶的五倍。
所有用戶現在都可以上傳螢幕截圖、照片和文件以開始與 ChatGPT 對話。 人工智慧也將以 50 種不同語言做出更快速的回應,並且可以執行進階數據分析。
「我們希望能夠將這種體驗帶給盡可能多的人,」穆拉蒂說。
OpenAI 技術長 Mira Murati。 攝影師:Philip Pacheco/Bloomberg via Getty Images
GPT-4o 是 OpenAI 於 11 月發布的先前 GPT-4 Turbo 模型的改進。 GPT-4o 的速度是 Turbo 的兩倍,但價格是 Turbo 的一半。
相關:OpenAI 為 Met Gala 展覽開發客製化 20 世紀 30 年代人工智慧機器人
應用程式開發人員還可以使用新模型來製作客製化的人工智慧應用程式。
ChatGPT 還推出了新的桌面應用程式和更簡單、煥然一新的外觀。
穆拉蒂在活動中表示,以安全有用的方式向大眾帶來新技術「相當具有挑戰性」。
「GPT-4o 在安全性方面給我們帶來了新的挑戰,因為我們正在處理即時音訊、即時視覺,」Murati 說。
相關:OpenAI 演示語音引擎,但尚未準備好廣泛發布
Murati 表示,OpenAI 正在與政府、媒體和其他實體合作,在未來幾週內安全地部署該技術。
OpenAI 剛剛展示了其新的 GPT-4o 模型進行即時翻譯? pic.twitter.com/Cl0gp9v3kN
— 湯姆沃倫 (@tomwarren) 2024 年 5 月 13 日
OpenAI 週一的春季更新活動發生在 Google 開發者 I/O 活動的前一天。
OpenAI 執行長 Sam Altman 駁斥了有關 OpenAI 將在活動前發布穀歌搜尋競爭對手的報導。 奧特曼在一篇文章中寫道 郵政 週五,在 X(以前的 Twitter)上:“不是 gpt-5,不是搜尋引擎,但我們一直在努力開發一些我們認為人們會喜歡的新東西!對我來說感覺就像魔法一樣。”