OpenAI 憑藉其最新創新技術再次在科技界掀起波瀾:帶有 Vision 的 GPT-4 或 GPT-4V。
在給定佈局下編寫程式碼的 GPT-4 願景:https://t.co/xJy9yFNvKG
— 格雷格·布羅克曼 (@gdb) 2023 年 9 月 27 日
GPT-4V 基於 GPT-4 構建,並結合了視覺功能,允許模型分析 ChatGPT Plus 和 Enterprise 訂閱者提供的圖像。
在接下來的兩週內向付費用戶推出!
— 格雷格·布羅克曼 (@gdb) 2023 年 9 月 27 日
新功能潛力巨大,但也為企業帶來了一些風險。
GPT-4 與視覺範例
隨著越來越多的用戶使用新功能,他們正在分享 GPT-4 如何與 Vision 配合使用的範例。
GPT-4 with Vision可以分析筆跡。
非常酷。 人工智慧在解讀筆跡方面比我更好。
Breen教授詢問有視力的GPT-4是否可以閱讀羅伯特·博伊爾的手寫手稿。 效果很好!
對於各個學術領域來說,這可能是一個大問題,特別是因為人工智慧可以對文本進行「推理」。 https://t.co/n9jUjqeEw3 pic.twitter.com/78jYWfIhCY
— 伊森‧莫里克 (@emollick) 2023 年 9 月 27 日
您可以使用餐巾紙草圖為網站建立代碼。
人們如何將 GPT-4 與 Vision 結合使用,真是令人驚奇。
pic.twitter.com/1O3AW7DJDr— 胡申‧薩瓦利 (@hushensavani) 2023 年 9 月 27 日
可以分析模因。
這絕對是狂野的。 我徹底無言了。 pic.twitter.com/wGTAx1hFgS
— 彼得羅‧斯基拉諾 (@skirano) 2023 年 9 月 27 日
除了這些範例之外,我還進行了一些簡單的測試。
GPT-4 with Vision 可以為您的亞馬遜清單和銷售頁面編寫產品描述。
它可以幫助您開始根據螢幕截圖進行特定網站設計的基本編碼。
您可以使用標籤建議編寫創意 Instagram 標題。
您可以根據網站或電子書的數據撰寫文章,例如《2024 年 SEO 現況》。
與所有 AI 產生的內容一樣,必須使用 Vision 審查 GPT-4 輸出的準確性。 它仍然會產生幻覺並帶有其他風險。
OpenAI揭示GPT-4V的潛在風險
OpenAI 發表了一篇論文,概述了使用 GPT-4V 相關的潛在風險,包括:
- 識別影像中的人物或確定其位置的隱私風險可能會影響公司的資料實踐和合規性。 該論文指出,GPT-4V 具有一定的識別公眾人物和地理定位影像的能力。
- 影像分析和解釋過程中的潛在偏差可能會對不同的人口群體產生不利影響。
- 提供不準確或不可靠的醫療建議、危險任務的具體指示或暴力/仇恨內容的安全風險。
- 網路安全漏洞,例如驗證碼解決或多模式越獄。
該模型帶來的風險導致了其局限性,例如它拒絕為人們提供圖像分析。
一般來說,有興趣利用 GPT-4V 進行行銷的品牌應評估和減輕使用人工智慧的這些風險和其他生成風險,以負責任地使用該技術,並避免對消費者和品牌聲譽產生負面影響。
第一個 OpenAI 合作夥伴為「更廣泛的可用性」準備圖片輸入
OpenAI 宣布,具有 Vision 功能的 GPT-4 模型將為 Be My Eyes Virtual Volunteer 提供支持,Be My Eyes Virtual Volunteer 是一款專為視障人士設計的數位視覺助理。
儘管該技術仍處於測試階段,但其可能性令人難以置信。 例如,這項技術可以幫助公司提高客戶服務的可近性。
Be My Eyes 計劃與企業客戶一起測試該功能,強調其在核心受眾之外的商業潛力。
GPT-4 的未來願景
對於企業、行銷人員和 SEO 專業人士來說,GPT-4 With Vision 的潛在應用可能是開創性的。
然而,由於 GPT-4 在 Vision 和其他人工智慧模型中引發的潛在隱私、公平和網路安全問題,所有使用者都應謹慎行事。
特色圖片:Tada Images/Shutterstock