OpenAI 最近分享了有關 DALL·E 3 的詳細信息,DALL·E 3 是其文本到圖像 AI 系統的最新版本,將於今年秋季推出 ChatGPT Plus、ChatGPT Enterprise、Bing 的 AI Image Creator 和 Microsoft Designer。
此更新有望提高圖像準確性、更大的細微差別以及對用戶輸入文字的關注。
DALL·E 3 新聞
DALL·E 的先前版本要求使用者透過稱為提示工程的流程來調整其提示。
DALL·E 3 旨在透過產生更符合使用者初始文字指令的圖像來消除這種煩惱。
例如,DALL·E 2 可能會渲染一個模糊不清的籃球運動員,而 DALL·E 3 將根據提供的文本創建更具表現力和準確的渲染。
好消息: @OpenAI DALL-E 3 即將在 ChatGPT Plus 和 ChatGPT Enterprise 上提供 🤯
這個最新的 DALL-E 模型絕對令人驚嘆,我對它所產生的能力感到震驚。 pic.twitter.com/eTWzxiOHgB
— Logan.GPT (@OfficialLoganK) 2023 年 9 月 20 日
新系統基於ChatGPT,允許文字和圖像平台之間的無縫互動。
使用者可以聘請ChatGPT作為「腦力激盪夥伴」來完善自己的形象創意。 如果使用者喜歡生成的圖像但想要進行微小的更改,則與 ChatGPT 的對話可以用一兩句話產生這些更改。
DALL·E 3 安全機制
DALL·E 3 也特別關注安全機制。其中包括防止產生暴力、成人或仇恨內容的緩解措施。
此外,DALL·E 3 將拒絕產生包含在世公眾人物或模仿在世藝術家風格的圖像。
這些預防措施是與被稱為「紅隊」的領域專家合作開發的,他們嚴格測試系統的安全漏洞。
開發人員也在探索幫助使用者識別人工智慧產生的圖像的方法。 他們正在研究一種“來源分類器”,這是一種內部工具,可以識別一個想法是否源自於 DALL·E 3。
該工具正處於實驗階段,但其開發表明了解決錯誤訊息和圖像操縱問題的積極主動的方法。
DALL·E 3什麼時候上市?
DALL·E 3 計劃於今年 10 月向 ChatGPT Plus 和 Enterprise 客戶提供。
OpenAI 計劃提供自由許可,允許 ChatGPT 用戶自由使用、出售或交易他們創建的圖像,而無需平台許可。
微軟還計劃在未來幾週內為 Bing 的 AI 圖像創建器和設計器添加 DALL·E 3 支援。
提高影像品質並相容於最新的 DALL.E 3 型號 ✅ #微軟事件 pic.twitter.com/hLtVQS1VJO
— 必應 (@bing) 2023 年 9 月 21 日
藝術家和內容創作者如何選擇 DALL·E 3 培訓
與所有人工智慧模型一樣,DALL·E 3 從廣泛的公共資料(包括文字和圖像)中學習其功能。 這種學習過程反映了人類獲取知識的方式。
例如,在檢查了幾張貓的圖像後,人工智慧可以產生一張獨特的、全新的貓圖像,就像一個人在看到足夠多的例子後可能會畫出一隻貓一樣。
值得注意的是,一旦這些模型吸收了訓練數據,它們就不再能夠直接存取它。 當使用者與模型互動時,它依賴其內在的概念,而不是從外部資料庫中獲取。
OpenAI 試圖解決有關內容所有權的道德考慮,為藝術家提供了兩種選擇退出人工智慧培訓的方法。
網站所有者可以阻止 GPTBot(一種旨在收集訓練資料的網路爬蟲)對其網站的存取。 對於那些擁有大量圖像的人來說,將 GPTBot 添加到網站的 robots.txt 可能是更有效的途徑。
另外,OpenAI 還提供了一個表格,讓人們要求從未來的訓練資料集中刪除其內容。
值得注意的是,OpenAI 也對資料集進行了許可,因此,如果您在其他平台上啟用了第三方許可,則填寫表格可能無法保證完全刪除。
生成式人工智慧內容創作的未來
OpenAI 對 AI 成像的此次更新代表了行銷人員和內容創作者的另一項重大進步。
雖然它將使更多人能夠接觸到平面設計,但這一領域的進步為更複雜的法律和道德問題打開了大門。
特色圖片:由 Vladimka/Shutterstock 製作