OpenAI 是一年多前推出 ChatGPT 的公司,最近在社群媒體上回應了人們對 GPT-4 在社群媒體和 Google 評論上「懶惰」表現的擔憂。

此舉是在收到越來越多的線上用戶回饋後做出的,其中甚至包括對該公司的Google評論的一星評價。
OpenAI 提供有關訓練聊天模型、效能評估和 A/B 測試的見解
OpenAI 透過其 Twitter 帳戶 @ChatGPTapp 詳細介紹了訓練聊天模型所涉及的複雜性。

該組織強調,該過程不是“清潔的工業過程”,培訓課程的變化可能會導致人工智慧的個性、創作風格和政治偏見出現明顯差異。
全面的AI模型測試包括離線評估指標和線上A/B測試。 推出新模型的最終決定是基於數據驅動的方法來改善「真實」的使用者體驗。
OpenAI Google 評論分數受 GPT-4 效能和計費問題影響
這一解釋是在 X 等社群媒體上幾週的用戶回饋 GPT-4 變得越來越糟糕之後做出的。
我不知道其他人是否注意到這一點,GPT-4 Turbo 的性能明顯比標準 GPT-4 差。
我知道它現在處於預覽狀態,但情況更糟。
— 馬克斯溫巴赫 (@MaxWinebach) 2023 年 11 月 8 日
最近有人爭論GPT-4是否變得「懶惰」了。 我的軼事證據表明這可能是真的。
我重複了使用程式碼解釋器進行的一系列舊分析。 GPT-4 仍然知道該做什麼,但一直告訴我去做這項工作。 現在一步很多,有的還很奇怪。 pic.twitter.com/OhGAMtd3Zq
— 伊森‧莫里克 (@emollick) 2023 年 11 月 28 日
OpenAI 社群論壇上也出現了投訴。

這次經驗讓一位用戶透過 Google 評論給 OpenAI 留下了一星評價。 其他投訴涉及帳戶、計費和人工智慧的人工性質。

GPT-4 並不是本地審核者抱怨的唯一問題。 在 Yelp 上,OpenAI 對 ChatGPT 3.5 的表現給予一星評級。
OpenAI 現在在 Google 地圖上只有 3.8 顆星,在 Yelp 上只有 1 顆星!
GPT-4 的降級確實損害了它的評級。 我希望生意能夠生存下去。https://t.co/RF8uJH1WQ5 pic.twitter.com/OghAZLCiVu
— 內特陳 (@nathanwchan) 2023 年 12 月 9 日
投訴內容:

在 OpenAI 相關新聞中,最受歡迎的評論與最近關於工作場所不穩定的謠言一致,聲稱 OpenAI 是一個「露天環境。不友善。有毒的工人」。

Glassdoor 對 OpenAI 最有幫助的評論表明,員工的挫折感和產品開發問題源於公司將重點轉向利潤。

這一事件為客戶和員工體驗如何透過本地評論和業務評級平台影響任何業務提供了獨特的見解。

Google SGE 強調 Google 的正面評價
除了偶爾的抱怨之外,Google的評審人員還認識到 OpenAI 技術在多個領域的革命性影響。
關於該公司最正面的評論出現在 Google SGE(搜尋生成體驗)。

結論
OpenAI 最近對訓練聊天模型的見解以及對 GPT-4 性能的公眾反饋的回應說明了 AI 技術的動態和不斷發展的本質及其對那些依賴 AI 平台的人的影響。
特別是那些在 OpenAI 暫停新訂閱和更新期間進入等待名單後剛剛收到加入 ChatGPT Plus 邀請的人。 或為即將發布的 GPT 商店版本開發 GPT 的人。
隨著人工智慧的進步,這些領域的專業人士必須保持靈活、消息靈通,並對技術發展和公眾對這些進步的接受做出反應。
特色圖片:Tada Images/Shutterstock