據報道,OpenAI 正在開發一款將直接挑戰Google的搜尋引擎。 但報告中缺少的細節引發了人們的疑問:OpenAI 是否正在創建一個獨立的搜尋引擎,或者該公告是否有其他原因。
OpenAI 網路搜尋報告
《The Information》發表的報告稱,OpenAI 正在開發一款網路搜尋產品,將直接與Google競爭。 該報告的一個關鍵細節是,它將部分由微軟的搜尋引擎 Bing 提供支援。 除此之外,沒有其他細節,包括它將是一個獨立的搜尋引擎還是整合到 ChatGPT 中。
所有報告都表明這是對谷歌的直接挑戰,所以讓我們從這裡開始。
1. OpenAI 組裝對 Google 來說是一個挑戰嗎?
據說 OpenAI 使用 Bing Search 作為傳聞中的搜尋引擎的一部分,它是 GPT-4 與 Bing Search 的組合,加上中間的東西來協調兩者。
在這種情況下,OpenAI 沒有做的是開發自己的搜尋索引技術,它使用 Bing。
那麼 OpenAI 建立搜尋引擎剩下的就是弄清楚搜尋介面如何與 GPT-4 和 Bing 互動。
Bing 已經使用微軟所謂的編排層解決了這個問題。 Bing Chat 使用檢索增強生成 (RAG) 透過添加 Web 搜尋資料作為 GPT-4 建立的回應的上下文來增強回應。 要了解有關編排和 RAG 如何工作的更多信息,請觀看 Microsoft 首席技術官 Kevin Scott 在 31:45 分鐘在 Microsoft Build 2023 活動上的主題演講)。
如果 OpenAI 正在為 Google 搜尋帶來挑戰,那麼 OpenAI 到底還有哪些事情是微軟尚未透過 Bing Chat 做的呢? Bing 是一種經驗豐富且成熟的搜尋技術,而 OpenAI 缺乏這種經驗。
OpenAI 正在挑戰Google嗎? 一個更合理的答案是,Bing 正在使用 OpenAI 作為代理來挑戰 Google。
2. OpenAI有挑戰Google的勢頭嗎?
ChatGPT 是有史以來成長最快的應用程序,目前擁有約 1.8 億用戶,兩個月內就達到了 Facebook 和 Twitter 花費數年時間的水平。
然而,儘管有這樣的優勢,Google的領先地位對於 OpenAI 來說仍然是一座陡峭的山峰。 請注意,Google 在全球擁有約 30-40 億用戶,比 OpenAI 的 1.8 億用戶還要多。
假設OpenAI的1.8億用戶平均每天進行4次搜索,那麼每天的搜尋次數可能會達到7.2億次。
Statista 估計 Google 每分鐘有 630 萬次搜索,相當於每天超過 90 億次搜索。
如果 OpenAI 想要競爭,他們需要提供有用的產品,並且有令人信服的使用理由。 例如,Google和蘋果在行動裝置生態系統中擁有忠實的受眾,該生態系統將它們整合到用戶的日常生活中,無論是工作還是家庭。 很明顯,僅僅建立一個搜尋引擎不足以進行競爭。
實際上,OpenAI 如何才能達到如此普遍和實用的水平?
OpenAI 不僅面臨著與Google的艱苦戰鬥,還面臨著與微軟和蘋果的艱苦戰鬥。 如果算上物聯網應用程式和小工具,亞馬遜也將加入到已經滲透到數十億用戶日常生活中的競爭對手名單中。
OpenAI 沒有動力推出搜尋引擎來與Google競爭,因為它沒有支援融入用戶生活的生態系統。
3. OpenAI沒有資訊檢索經驗
在研究論文和專利中,搜尋的正式名稱為資訊檢索 (IR)。 在 Arxiv.org 研究文章儲存庫中進行任何搜尋都找不到 OpenAI 研究人員撰寫的與資訊檢索相關的文章。 對於與資訊檢索(IR)相關的專利研究也是如此。 OpenAI 的研究文章清單也缺乏 IR 相關的研究。
這並不是說 OpenAI 在保密。 OpenAI 長期以來一直發表有關其正在開發的技術的研究論文。 IR 的研究尚不存在。 那麼,如果OpenAI真打算挑戰谷歌,這場大火的硝煙又在哪裡呢?
可以合理猜測,搜尋並不是 OpenAI 目前正在開發的東西。 沒有跡象表明他甚至在考慮建立搜尋引擎,什麼都沒有。
4. OpenAI搜尋引擎是微軟的專案嗎?
有大量證據表明,微軟正在積極研究如何將法學碩士用作搜尋引擎的一部分。
以下所有研究論文均屬於資訊檢索(也稱為搜尋)、人工智慧和自然語言計算領域。
以下是 2024 年的一些研究文章:
增強人工註釋:利用大型語言模型和高效的批次
這是關於使用人工智慧對搜尋查詢進行排名。
使用大型語言模型擷取結構化實體
本研究論文發現了一種從非結構化文字(例如網頁)中提取結構化資訊的方法。 這就像將網頁(非結構化資料)轉換為機器可理解的格式(結構化資料)。
使用大型語言模型改進文字嵌入(此處為 PDF 版本)
本研究論文討論了一種實現可用於資訊檢索 (IR) 的高品質文本嵌入的方法。 文本嵌入是指以演算法可以用來理解語意和單字之間關係的方式來創建文本表示。
上述研究論文解釋了其用途:
「文本嵌入是自然語言的向量表示,對其語義資訊進行編碼。它們廣泛應用於各種自然語言處理(NLP)任務,例如資訊檢索(IR)、問答等。在 IR 領域,首先-階段檢索通常依賴文字嵌入,使用近似最近鄰搜尋技術從大規模語料庫中有效地召回一小組候選文檔」。
還有更多與搜尋相關的 Microsoft 研究,但這些是專門與搜尋以及大型語言模型(如 GPT-4.5)相關的研究。
追蹤麵包屑的痕跡可以直接找到微軟,因為 OpenAI 所規劃的任何搜尋引擎都採用了該技術……如果這個謠言屬實的話。
5.謠言注定會搶走雙子座的風頭嗎?
OpenAI 正在推出競爭性搜尋引擎的傳聞於 2 月 14 日發布。 第二天,也就是 2 月 15 日,Google在 2 月 8 日發布了 Gemini Advanced 後,宣布發布 Gemini 1.5。
隔天 OpenAI 的公告完全蓋過了 Gemini 的公告,這難道是巧合嗎? 時機令人難以置信。
至此,OpenAI搜尋引擎還只是一個謠言。
精選圖片由 Shutterstock/rafapress 提供