尋求更好的人工智慧生成結果的思想樹

許多人都知道流行的思想鏈 (CoT) 方法可驅動生成式 AI 以獲得更好、更複雜的答案。谷歌DeepMind 和普林斯頓大學的研究人員開發了一種改進的提示策略，稱為「思想樹」(ToT)，該策略將提示提升到更高水平的結果，解鎖更複雜的推理方法和更好的結果。

研究人員解釋：

“我們展示了思想樹 (ToT) 中的有意搜索如何產生更好的結果，更重要的是，我們展示了使用語言模型來解決需要搜索或規劃的問題的有趣且有前途的新方法。”

研究人員比較了三種類型的適應症

研究論文將 ToT 與其他三種增強策略進行了比較。

1. 輸入輸出（IO）指示。
這基本上是給語言模型一個需要解決的問題並得到答案。

基於文字摘要的範例是：

參賽要求：總結下面的文章。
輸出請求：根據輸入的文章進行摘要

2. 思路

這種形式的提示是透過鼓勵語言模型遵循邏輯思考順序來引導語言模型產生連貫且相互關聯的回應。思考鏈（CoT）提示是一種指導語言模型透過推理中間步驟來解決問題的方法。

思維鏈提示範例：

問題：羅傑有 5 個網球。再買 2 罐網球。每罐有 3 個網球。他現在有多少個網球？
推理：羅傑一開始有 5 個球。 2 罐 3 個網球，每罐有 6 個網球。 5 + 6 = 11。答案：11

問題：食堂有 23 個蘋果。如果他們午餐用了 20 個蘋果，又買了 6 個，他們有幾個蘋果？

3. 與CoT的自我一致性

簡單來說，這是一種多次詢問語言模型，然後選擇出現頻率最高的答案的提示策略。

2023 年 3 月的 CoT 自洽研究論文解釋：

「它首先對一組不同的推理路徑進行採樣，而不是只採用貪婪的推理路徑，然後通過邊緣化採樣的推理路徑來選擇最一致的答案。自我一致性利用了複雜推理問題通常支持多種不同方式的直覺認為它們會帶來唯一正確的答案。”

人類認知中的雙重過程模型

研究人員受到人類決策如何被稱為人類認知的雙過程模型或雙過程理論的理論的啟發。

人類認知的雙過程模型提出，人類參與兩種類型的決策過程，一種是直覺且快速的，另一種是更深思熟慮且較慢的。

快速、自動、無意識
這種模式涉及快速、自動、無意識的思維，通常被認為是基於直覺。
緩慢、深思熟慮、有意識
這種決策模式是一個緩慢、深思熟慮和有意識的思考過程，在做出最終決定之前需要仔細考慮、分析和逐步推理。

思考樹（ToT）提示框架採用推理過程每一步的樹狀結構，讓語言模型能夠評估每一步推理，並決定該推理步驟是否可行並得出答案。如果語言模型確定推理路徑不會導致答案，則請求策略會強制它放棄該路徑（或分支）並繼續前進到另一個分支，直到達到最終結果。

思想樹（ToT）與思想鏈（CoT）

ToT 和 CoT 之間的差異在於，ToT 的推理過程採用樹分支框架，而 CoT 採取更線性的路徑。

簡單來說，CoT 告訴語言模型遵循一系列步驟來執行任務，這類似於系統 1 的認知模型，快速且自動。

ToT 類似於系統2 的認知模型，後者更加深思熟慮，告訴語言模型遵循一系列步驟，但也有一個評估者介入並審查每個步驟，如果是繼續前進的好步驟，如果不是，則停止並進行評估。繼續。其他方式

目標策略的插圖

研究論文發表了每個提示策略的示意圖，其中矩形框代表完成任務、解決問題的每個步驟中的「想法」。
以下是 ToT 推理過程的截圖：

一切鏈條的插圖並指出

這是 CoT 的示意圖，顯示了思考過程如何更像是一條直線（線性）路徑：

研究論文解釋：

「對人類問題解決的研究表明，人們搜尋組合問題空間：一棵樹，其中節點代表部分解決方案，分支對應於運算符。
修改它們。採用哪個分支是由啟發式決定的，這些啟發式有助於導航問題空間並引導問題解決者找到解決方案。

這種觀點強調了使用 LM 解決一般問題的現有方法的兩個主要缺點：

1）局部而言，他們不會探索思考過程中的不同連續體－樹的分支。

2）總體而言，它們不包含任何類型的計劃、預期或回溯來幫助評估這些不同的選項，而這種啟發式驅動的搜尋似乎是人類解決問題的特徵。

為了解決這些缺點，我們引入了思想樹（ToT），這是一種允許 LM 探索思想推理的多種路徑的範式…

透過數學遊戲進行測試

研究人員使用名為Game of 24 的數學遊戲測試了該方法。Game of 24 是數學紙牌遊戲，玩家使用一組紙牌中的四個數字（只能使用一次）來使用基本算術（加法、減法）來配對它們、乘法和除法）得到結果 24。

結果和結論

研究人員針對其他三種方法測試了 ToT 請求策略，發現它總是能產生更好的結果。

然而，他們也指出，ToT 可能不是完成 GPT-4 已經做得很好的任務所必需的。

他們的結論是：

「LM 的關聯『系統 1』可以透過基於搜尋解決問題的可能路徑樹的『系統 2』得到有益的增強。

思想樹框架提供了一種將解決問題的經典知識轉化為當代語言模型的可行方法的方法。

同時，LM 解決了這些經典方法的弱點，提供了一種解決不易形式化的複雜問題（例如創造力）的方法。
寫作

我們認為 LM 與經典人工智慧方法的這種交叉是一個令人興奮的方向。”

閱讀原始研究論文：

思想樹：用大型語言模式有意識地解決問題

Source link

預先做好網上創業準備：為何比失業後再考慮更有利？

By onlineadminOctober 21, 2024 網店創業

在不確定的經濟環境中，越來越多的人開始探索網上商業模式，期望能夠賺取額外收入，甚至轉變成全職事業。然而，很多人在失業或工作不穩定時才開始考慮創業，這種做法其實存在一些潛在風險和挑戰。相反，預先做好網上創業的準備，無論你目前的職業狀況如何，都能讓你在面對不確定性時更具彈性和應對能力。在這篇文章中，我們將深入探討為何預先做好網上創業的準備，比起等到失業或面對工作危機時才考慮，會為你帶來更多優勢。 1. 掌握主動權，避開被動局面一個人在失業後才決定創業，往往是在沒有其他選擇的情況下做出的選擇，這樣的創業動機可能較為被動。當你在職場上仍有穩定收入時開始準備創業，你便能以更從容的心態去進行市場調查、產品開發和品牌規劃，而不會因為經濟壓力而倉促做決定。此外，網上創業需要的資源並不僅僅是時間和金錢，還有學習如何操作電子商務平台、建立品牌形象、掌握數碼行銷技巧等。這些都是需要時間去學習和實踐的，如果在失業後才匆忙上手，可能會導致決策失誤或錯失商機。而預先做好準備，你可以慢慢累積經驗，逐步調整自己的策略，讓創業過程更具可控性。 2. 資金與資源的準備時間創業無論大小，都需要一定的資金投入，即使是網上創業也不例外。這些資金可能包括網站搭建、產品庫存、廣告推廣、工具訂閱等。失業後才開始創業，可能面臨資金不足的困境。而如果你在職時已經開始儲備創業資金，甚至能夠利用一部分收入投入創業，便能夠大幅減少財務壓力，讓你有更好的條件去經營業務。同時，預先開始準備創業，還能幫助你找到適合的供應鏈合作夥伴、技術支援和行銷渠道。這些資源的建立需要時間和網絡，當你在穩定狀態下經營創業準備時，能夠更仔細地篩選和安排這些合作關係，確保日後正式開展業務時能夠順利進行。 3. 時間管理與創業學習的平衡網上創業需要學習的技能眾多，例如電子商務平台的操作、數碼行銷、內容創作、SEO優化等。這些技能需要時間去熟練掌握。如果你是在失業後才開始學習這些，可能會面臨時間和壓力的雙重挑戰。然而，如果你在還有穩定收入的情況下，便能更有彈性地分配時間來學習這些技能。例如，你可以利用下班時間參加網上創業課程，在週末開始嘗試小規模經營，從中學習如何與顧客溝通、處理物流等問題。這種漸進式的學習和實踐，能夠讓你在未來面對創業全職化時，有更好的基礎和信心。 4.…

熱門討論

預先做好網上創業準備：為何比失業後再考慮更有利？

沒有網上快速致富的方法 – 不要落入“輕鬆賺錢”的陷阱!

為什麼要自己學懂在韓國直接以批發價入貨或直接從韓國時裝批發 agent 補貨？

尋求更好的人工智慧生成結果的思想樹

為什麼要自己學懂營運及製作網上時裝店?

10 個頁面會影響全站排名嗎？

谷歌悄然修復了搜尋結果中的網站名稱

預先做好網上創業準備：為何比失業後再考慮更有利？

沒有網上快速致富的方法 – 不要落入“輕鬆賺錢”的陷阱!

為什麼要自己學懂在韓國直接以批發價入貨或直接從韓國時裝批發 agent 補貨？

預先做好網上創業準備：為何比失業後再考慮更有利？

沒有網上快速致富的方法 – 不要落入“輕鬆賺錢”的陷阱!

為什麼要自己學懂在韓國直接以批發價入貨或直接從韓國時裝批發 agent 補貨？

精選推薦

預先做好網上創業準備：為何比失業後再考慮更有利？

沒有網上快速致富的方法 – 不要落入“輕鬆賺錢”的陷阱!

為什麼要自己學懂在韓國直接以批發價入貨或直接從韓國時裝批發 agent 補貨？

訂閱最新賺錢貼士

熱門討論

尋求更好的人工智慧生成結果的思想樹

研究人員比較了三種類型的適應症

人類認知中的雙重過程模型

思想樹（ToT）與思想鏈（CoT）

目標策略的插圖

一切鏈條的插圖並指出

透過數學遊戲進行測試

結果和結論

Related Posts

訂閱最新賺錢貼士