許多人都知道流行的思想鏈 (CoT) 方法可驅動生成式 AI 以獲得更好、更複雜的答案。 谷歌DeepMind 和普林斯頓大學的研究人員開發了一種改進的提示策略,稱為「思想樹」(ToT),該策略將提示提升到更高水平的結果,解鎖更複雜的推理方法和更好的結果。
研究人員解釋:
“我們展示了思想樹 (ToT) 中的有意搜索如何產生更好的結果,更重要的是,我們展示了使用語言模型來解決需要搜索或規劃的問題的有趣且有前途的新方法。”
研究人員比較了三種類型的適應症
研究論文將 ToT 與其他三種增強策略進行了比較。
1. 輸入輸出(IO)指示。
這基本上是給語言模型一個需要解決的問題並得到答案。
基於文字摘要的範例是:
參賽要求:總結下面的文章。
輸出請求:根據輸入的文章進行摘要
2. 思路
這種形式的提示是透過鼓勵語言模型遵循邏輯思考順序來引導語言模型產生連貫且相互關聯的回應。 思考鏈(CoT)提示是一種指導語言模型透過推理中間步驟來解決問題的方法。
思維鏈提示範例:
問題:羅傑有 5 個網球。 再買 2 罐網球。 每罐有 3 個網球。 他現在有多少個網球?
推理:羅傑一開始有 5 個球。 2 罐 3 個網球,每罐有 6 個網球。 5 + 6 = 11。答案:11問題:食堂有 23 個蘋果。 如果他們午餐用了 20 個蘋果,又買了 6 個,他們有幾個蘋果?
3. 與CoT的自我一致性
簡單來說,這是一種多次詢問語言模型,然後選擇出現頻率最高的答案的提示策略。
2023 年 3 月的 CoT 自洽研究論文解釋:
「它首先對一組不同的推理路徑進行採樣,而不是只採用貪婪的推理路徑,然後通過邊緣化採樣的推理路徑來選擇最一致的答案。自我一致性利用了複雜推理問題通常支持多種不同方式的直覺認為它們會帶來唯一正確的答案。”
人類認知中的雙重過程模型
研究人員受到人類決策如何被稱為人類認知的雙過程模型或雙過程理論的理論的啟發。
人類認知的雙過程模型提出,人類參與兩種類型的決策過程,一種是直覺且快速的,另一種是更深思熟慮且較慢的。
- 快速、自動、無意識
這種模式涉及快速、自動、無意識的思維,通常被認為是基於直覺。 - 緩慢、深思熟慮、有意識
這種決策模式是一個緩慢、深思熟慮和有意識的思考過程,在做出最終決定之前需要仔細考慮、分析和逐步推理。
思考樹(ToT)提示框架採用推理過程每一步的樹狀結構,讓語言模型能夠評估每一步推理,並決定該推理步驟是否可行並得出答案。 如果語言模型確定推理路徑不會導致答案,則請求策略會強制它放棄該路徑(或分支)並繼續前進到另一個分支,直到達到最終結果。
思想樹(ToT)與思想鏈(CoT)
ToT 和 CoT 之間的差異在於,ToT 的推理過程採用樹分支框架,而 CoT 採取更線性的路徑。
簡單來說,CoT 告訴語言模型遵循一系列步驟來執行任務,這類似於系統 1 的認知模型,快速且自動。
ToT 類似於系統2 的認知模型,後者更加深思熟慮,告訴語言模型遵循一系列步驟,但也有一個評估者介入並審查每個步驟,如果是繼續前進的好步驟,如果不是,則停止並進行評估。繼續。 其他方式
目標策略的插圖
研究論文發表了每個提示策略的示意圖,其中矩形框代表完成任務、解決問題的每個步驟中的「想法」。
以下是 ToT 推理過程的截圖:

一切鏈條的插圖並指出
這是 CoT 的示意圖,顯示了思考過程如何更像是一條直線(線性)路徑:

研究論文解釋:
「對人類問題解決的研究表明,人們搜尋組合問題空間:一棵樹,其中節點代表部分解決方案,分支對應於運算符。
修改它們。 採用哪個分支是由啟發式決定的,這些啟發式有助於導航問題空間並引導問題解決者找到解決方案。這種觀點強調了使用 LM 解決一般問題的現有方法的兩個主要缺點:
1)局部而言,他們不會探索思考過程中的不同連續體-樹的分支。
2)總體而言,它們不包含任何類型的計劃、預期或回溯來幫助評估這些不同的選項,而這種啟發式驅動的搜尋似乎是人類解決問題的特徵。
為了解決這些缺點,我們引入了思想樹(ToT),這是一種允許 LM 探索思想推理的多種路徑的範式…
透過數學遊戲進行測試
研究人員使用名為Game of 24 的數學遊戲測試了該方法。Game of 24 是數學紙牌遊戲,玩家使用一組紙牌中的四個數字(只能使用一次)來使用基本算術(加法、減法)來配對它們、乘法和除法)得到結果 24。
結果和結論
研究人員針對其他三種方法測試了 ToT 請求策略,發現它總是能產生更好的結果。
然而,他們也指出,ToT 可能不是完成 GPT-4 已經做得很好的任務所必需的。
他們的結論是:
「LM 的關聯『系統 1』可以透過基於搜尋解決問題的可能路徑樹的『系統 2』得到有益的增強。
思想樹框架提供了一種將解決問題的經典知識轉化為當代語言模型的可行方法的方法。
同時,LM 解決了這些經典方法的弱點,提供了一種解決不易形式化的複雜問題(例如創造力)的方法。
寫作我們認為 LM 與經典人工智慧方法的這種交叉是一個令人興奮的方向。”
閱讀原始研究論文:
思想樹:用大型語言模式有意識地解決問題

