GPT-4等大模型迎來進化轉折點：不只是使用，還會自己制作工具了

發布時間：2023-06-14 19:41:20

在人類的進化史中，制作和使用工具是關鍵的轉折點。如今，在 Google Deepmind 等最新的研究中，大語言模型也具備了相似的能力，進化成了

在人類的進化史中，制作和使用工具是關鍵的轉折點。如今，在 Google Deepmind 等最新的研究中，大語言模型也具備了相似的能力，進化成了工具制作者。

大語言模型的崛起

大語言模型（LLM）是指使用大量文本數據訓練的深度學習模型，可以生成類似于人類語言的文本。目前，開源的大語言模型主要有三大類：ChatGLM衍生的大模型（wenda、ChatSQL等）、LLaMA衍生的大模型（Alpaca、Vicuna、BELLE、Phoenix、Chimera等）、Bloom衍生的大模型（Bloomz、BELLE、Phoenix等）?。

其中，GPT-4是OpenAI最新發布的大語言模型，也是目前最先進的系統之一12。GPT-4采用了多模態的設計，可以接受圖像和文本輸入，并輸出文本。GPT-4在各種專業和學術的基準測試中表現出了人類水平的性能，例如，在模擬律師資格考試中得分位于考生前10%；而GPT-3.5則位于考生后10%2。

大語言模型的創新

除了在廣泛的NLP任務中表現出卓越的能力，大語言模型還展現出能夠實現通用人工智能某些方面的良好跡象。例如，它們可以進行復雜的推理、創造和協作，并處理更長和更細致的上下文12。

此外，與人類的智能進化類似，大語言模型在最近的研究中被揭示出使用外部工具從而提升解決問題能力及效率的潛力。需要注意的是，這些工具使用方法的適用性很大程度程度上取決于是否有合適的工具。從人類進化的里程碑可以發現，人類進化的關鍵轉折點是人類有能力制造工具來解決出現的困難?。

受到制造工具對人類重要性的啟發，在本文中，Google Deepmind、普林斯頓和斯坦福大學的研究者將這種「進化」的概念應用于LLM領域，進行了初步探索?。他們提出了一個閉環框架，在這個框架中LLM作為工具制作者（LLMs As Tool Makers ，LATM），使其能夠生成自己的可重新使用的工具來處理新任務?。

大語言模型的應用

LATM框架包括兩個關鍵階段：工具制作和工具使用。每個階段都利用不同類型的大語言模型來平衡性能和成本效率。對于工具制作階段，該階段采用強大但成本更高昂的模型（例如GPT-4）作為工具制作者。工具制作者通過特定任務的一些演示來創建通用和可復用的工具（作為Python函數實現）。對于工具使用階段，該階段涉及一個輕量級且具有成本效益的模型（例如GPT-3.5 Turbo），用作工具使用者。工具使用者利用驗證后的工具來解決任務的不同實例?。

這種方法不僅增強了LLM解決問題的能力，并能夠顯著降低處理一系列任務的平均計算成本。此外，Python函數時一種更通用的思維鏈，增強了整體效用和靈活性，因此可用于解決涉及算法推理能力

可能存在多種合理方式繼續寫下去，以下僅為一種可能：

大語言模型的挑戰

盡管LATM框架為LLM提供了一個創新和有效的方法來生成和使用工具，但它也面臨著一些挑戰和局限性。首先，在生成Python函數時，LLM需要遵循正確且合法的語法規則，并確保函數可以執行且無錯誤。這可能需要LLM具備一定程度的編程知識和調試能力?。其次，在選擇合適的工具時，LLM需要判斷任務類型和難度，并評估不同的工具之間的優劣。這可能需要LLM具備一定程度的元認知和元學習能力?。最后，在使用外部工具時， LLM需要注意保護用戶隱私和數據安全，并避免生成或傳播有害或不真實的信息。這可能需要LLM具備一定程度的道德和責任感?。

大語言模型的前景

總之， LATM框架為LLM開辟了一個新穎且有前景的研究方向，模仿了人類在創建和使用工具方面的進化飛躍，為開辟使用LLM生成的工具的社區提供了無限可能。隨著技術的不斷發展，我們期待看到更多更強大的大語言模型，不僅可以生成文字，還可以生成圖像、音頻、視頻等多媒體內容，并與用戶進行更自然、更智能、更友好的交互。我們也希望看到更多更負責任的研究者和開發者，不僅關注技術的創新和效果，還關注技術的安全和影響，并與社會共同探討如何合理地利用和管理這些強大而復雜的人造智能系統。

大語言模型能力提高,各種AI應用體驗和質量會提高,工具也更簡單實用。最重要的是學習運用各種AI工具,大幅釋放生產力。想上手使用new bing，了解更多AI技術、應用和ChatGPT進展,歡迎點擊如下鏈接加入 ?

GPT4快速上手體驗

上一篇：大眾的1.4T即將謝幕全新1.5T發動機要來了最早年內發布

下一篇：4c