中國(guó)科學(xué)院自動(dòng)化研究所與耶魯大學(xué)計(jì)算機(jī)系研究人員聯(lián)合發(fā)布了,一份名為《思維傳播:用大型語(yǔ)言模型進(jìn)行基于類比的復(fù)雜推理》的論文。
ChatGPT等大型語(yǔ)言模型展示出了超強(qiáng)的創(chuàng)造能力,只需簡(jiǎn)單的文本提示就能生成小說(shuō)、營(yíng)銷創(chuàng)意、簡(jiǎn)歷等各種文本內(nèi)容。但在處理復(fù)雜的推理任務(wù)時(shí)卻差強(qiáng)人意,主要面臨從0推理以及在任務(wù)推理過(guò)程中錯(cuò)誤累加兩大難題。
為了解決這些難題,研究人員提出了思維傳播(Thought Propagation,簡(jiǎn)稱“TP”)的技術(shù)框架,通過(guò)提出類比問(wèn)題、解決類比問(wèn)題、聚合類比問(wèn)題,從而提升大語(yǔ)言模型的復(fù)雜推理能力。
根據(jù)在最短路徑尋優(yōu)、創(chuàng)造性寫作和語(yǔ)言模型智能體計(jì)劃測(cè)試結(jié)果顯示,相比傳統(tǒng)方法,思維傳播將性能分別提升了12%、13%和15%。
簡(jiǎn)單來(lái)說(shuō),就是為大語(yǔ)言模型添加一種擬人化的“類比思想”,讓其學(xué)會(huì)總結(jié)、利用過(guò)往的成功經(jīng)驗(yàn),不必總是從0開始。
論文地址:https://arxiv.org/abs/2310.03965
思維傳播框架簡(jiǎn)單介紹
從論文內(nèi)容來(lái)看,思維傳播框架模擬的就是人類的“類比思想”。當(dāng)我們遇見(jiàn)新問(wèn)題時(shí),經(jīng)常會(huì)使用過(guò)往的經(jīng)驗(yàn)、行動(dòng)來(lái)解決這些難題,這也被稱為“類比推理”。
思維傳播框架主要由LLM Propose、LLM Solve、LLM Aggregate、多層實(shí)現(xiàn)和即插即用等多個(gè)模塊組成。
LLM Propose :通過(guò)使用 prompt 的方式讓語(yǔ)言模型提出與輸入問(wèn)題相關(guān)的類比問(wèn)題。提出的類比問(wèn)題可以從兩個(gè)角度幫助解決輸入問(wèn)題:(1)類比問(wèn)題的解可以直接轉(zhuǎn)移應(yīng)用到輸入問(wèn)題上;(2)解決類比問(wèn)題可以推導(dǎo)出針對(duì)輸入問(wèn)題的計(jì)劃。
LLM Solve:使用現(xiàn)有的提示方法(如 Chain-of-Thought)來(lái)解決輸入問(wèn)題和 LLM Propose 模塊提出的類比問(wèn)題。得到輸入問(wèn)題和類比問(wèn)題的初始解。
LLM Aggregate:該模塊聚合類比問(wèn)題的解來(lái)增強(qiáng)輸入問(wèn)題。具體來(lái)說(shuō),有兩種方式: (1)提示語(yǔ)言模型基于類比問(wèn)題的結(jié)果直接產(chǎn)生輸入問(wèn)題的新解。
(2)比較輸入問(wèn)題和類比問(wèn)題,并基于類比問(wèn)題的結(jié)果推導(dǎo)針對(duì)輸入問(wèn)題的計(jì)劃。然后執(zhí)行該計(jì)劃來(lái)糾正輸入問(wèn)題的中間推理。
多層實(shí)現(xiàn):可以堆疊多個(gè)思維傳播層,以利用 K 跳的類比問(wèn)題來(lái)逐層改進(jìn)輸入問(wèn)題的解。
即插即用:思維傳播兼容現(xiàn)有方法,可以應(yīng)用到不同的推理任務(wù)中,只需要替換 LLM Solve 模塊的具體實(shí)現(xiàn)。
思維傳播框架性能測(cè)試
為驗(yàn)證思維傳播框架的性能,研究團(tuán)隊(duì)在最短路徑尋優(yōu)、創(chuàng)造性寫作和語(yǔ)言模型智能體計(jì)劃三大任務(wù)上進(jìn)行了比較實(shí)驗(yàn)。
結(jié)果顯示,思維傳播相比于僅使用提示方法的基線系統(tǒng),在找到最優(yōu)解的性能提升12%,在生成連貫段落的性能提升13%,在完成任務(wù)的性能提升15%。
研究人員指出,這三個(gè)任務(wù)分別需要搜索圖結(jié)構(gòu)數(shù)據(jù)、開放式寫作和長(zhǎng)時(shí)間計(jì)劃,當(dāng)前的提示方法仍面臨挑戰(zhàn)。
而思維傳播框架展現(xiàn)了在這些復(fù)雜推理任務(wù)上取得顯著提升的潛力。同時(shí),該框架提供了一種可即插即用的通用類比推理方法,可避免針對(duì)特定任務(wù)設(shè)計(jì)定制提示,降低使用門檻。
思維傳播框架對(duì)大語(yǔ)言模型的重要性
從思維傳播框架在GPT-4、GPT-3.5等大語(yǔ)言模型的測(cè)試結(jié)果來(lái)看,可顯著提升復(fù)雜推理能力,并減少推理的錯(cuò)誤。
提高復(fù)雜推理能力: 思維傳播可以重用解決類比問(wèn)題的經(jīng)驗(yàn),來(lái)增強(qiáng)大語(yǔ)言模型處理復(fù)雜任務(wù)的能力,例如,最短路徑尋優(yōu)、創(chuàng)造性寫作等需要多步推理的任務(wù)。
減少推理錯(cuò)誤:通過(guò)比較類比問(wèn)題的解來(lái)指導(dǎo)輸入問(wèn)題的推理,可以幫助大語(yǔ)言模型避免從0開始推理時(shí)容易堆積的錯(cuò)誤。
減少任務(wù)特定提示設(shè)計(jì):提供了一個(gè)通用的類比推理框架,可以即插即用地應(yīng)用到不同任務(wù),減少了針對(duì)特定任務(wù)設(shè)計(jì)定制提示的工作量。
提供新的研究視角:思維傳播為研究社區(qū)提供了,從類比推理視角來(lái)增強(qiáng)大模型復(fù)雜推理能力的新思路和有效途徑。
表現(xiàn)優(yōu)于同等規(guī)模模型:在多個(gè)任務(wù)上的試驗(yàn)表明,基于思維傳播的GPT-4明顯優(yōu)于不使用該框架的GPT-4,以及其他同等計(jì)算量的模型。
可擴(kuò)展性:思維傳播是是一個(gè)通用框架,未來(lái)可繼續(xù)優(yōu)化和擴(kuò)展到更多的復(fù)雜推理任務(wù)中,以發(fā)揮GPT-4等大語(yǔ)言模型的潛力。
總體來(lái)說(shuō),思維傳播框架的優(yōu)勢(shì)在于可以重用類比問(wèn)題的解來(lái)直接得到輸入問(wèn)題的新解,避免從0開始推理。
同時(shí),它還可以學(xué)習(xí)到解決類比問(wèn)題的總體策略,推導(dǎo)出計(jì)劃來(lái)指導(dǎo)輸入問(wèn)題的推理,以此規(guī)避中間步驟的錯(cuò)誤。
本文素材來(lái)源中國(guó)科學(xué)院自動(dòng)化研究所論文,如有侵權(quán)請(qǐng)聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國(guó) | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國(guó)RPA生態(tài)發(fā)展 | 流 > 中科院提出“思維傳播”,極大增強(qiáng)ChatGPT等模型復(fù)雜推理能力
熱門信息
閱讀 (14728)
1 2023第三屆中國(guó)RPA+AI開發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (13753)
2 《Market Insight:中國(guó)RPA市場(chǎng)發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國(guó)閱讀 (13055)
3 「RPA中國(guó)杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國(guó)產(chǎn)業(yè)智能大會(huì)成功召開閱讀 (11567)
5 《2022年中國(guó)流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國(guó)