ChatGPT、百度文心一言、Bard等大語言模型展現(xiàn)出了超強(qiáng)的創(chuàng)造能力,加速了生成式AI的應(yīng)用進(jìn)程。但AI模型只能基于訓(xùn)練數(shù)據(jù)執(zhí)行各種任務(wù),無法像人類一樣利用生活知識、過往經(jīng)驗(yàn)用于復(fù)雜的推理和決策。
例如,在玩游戲時(shí),人類可以利用各種線索、常識、經(jīng)驗(yàn)以及對游戲規(guī)則的理解做出最佳決策。而AI只能通過大量訓(xùn)練學(xué)習(xí)游戲的模式,不具備人性化理解功能。一旦游戲規(guī)則或環(huán)境發(fā)生變化,AI就很難做出正確的選擇。
為了解決這些難題,克萊姆森大學(xué)AI實(shí)驗(yàn)室提出了自主認(rèn)知技術(shù)框(Autonomous Cognitive Entity,簡稱“ACE”)。通過道德、全局戰(zhàn)略、代理模型、執(zhí)行、認(rèn)知控制和任務(wù)執(zhí)行6大分層設(shè)計(jì),使AI模型可以實(shí)現(xiàn)“自主決策”和道德推理的認(rèn)知架構(gòu)。
長期以來,讓AI模型具備“常識推理”的能力一直是科研界的重中之重。而ACE框架被視為解決這個(gè)難題的創(chuàng)新性突破研究。
其實(shí)ACE概念與前不久中國科學(xué)院自動(dòng)化研究所和耶魯大學(xué)提出的“思維傳播”技術(shù)框架類似,都是讓大模型學(xué)會利用過往經(jīng)驗(yàn)增強(qiáng)復(fù)雜推理能力來處理全新的問題,只不過推理分層更加具體化,并加入了道德規(guī)范的限制保證輸出內(nèi)容的安全性。
論文地址:https://arxiv.org/abs/2310.06775
ACE技術(shù)框架得到了業(yè)界眾多技術(shù)大牛的認(rèn)可。斯坦福大學(xué)計(jì)算機(jī)科學(xué)系教授John Etchemendy表示,ACE框架標(biāo)志著人工智能研究的新范式,其分層抽象和信息反饋的設(shè)計(jì)對實(shí)現(xiàn)人工常識推理大有幫助。
麻省理工AI實(shí)驗(yàn)室主任Daniela Rus認(rèn)為,ACE框架構(gòu)建了一個(gè)集成倫理、認(rèn)知和計(jì)算原理的完整結(jié)構(gòu),為人工常識推理提供了新的研究方向。
ACE框架的總目標(biāo)是實(shí)現(xiàn)一種既高能又倫理的人工智能系統(tǒng)。其核心創(chuàng)新在于融合了頂層的抽象倫理推理與底層的具體任務(wù)實(shí)現(xiàn),構(gòu)建一個(gè)閉環(huán)完整的認(rèn)知體系。
ACE主要由道德、全局戰(zhàn)略、代理模型、執(zhí)行、認(rèn)知控制和任務(wù)執(zhí)行6大層組成,每一層集中處理不同的功能,高層處理抽象推理,低層負(fù)責(zé)具體任務(wù)執(zhí)行。
道德層
最高的道德層確定了整個(gè)系統(tǒng)的方向和原則, 其功能是定義一個(gè)自治代理的核心價(jià)值觀和倫理原則,包含3部分。
(1)基本倫理準(zhǔn)則:這是直觀的道德準(zhǔn)則,為系統(tǒng)提供基本遵循。
(2)次要原則:諸如人權(quán)義務(wù)等提供具體指導(dǎo)。
(3)使命宣言:定義代理的核心目標(biāo)和意圖。
全局戰(zhàn)略層
在接收到來自道德層的抽象使命后,全局戰(zhàn)略層會結(jié)合具體情境,制定實(shí)現(xiàn)這些使命的長期計(jì)劃,包含2部分。
(1)情境融合:吸收環(huán)境信息,理解代理面臨的具體情境。
(2)戰(zhàn)略文件:產(chǎn)出指導(dǎo)性文件,為下層提供行動(dòng)指南。
代理模型層
致力于理解一個(gè)代理在給定環(huán)境下的能力參數(shù)、系統(tǒng)結(jié)構(gòu)、限制條件等,構(gòu)建一個(gè)“自我模型”為決策提供依據(jù),包含4部分。
(1)運(yùn)行參數(shù):通過監(jiān)測獲得的遙測數(shù)據(jù)。
(2)配置信息:軟硬件架構(gòu)、版本等。
(3)能力范圍:可以完成和不能完成的事項(xiàng)。
(4)局限性:只能在特定條件下工作的約束。
執(zhí)行功能層
執(zhí)行功能層扮演“項(xiàng)目經(jīng)理”的角色,將來自高層的戰(zhàn)略使命轉(zhuǎn)化為明確的計(jì)劃路線圖。路線圖提供所有具體的執(zhí)行步驟,同時(shí)考慮資源分配和風(fēng)險(xiǎn)管理,使戰(zhàn)略落地,包含4部分。
(1)定義任務(wù)步驟:將戰(zhàn)略任務(wù)分解為細(xì)粒度操作。
(2)設(shè)置檢查點(diǎn):定義重要的中間結(jié)果以驗(yàn)收進(jìn)展。
(3)分配資源:優(yōu)化資源使用以保證計(jì)劃順利執(zhí)行。
(4)評估風(fēng)險(xiǎn):預(yù)測可能的問題并提前規(guī)劃應(yīng)對措施。
認(rèn)知控制層
認(rèn)知控制層扮演“任務(wù)管理”的角色,會根據(jù)當(dāng)前環(huán)境和反饋動(dòng)態(tài)選擇和調(diào)度合適的任務(wù),包含4部分。
(1)任務(wù)選擇:根據(jù)優(yōu)先級、環(huán)境等選擇下一個(gè)任務(wù)。
(2)任務(wù)切換:在任務(wù)間流暢切換以優(yōu)化訂單。
(3)挫折感知:如果任務(wù)重復(fù)失敗會產(chǎn)生主動(dòng)變更。
(4)內(nèi)部調(diào)節(jié):思考不同選擇的利弊。
任務(wù)執(zhí)行層
最后的任務(wù)執(zhí)行層直接與環(huán)境交互,執(zhí)行由認(rèn)知控制層下達(dá)的特定任務(wù)。根據(jù)任務(wù)類型,可以調(diào)用API接口、控制機(jī)械裝置、進(jìn)行對話等,包含3部分。
(1)數(shù)字通信:使用編程語言和接口調(diào)用實(shí)現(xiàn)數(shù)字任務(wù)
(2)物理協(xié)同:控制機(jī)器人和傳感器完成物理任務(wù)
(3)結(jié)果監(jiān)測:比較結(jié)果與預(yù)期,發(fā)送成功或失敗反饋
這種分工明確的多層設(shè)計(jì)有諸多好處:第一,不同層級可以同時(shí)并行工作,提升了效率;第二,分層的封裝和信息隱藏增強(qiáng)了系統(tǒng)的安全性和可解釋性;
第三,分層使系統(tǒng)可以模塊化迭代升級,而不需要全重構(gòu);第四,高層可以監(jiān)控低層的運(yùn)行, 當(dāng)Einmal出現(xiàn)偏差可以進(jìn)行修正,保證系統(tǒng)的可控性。
此外,ACE框架的另一個(gè)創(chuàng)新在于巧妙利用了當(dāng)前熱門的大語言模型,例如,ChatGPT、Bard等。
這些模型通過學(xué)習(xí)海量文本數(shù)據(jù),已經(jīng)展現(xiàn)了接近人類的語言理解和語言生成能力。ACE框架將語言層面融入每個(gè)層級,使語言模型不再單獨(dú)運(yùn)行,而是成為支撐整個(gè)認(rèn)知架構(gòu)的關(guān)鍵組件。
從道德層到任務(wù)層,語言模型幫助理解抽象概念,進(jìn)行策略推理,建立自我模型,甚至最終控制機(jī)器人執(zhí)任務(wù)的方式都是語言化的。
這種融合為語言模型提供了明確的上下文和指導(dǎo),讓其生成的輸出更加準(zhǔn)確,避免了“自說自話”的問題。
這也表明,大語言模型也可以在系統(tǒng)級扮演重要角色,而不僅僅是完成單個(gè)語言任務(wù)。ACE框架展示了如何更好地利用大語言模型的潛力,將其打造為推動(dòng)認(rèn)知發(fā)展的核心引擎,為人工常識推理提供動(dòng)力。
本文素材來源克萊姆森大學(xué)論文,如有侵權(quán)請聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國RPA生態(tài)發(fā)展 | 流 > 讓ChatGPT等模型學(xué)會自主思考!開創(chuàng)性技術(shù)“自主認(rèn)知”框架
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國