去年,AutoGPT的出現(xiàn)讓我們見識到了AI代理強(qiáng)大的自動(dòng)化能力,并開創(chuàng)了一個(gè)全新的AI代理賽道。但在子任務(wù)調(diào)度、資源分配以及AI之間協(xié)作還有不少的難題。
因此,羅格斯大學(xué)的研究人員開源了AIOS,這是一種以大模型為核心的AI代理操作系統(tǒng)。可有效解可決隨著AI代理的增加,資源調(diào)用率低的難題,同時(shí)能促進(jìn)代理之間的上下文切換、實(shí)現(xiàn)并發(fā)執(zhí)行代理并維護(hù)代理的訪問控制。
開源地址:https://github.com/agiresearch/AIOS
論文地址:https://arxiv.org/abs/2403.16971
AIOS的架構(gòu)和我們使用的PC操作系統(tǒng)差不多,主要分為應(yīng)用層、內(nèi)核層和硬件層三大塊。唯一不同的是,AIOS在內(nèi)核層中構(gòu)建了一個(gè)專門管理與大模型相關(guān)任務(wù)的內(nèi)核管理器。
應(yīng)用層,主要由代理應(yīng)用程序構(gòu)成(例如,旅行代理、數(shù)學(xué)代理、代碼代理等);內(nèi)核層由傳統(tǒng)OS系統(tǒng)和大模型相結(jié)合開發(fā),OS系統(tǒng)主要用于文件管理,大模型則用于AI代理的調(diào)度和管理;
硬件層由CPU、GPU、內(nèi)存和外設(shè)等硬件設(shè)備構(gòu)成,但是大模型的內(nèi)核無法與硬件直接交互,而是通過內(nèi)核層提供的調(diào)用來間接管理硬件資源,以確保系統(tǒng)完整性和效率。
AI代理調(diào)度器
AI代理調(diào)度器主要負(fù)責(zé)對大模型的代理請求進(jìn)行合理調(diào)度和優(yōu)化,以充分利用大模型的計(jì)算資源。當(dāng)多個(gè)代理同時(shí)向大模型發(fā)起請求時(shí),調(diào)度器需根據(jù)特定調(diào)度算法對請求進(jìn)行排序,避免單一代理長時(shí)間占用大模型而導(dǎo)致其他代理長時(shí)間等待。
此外,AIOS的設(shè)計(jì)還支持更復(fù)雜的調(diào)度策略,例如,考慮代理請求間的依賴關(guān)系,以實(shí)現(xiàn)更優(yōu)化的資源分配。
在沒有調(diào)度指令時(shí),代理需按順序逐一執(zhí)行任務(wù),后續(xù)代理需等待較長時(shí)間;而采用調(diào)度算法后,各代理的請求能夠交錯(cuò)并行執(zhí)行,顯著降低了整體等待時(shí)間和響應(yīng)延遲。
上下文管理器
由于大模型生成過程普遍采用Beam Search等啟發(fā)式搜索,會(huì)逐步構(gòu)建搜索樹并評估不同路徑最終給出結(jié)果。
但在生成過程中大模型若被調(diào)度器中斷,為避免所有中間狀態(tài)丟失而浪費(fèi)之前的計(jì)算,上下文管理器會(huì)對當(dāng)前的Beam Search樹狀態(tài)(包括各路徑概率等)進(jìn)行快照保存。
當(dāng)大模型重新獲得執(zhí)行資源后,上下文管理器能夠準(zhǔn)確地從中斷處恢復(fù)之前的Beam Search狀態(tài),繼續(xù)生成剩余部分,確保最終結(jié)果的完整性和準(zhǔn)確性。
此外,多數(shù)大模型存在上下文長度限制,而實(shí)際場景中的輸入上下文往往會(huì)超出該限制。為解決這一難題,上下文管理器集成了文本摘要等功能,能夠?qū)^長的上下文進(jìn)行壓縮或分塊處理,使大模型能夠高效理解并處理長上下文信息。
內(nèi)存管理器
內(nèi)存管理器主要負(fù)責(zé)管理短期內(nèi)存資源,為每個(gè)AI代理的交互日志和中間數(shù)據(jù)提供高效的臨時(shí)存儲(chǔ)。
當(dāng)AI代理處于等待執(zhí)行或正在運(yùn)行狀態(tài)時(shí),其所需的數(shù)據(jù)將被保存在由內(nèi)存管理器分配的內(nèi)存塊中。一旦代理任務(wù)結(jié)束,相應(yīng)的內(nèi)存塊也會(huì)被系統(tǒng)回收,以確保內(nèi)存資源的高效利用。
AIOS會(huì)為每個(gè)AI代理分配獨(dú)立的內(nèi)存,并通過訪問管理器來實(shí)現(xiàn)不同代理之間內(nèi)存隔離。未來,AIOS會(huì)引入更復(fù)雜的內(nèi)存共享機(jī)制和層級緩存策略,以進(jìn)一步優(yōu)化AI代理的整體性能。
本文素材來源AIOS論文,如有侵權(quán)請聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國RPA生態(tài)發(fā)展 | 流 > 開源大模型AI代理操作系統(tǒng):像Windows一樣,操控AI代理
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會(huì)成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國