今天凌晨,OpenAI全資收購(gòu)io的消息占據(jù)了大部分頭條。同時(shí)OpenAI也“悄悄地”放出了另外一個(gè)重磅消息,用于開發(fā)智能體的核心API——Responses API支持MCP服務(wù)。
傳統(tǒng)方法,我們?cè)陂_發(fā)智能體需要通過函數(shù)調(diào)用與外部服務(wù)交互,每次操作都涉及從大模型到后端再到外部服務(wù)的網(wǎng)絡(luò)傳輸,導(dǎo)致多次跳轉(zhuǎn)、延遲會(huì)很高,并增加擴(kuò)展和管理的復(fù)雜性。
現(xiàn)在Responses API支持了MCP,開發(fā)者無(wú)需為每個(gè)函數(shù)調(diào)用手動(dòng)連接特定服務(wù),而是可以將模型配置為指向一個(gè)或多個(gè)MCP服務(wù)。
Responses API支持MCP
自O(shè)penAI發(fā)布Responses API以來(lái),已有數(shù)十萬(wàn)開發(fā)人員通過該API處理了數(shù)萬(wàn)億token數(shù)據(jù),并開發(fā)了各種各樣的智能體應(yīng)用,包括Zencoder的編碼智能體、Revi用于私募股權(quán)和投資銀行的市場(chǎng)智能體,以及MagicSchool AI的教育智能體。
為了進(jìn)一步簡(jiǎn)化智能體開發(fā),Responses API支持了MCP服務(wù),開發(fā)人員只需幾行代碼即可將智能體連接到強(qiáng)大的外部工具和服務(wù)。
例如,只需要9行代碼,就能將你的智能體鏈接到電商平臺(tái)Shopify。
在過去,我們需要編寫自定義cart_add或create_payment_link包裝器并托管自己的中繼服務(wù)器?,F(xiàn)在全部簡(jiǎn)化了,一個(gè)指向輕松搞定。
只用了13行代碼將智能體連接到云通信平臺(tái)Twilio。而之前,需要在你的后端中整合兩個(gè)工具調(diào)用,并自行批處理最終的短信負(fù)載。
支持MCP后,還有一個(gè)好處就是可以集中管理工具,使得智能體能夠高效地調(diào)用外部服務(wù)。我們可以使用allowed_tools參數(shù)精確控制智能體能夠訪問的工具,從而避免不必要的工具調(diào)用、上下文膨脹以及縮短響應(yīng)時(shí)間。
例如,在處理用戶查詢時(shí),智能體可以根據(jù)預(yù)設(shè)的規(guī)則選擇最合適的工具進(jìn)行調(diào)用,而不是盲目地嘗試所有可能的工具。
在使用MCP時(shí),還可以通過精確的權(quán)限控制確保智能體的安全性。例如,可以限制智能體只能調(diào)用某些特定的工具,或者在調(diào)用工具時(shí)需要顯式批準(zhǔn)。這種權(quán)限控制機(jī)制不僅防止了智能體濫用工具,還保護(hù)了外部服務(wù)的安全性。
通過在每次調(diào)用中傳遞授權(quán)密鑰和服務(wù)器URL,MCP確保了身份驗(yàn)證和授權(quán)的安全性,同時(shí)避免了敏感信息在響應(yīng)對(duì)象中的泄露。
此外,MCP支持動(dòng)態(tài)工具列表的導(dǎo)入和緩存機(jī)制。當(dāng)智能體首次連接到一個(gè)MCP服務(wù)器時(shí),會(huì)從服務(wù)器導(dǎo)入工具列表,并將其緩存到模型上下文中。在后續(xù)的調(diào)用中,智能體可以直接使用緩存的工具列表,而無(wú)需再次從服務(wù)器獲取,從而減少了延遲并提高了響應(yīng)速度。
當(dāng)然,支持MCP后還有很多其他好處,這里就不列舉了,有興趣的小伙伴可以自己去嘗試一下,或者參加「AIGC開放社區(qū)」在線下舉辦的MCP公開課,為大家真實(shí)演示一下。
Responses API其他新增功能
除了支持MCP外,OpenAI還對(duì)Responses API中的圖像生成、Code Interpreter和文件搜索工具進(jìn)行了重大更新,進(jìn)一步增強(qiáng)了智能體的功能。
圖像生成:開發(fā)者現(xiàn)在可以在Responses API中直接訪問OpenAI的最新圖像生成模型(如),并將其作為工具使用。該工具支持實(shí)時(shí)流傳輸,允許開發(fā)者在圖像生成過程中查看預(yù)覽,并支持多輪編輯,使開發(fā)者能夠逐步精細(xì)調(diào)整圖像。
Code Interpreter:Code Interpreter工具現(xiàn)在可以在Responses API中使用,支持?jǐn)?shù)據(jù)分析、解決復(fù)雜的數(shù)學(xué)和編碼問題,甚至幫助模型深入理解和操作圖像。例如,在處理數(shù)學(xué)問題時(shí),模型可以利用Code Interpreter運(yùn)行代碼來(lái)得出答案,從而顯著提升性能。
文件搜索:文件搜索工具得到了增強(qiáng),允許開發(fā)者根據(jù)用戶查詢將文檔中的相關(guān)內(nèi)容塊提取到模型的上下文中。此外,該工具還支持跨多個(gè)向量存儲(chǔ)執(zhí)行搜索,并允許使用數(shù)組進(jìn)行屬性過濾。
同時(shí)OpenAI也在Responses API引入了全新的功能。
后臺(tái)模式:對(duì)于需要較長(zhǎng)時(shí)間處理的任務(wù),開發(fā)者可以使用后臺(tái)模式異步啟動(dòng)這些任務(wù),而無(wú)需擔(dān)心超時(shí)或其他連接問題。開發(fā)者可以通過輪詢這些任務(wù)來(lái)檢查是否完成,或者在需要時(shí)開始流式傳輸事件。
推理摘要:Responses API現(xiàn)在可以生成模型內(nèi)部思維鏈的簡(jiǎn)潔自然語(yǔ)言摘要。這使得開發(fā)者更容易調(diào)試、審計(jì)和構(gòu)建更好的最終用戶體驗(yàn)。
加密推理項(xiàng):符合零數(shù)據(jù)保留(ZDR)條件的客戶可以在API請(qǐng)求之間重復(fù)使用推理項(xiàng),而無(wú)需將任何推理項(xiàng)存儲(chǔ)在OpenAI的服務(wù)器上。這不僅提高了智能性,還減少了標(biāo)記使用量,降低了成本和延遲。
本文素材來(lái)源OpenAI,如有侵權(quán)請(qǐng)聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國(guó) | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國(guó)RPA生態(tài)發(fā)展 | 流 > OpenAI放大招!核心API支持MCP,一夜改變智能體開發(fā)
熱門信息
閱讀 (15770)
1 2023第三屆中國(guó)RPA+AI開發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (15111)
2 《Market Insight:中國(guó)RPA市場(chǎng)發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國(guó)閱讀 (13343)
3 「RPA中國(guó)杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (13191)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國(guó)產(chǎn)業(yè)智能大會(huì)成功召開閱讀 (12318)
5 《2022年中國(guó)流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國(guó)