前一陣很多人都在玩 ChatGPT,很多人驚嘆于這類Language Model的表現(xiàn),也同時在搜尋著更多應(yīng)用的場景,一個易于想到的應(yīng)用就是與 RPA 軟件的結(jié)合。

當(dāng)前的 RPA 軟件,一般是針對不同類型的任務(wù)制定了相應(yīng)的工具包,用戶在使用的時候,一般需要根據(jù)自己的業(yè)務(wù)邏輯定制自動化腳本,從而達到自動化重復(fù)任務(wù)的目的。要實現(xiàn)這個自動化主要需要兩個部分:
-
-
第一部分任務(wù)包定義了常用的操作,作為定制化腳本的基礎(chǔ)。例如針對網(wǎng)頁上的操作和 Excel 界面的操作,會有各自的程序包。第二部分流程腳本,通常是基于具體的業(yè)務(wù)邏輯,在任務(wù)包的基礎(chǔ)上編寫的腳本。很多廠商也會提供低代碼工具和 GUI 的設(shè)計器來輔助自動化腳本編寫。
這些 RPA 腳本基于預(yù)先定義的規(guī)則,如果運行的環(huán)境有了變化,例如一個網(wǎng)頁上有少許修改,可能就不適用了。所以 RPA 的應(yīng)用依賴于定制化,也有一定的維護成本。雖然很多 RPA 廠商把定制和維護的活丟給合作伙伴,自己的業(yè)務(wù)比較干凈,但是也沒有太改變本質(zhì)。當(dāng)前 RPA 工具里也有一些 AI 的應(yīng)用,不過主要還是應(yīng)用在局部,屬于上述任務(wù)包的部分,例如 OCR,文本處理等,并沒有體現(xiàn)在任務(wù)流程里。很多 RPA 工具包里針對流程這一塊,也有 Process Mining 的工具,但并不是解決這個問題。Process Mining 更多是通過分析 Event Log,推導(dǎo) Workflow(參考 Alpha Algorithm,PetriNets),并根據(jù)一些 pattern 提供流程優(yōu)化建議。
02
GPT 模型如何幫助 RPA 應(yīng)用
既然 GPT 模型能生成代碼,當(dāng)然也可以用它生成自動化腳本。如果去問 ChatGPT,它也是回答可以生成腳本,進而可以實現(xiàn)在自動化任務(wù)。是不是這就可以實現(xiàn)通用的自動化任務(wù)了?
試一試,問一個具體的問題,使用UiPath去填充表單??梢钥吹?,ChatGPT 可以生成Python代碼:
不用UiPath,改用Selenium,相當(dāng)于換了一個標(biāo)準(zhǔn)任務(wù)包,也可以生成代碼。例如讓他生成一段在 Google 搜索 Dath Vader 并打開鏈接的代碼。BTW, 不知道為啥 Dath Vader 同學(xué)違反 Content Policy。
根據(jù)生成代碼的指令生成 Python 代碼,其實還是停留在 Copilot 這個階段??梢宰鳛橐粋€開發(fā)者的輔助工具,幫助流程腳本開發(fā)者提高開發(fā)效率。我們當(dāng)然并不滿足于此,是否能直接打通呢,使用 GPT 模型來處理用戶的輸入,直接轉(zhuǎn)化為 Action,直接完成任務(wù)豈不更好。不過,如果再去問 ChatGPT,它也無法給出更具體的回答了,停留在一些指出方向的建議,在使用模型簡化用戶和 RPA 軟件之間的交互等等。
03
能否實現(xiàn)通用的任務(wù)自動化?Adept AI 的嘗試
目前有一些 Personal Assistant 能接受指令,完成任務(wù),例如 Siri,Alexa,不過也僅限于一些事先定義好的 Task Automation,并不是通用的任務(wù)自動化?,F(xiàn)在看到 ChatGPT 的表現(xiàn),似乎看到了一些希望。也有很多人在進行了這些方面的探索,一個值得關(guān)注的公司是Adept AI。Adept AI Lab 由參與建立 Transformer 框架和 GPT 模型的一組大牛創(chuàng)立,希望能解決這個難題,進而實現(xiàn) General Intelligence,打造一個能幫人類完成任何計算機任務(wù)的工具。
針對這個問題,Adept 團隊已經(jīng)發(fā)布了一個新的模型,叫做 Action Transformer(ACT-1),ACT-1 對于常用的 computer tasks 進行了訓(xùn)練,從而能將用戶輸入的指令直接轉(zhuǎn)化為一組 Action。Adpet 給出了一些 demo 的 video,看起來比較 cool。從 video 來看,產(chǎn)品以一個瀏覽器插件作為載體,提供一個自然語言的輸入接口(Best programming language is English.),能夠根據(jù)用戶的輸入,理解用戶意圖,并操作瀏覽器來完成對應(yīng)的任務(wù)。
例如,幫我在Houston找個60萬以下的房子:又或者是,將新客戶的信息錄入 CRM 系統(tǒng):
不過幾個視頻看下來,似乎還比較早期,這個視頻也經(jīng)過了一些處理,速度也是加了倍速的。目前可能也是針對一些指定的任務(wù)做訓(xùn)練,與真正的通用型模型還有一些距離。不過即使只是讓 AI 自己能做好簡單的任務(wù),就已經(jīng)很困難了。沒有預(yù)先定義的腳本,還需要處理復(fù)雜的上下文。試想一下如果能將目前的 RPA 軟件的“自動化重復(fù)任務(wù)”擴展到“自動化任何任務(wù)”,RPA 使用的范圍可就廣多了。
而程序邏輯由 Rule Based 模式向 Data Driven 模式轉(zhuǎn)化在很多領(lǐng)域都在發(fā)生。前 Tesla AI Lead Andrej Karpathy 把它定義為Software 1.0 與 Software 2.0。Software 1.0 是程序員給計算機明確指令,Software 2.0 則使用更抽象,對人類不友好的語言,例如神經(jīng)網(wǎng)絡(luò)的權(quán)重。給定模型框架,目標(biāo)和數(shù)據(jù),由 training systems 來寫這些權(quán)重。
于是我們有了 Software 1.0 程序員,Software 2.0 程序員,以及 Web 3.0 程序員。。即便是 3.0,不過Andrej說,不好意思,在座的各位都比不過算法:
扯遠了,除了Adept AI以外,目前也有很多其他的 AI Lab 在做這方面的探索。由 DeepMind co-founder Mustafa Suleyman 和 Reid Hoffman 孵化的 Infection AI 也是想用 AI 去幫助人們完成各種計算機任務(wù),最終人類不用去學(xué)習(xí)各種編程語言,不用學(xué)習(xí)軟件使用手冊,不用關(guān)注各種瑣碎細節(jié),只用關(guān)注創(chuàng)造性思考的部分。不過對于每天搬磚的打工人來說,創(chuàng)造性思考的部分是哪部分呢?
https://chat.openai.com/chat
https://karpathy.medium.com/software-2-0-a64152b37c35
Dath Vader封面圖由Midjourney生成:
繼續(xù)閱讀:
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 基于GPT 能自動化任意 RPA 任務(wù)嗎
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進,第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國