流程挖掘(Process mining),也譯為過程挖掘,從學(xué)科發(fā)展角度來看它并不是一個(gè)新鮮事物,但是在我國產(chǎn)業(yè)界被廣泛關(guān)注還是在2020年以后,作為超自動化的關(guān)鍵技術(shù)被國際知名咨詢機(jī)構(gòu)Gartner連續(xù)3次收錄到其年度技術(shù)趨勢報(bào)告中。根據(jù)2022年中國信通院發(fā)布的《超級自動化技術(shù)與應(yīng)用研究報(bào)告》,超自動化是一個(gè)技術(shù)合集,換言之就是一組實(shí)現(xiàn)企業(yè)業(yè)務(wù)流程自動化的技術(shù)。具體包括:機(jī)器人流程自動化(RPA)、低代碼應(yīng)用平臺、智能業(yè)務(wù)流程管理系統(tǒng)(iBPMS)和流程挖掘等。當(dāng)然,以上這些功能型的技術(shù)也是建立在大數(shù)據(jù)、人工智能、云計(jì)算和深度學(xué)習(xí)的基礎(chǔ)理論之上。
01
流程挖掘與企業(yè)數(shù)字化轉(zhuǎn)型
圖1 超自動化技術(shù)助力企業(yè)數(shù)字化轉(zhuǎn)型閉環(huán)
圖1給出了基于超自動化技術(shù)實(shí)現(xiàn)企業(yè)數(shù)字化轉(zhuǎn)型的路線圖。具體而言,企業(yè)數(shù)字化轉(zhuǎn)型的起點(diǎn)是業(yè)務(wù)信息系統(tǒng),如企業(yè)資源管理系統(tǒng)(ERP)、客戶資源管理系統(tǒng)(CRM)和辦公系統(tǒng)(OA)等,更確切地來說是業(yè)務(wù)信息系統(tǒng)中記錄的業(yè)務(wù)數(shù)據(jù)。首先,通過數(shù)據(jù)收集和預(yù)處理技術(shù),把業(yè)務(wù)數(shù)據(jù)轉(zhuǎn)化為流程挖掘工具可以直接分析的標(biāo)準(zhǔn)事件日志,并以此為輸入進(jìn)行流程模型挖掘和關(guān)鍵流程性指標(biāo)分析,進(jìn)而理解業(yè)務(wù)流程實(shí)際運(yùn)行的全貌。其次,進(jìn)行業(yè)務(wù)流程的深度分析和洞察,包括性能分析、合規(guī)性檢查和偏差根因分析等。基于以上分析結(jié)果,針對運(yùn)行流程中的性能瓶頸和行為偏差有針對性地進(jìn)行流程的數(shù)字化再造。比如對違規(guī)和缺少信息系統(tǒng)支撐的業(yè)務(wù),通過低代碼技術(shù)和業(yè)務(wù)流程管理系統(tǒng)對業(yè)務(wù)進(jìn)行快速搭建和重構(gòu),對執(zhí)行效率比較低、返工率高的流程節(jié)點(diǎn),通過部署RPA機(jī)器人來提高流程節(jié)點(diǎn)的局部效率進(jìn)而優(yōu)化全局的效率。除了以上基于離線事件日志的分析技術(shù),還可以基于流程預(yù)測性監(jiān)控和預(yù)警技術(shù)來對業(yè)務(wù)流程運(yùn)行進(jìn)行實(shí)時(shí)管控。綜上所述,流程挖掘作為超自動化的底座技術(shù),起到了關(guān)聯(lián)業(yè)務(wù)系統(tǒng)、業(yè)務(wù)數(shù)據(jù)以及其他超自動化技術(shù)的作用,是當(dāng)前實(shí)現(xiàn)企業(yè)數(shù)字化轉(zhuǎn)型的核心關(guān)鍵技術(shù)。
02
流程挖掘的學(xué)科定位
與RPA和低代碼技術(shù)不同的是,流程挖掘不僅僅是一門技術(shù),它更是一門學(xué)科!作為一門學(xué)科,它既有相對完備的理論技術(shù),又有核心算法,此外,流程挖掘還有典型的應(yīng)用場景(詳情請參考中國流程挖掘行業(yè)研究報(bào)告)。根據(jù)“流程挖掘之父”、德國亞琛工業(yè)大學(xué)Wil van der Aalst教授的論述,流程挖掘是建立在流程科學(xué)與數(shù)據(jù)科學(xué)之間的一個(gè)跨領(lǐng)域交叉學(xué)科,其學(xué)科定位如圖2所示。
圖2 流程挖掘?qū)W科定位
具體而言,流程科學(xué)涉及到形式化方法、Petri網(wǎng)理論、并發(fā)論、工作流管理與流程自動化等領(lǐng)域。數(shù)據(jù)科學(xué)則涉及到數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、分布式計(jì)算和可視化理論等領(lǐng)域。
03
流程挖掘發(fā)展歷程與產(chǎn)業(yè)概述
圖3 流程挖掘發(fā)展歷程圖
接下來我們回顧一下流程挖掘的發(fā)展歷程,如圖3所示。具體而言,流程挖掘理論研究起源于1999年,Wil教授在荷蘭埃因霍芬理工大學(xué)(Eindhoven University of Technology, TU/e)成立流程挖掘研究小組;產(chǎn)業(yè)起源于2007年,F(xiàn)utura PI公司成立于荷蘭埃因霍芬。國際上第一波發(fā)展高潮是2009-2011年這個(gè)時(shí)間段,標(biāo)志性的事件包括:IEEE成立了流程挖掘工作組、Wil教授出版了全球首部流程挖掘?qū)V?、Process Gold、Fluxicon和Celonis等流程挖掘公司相繼成立,第一波的流程挖掘行業(yè)發(fā)展本質(zhì)上是學(xué)術(shù)研究帶動產(chǎn)業(yè)發(fā)展。國際上第二波發(fā)展高潮是2018-2021年這個(gè)時(shí)間段,標(biāo)志性的事件包括:Gartner開始針對流程挖掘這一細(xì)分領(lǐng)域發(fā)布行業(yè)指南、Celonis經(jīng)過10年的發(fā)展成為德國獨(dú)角獸企業(yè)(估計(jì)達(dá)到110億美金)、成功舉辦首屆流程挖掘行業(yè)學(xué)術(shù)年會,第二波流程挖掘行業(yè)的發(fā)展已經(jīng)是產(chǎn)業(yè)為主帶動學(xué)術(shù)研究了。直到2021年,Wil教授宣布加入Celonis擔(dān)任首席科學(xué)家,學(xué)術(shù)和產(chǎn)業(yè)實(shí)現(xiàn)了一個(gè)很好的融合。相比而言,國內(nèi)第一波發(fā)展高潮是2021年前后,中間相差了大約10年的時(shí)間。
流程挖掘作為一門相對年輕的應(yīng)用型學(xué)科,經(jīng)過20年的快速發(fā)展,目前已經(jīng)發(fā)展為有基礎(chǔ)理論和核心算法、有學(xué)術(shù)開源工具、有專著、有行業(yè)年會、有行業(yè)學(xué)術(shù)組織、有典型的商業(yè)產(chǎn)品和成功案例。
圖4 國際知名流程挖掘提供商
圖4匯總了國際上典型的流程挖掘產(chǎn)品提供商,其中包括流程挖掘明星企業(yè)Celonis、RPA巨頭UiPath (2021年收購ProcessGold)、IT巨頭微軟(minit)和IBM(myInvenio)、SAP(Signavio)等等。圖5是出自Gartner 2023年3月發(fā)布的流程挖掘工具魔力象限(Magic Quadrant for Process Mining Tools),給出了國際上不同流程挖掘廠商產(chǎn)品力的比較結(jié)果。
圖5 2023年Gartner流程挖掘工具魔力象限
04
國內(nèi)流程挖掘產(chǎn)品能力與面臨的挑戰(zhàn)
相比于國外十余年的產(chǎn)業(yè)積累,2021年可以定位為我國流程挖掘產(chǎn)業(yè)化的元年,也是在這一年出現(xiàn)了10多家提供流程挖掘產(chǎn)品的公司。
圖6 我國主要流程挖掘提供商
圖6匯總了我們國內(nèi)流程挖掘產(chǎn)品的提供商(筆者如有遺漏,還請聯(lián)系補(bǔ)充),大致可分三類:(1) 單純以流程挖掘?yàn)楹诵漠a(chǎn)品的流程挖掘創(chuàng)業(yè)企業(yè),如北京凡得科技的流程挖掘產(chǎn)品Process X;(2) RPA廠商,為了擴(kuò)展產(chǎn)品矩陣增加了流程挖掘產(chǎn)品,如弘璣cyclone公司的流程挖掘產(chǎn)品;(3) 跨國公司中國區(qū),如SAP中國提供的流程挖掘產(chǎn)品Signavio、IBM中國的流程挖掘產(chǎn)品myInvenio和UiPath的產(chǎn)品。
圖7 流程挖掘產(chǎn)品核心能力
圖7匯總了國內(nèi)流程挖掘產(chǎn)品的核心能力,具體包括如下核心功能:(1) 流程挖掘的起點(diǎn)是企業(yè)的各類業(yè)務(wù)信息系統(tǒng),首先是事件日志的提取、數(shù)據(jù)建模和預(yù)處理;(2) 以事件日志為輸入進(jìn)行模型挖掘,得到一個(gè)能夠描述業(yè)務(wù)流程的圖形化表達(dá);(3) 以流程模型和事件日志為輸入,進(jìn)行合規(guī)性檢查和性能分析,找到性能和行為偏差;(4) 針對得到的性能和行為偏差,進(jìn)行根因分析,發(fā)現(xiàn)產(chǎn)生偏差的根本原因;(5) 前面都是傳統(tǒng)的流程挖掘,近年來隨著人工智能、深度學(xué)習(xí)的發(fā)展,實(shí)時(shí)/準(zhǔn)實(shí)時(shí)的流程預(yù)測性監(jiān)控得到越來越多的關(guān)注,主要包括剩余時(shí)間、下一個(gè)活動、結(jié)果的實(shí)時(shí)預(yù)測等等。
雖然近年來國內(nèi)流程挖掘?qū)W術(shù)研究和產(chǎn)業(yè)均有較好的發(fā)現(xiàn),但是核心技術(shù)和算法方面仍然存在如下瓶頸:(1) 數(shù)據(jù)提取耗時(shí),缺乏高效的ETL提取工具和方法論,一般數(shù)據(jù)提取的時(shí)間能占到流程挖掘項(xiàng)目實(shí)施的80%;(2) 數(shù)據(jù)質(zhì)量難以保證,如噪聲、不完整軌跡、屬性缺失和缺少事件關(guān)聯(lián)等問題突出;(3) 模型挖掘結(jié)果的可靠性難以保證,已有大部分商業(yè)工具用有向圖來作為流程模型的描述,但有向圖在描述業(yè)務(wù)流程時(shí)存在天然的局限,雖然部分工具支持BPMN模型挖掘,但是模型挖掘的質(zhì)量還難以保證;(4) 合規(guī)性檢查準(zhǔn)確率有待提高,作為典型的流程挖掘應(yīng)用場景,流程的合規(guī)性檢查目前得到的關(guān)注較低,已有的商業(yè)化工具大都無法提供精準(zhǔn)的診斷結(jié)果;(5) 根因分析結(jié)果較為初級,缺乏系統(tǒng)化的根因分析工具;(6) 流程預(yù)測效率和準(zhǔn)確性有待提高,缺乏系統(tǒng)化的流程案例剩余時(shí)間預(yù)測、下一事件預(yù)測和結(jié)果預(yù)測的分析工具。
圖8 國內(nèi)流程挖掘行業(yè)發(fā)展挑戰(zhàn)
如圖8 所示,我國流程挖掘行業(yè)面臨如下挑戰(zhàn):(1) 產(chǎn)業(yè)起步晚、產(chǎn)品成熟地低:相比于國外10余年的產(chǎn)業(yè)積累,我國產(chǎn)業(yè)起步較晚,2021年才算是正式開啟這個(gè)賽道。產(chǎn)品的完整度和成熟度方面還有一定的差距;(2) 行業(yè)人才少、項(xiàng)目經(jīng)驗(yàn)不足:相比于國外10多年人才和項(xiàng)目的積累,我國流程挖掘行業(yè)從業(yè)者數(shù)量有限,同時(shí)由于產(chǎn)業(yè)剛起步,有項(xiàng)目經(jīng)驗(yàn)的人才就更少了,這可能是未來制約我國流程挖掘產(chǎn)業(yè)快速發(fā)展的一個(gè)潛在瓶頸;(3) 原始學(xué)術(shù)積累有限:相比于國外20年的原始創(chuàng)新積累,我國流程挖掘領(lǐng)域的學(xué)術(shù)積累明顯不足,同時(shí)學(xué)術(shù)研究的規(guī)模和質(zhì)量也還沒有在國際形成較大的影響力,專注于流程挖掘的高校也相對有限。因此,建議在我國流程挖掘行業(yè)的啟蒙階段,從一開始就確立產(chǎn)學(xué)研相結(jié)合的模式,充分發(fā)揮高校和科研院所在人才培養(yǎng)和學(xué)術(shù)創(chuàng)新方面的優(yōu)勢。
作者簡介:劉聰,山東理工大學(xué)二級教授、博士生導(dǎo)師,山東省泰山學(xué)者青年專家,山東省自然科學(xué)基金優(yōu)秀青年基金獲得者(省優(yōu)青),山東省青年科技獎獲得者,IEEE流程挖掘工作組成員。博士畢業(yè)于荷蘭埃因霍芬理工大學(xué)(Eindhoven University of Technology),師從歐洲科學(xué)院院士、“流程挖掘之父”Wil van der Aalst教授。目前兼任凡得科技首席技術(shù)顧問和RPA中國研究院流程挖掘首席技術(shù)顧問。Email: liucongchina@163.com
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 流程挖掘技術(shù)概述與發(fā)展趨勢
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國