?
作為國內(nèi)首屈一指的文本智能處理專家,達(dá)觀數(shù)據(jù)日前出席了由RPA中國主辦的“2019 Tech Business商業(yè)智能大會(huì)”,并斬獲“最佳RPA行業(yè)貢獻(xiàn)企業(yè)”和“年度最佳RPA+AI產(chǎn)品”兩項(xiàng)重磅榮譽(yù),公司副總裁陳文彬先生以《AI+RPA:打造企業(yè)智能的數(shù)字化白領(lǐng)員工》為主題進(jìn)行了演講,向與會(huì)嘉賓分享了達(dá)觀在文本智能處理方面的最新經(jīng)驗(yàn),并著重提到達(dá)觀正在將RPA與AI結(jié)合,致力于打造企業(yè)智能的數(shù)字化白領(lǐng)員工的宏偉圖景。
達(dá)觀數(shù)據(jù)副總裁-陳文彬
達(dá)觀RPA作為國內(nèi)首款自主研發(fā)集OCR(光學(xué)字符識(shí)別)與NLP(自然語言處理)于一體的智能RPA,與其他廠商調(diào)用國外OCR與NLP技術(shù)相比,達(dá)觀RPA的AI組件完全采用多年積累的自主研發(fā)技術(shù),根據(jù)國內(nèi)企業(yè)的實(shí)際業(yè)務(wù)情況進(jìn)行量身定制,在識(shí)別率、準(zhǔn)確率和穩(wěn)定性上都有極大地的提升,更全面的滿足企業(yè)自動(dòng)化的需求。
陳文彬介紹,達(dá)觀數(shù)據(jù)多年專注于文字資料的自然語言處理,而自然語言處理又細(xì)分為自動(dòng)閱讀和自動(dòng)寫作兩個(gè)部分。自然語言處理技術(shù)可以教會(huì)計(jì)算機(jī)斷文解字,幫人類更好的處理文檔資料。通常情況下,文字工作者平均每天大概有1/3的時(shí)間是和文字打交道,因此基于文本的交互處理有廣闊的市場(chǎng)需求。
自動(dòng)閱讀
這方面的場(chǎng)景待處理文本內(nèi)容包括法律文書、合同文本、金融文本、待審批文書、行政公文、公司文檔資料、業(yè)務(wù)單據(jù)、傳媒文章、互聯(lián)網(wǎng)咨詢、用戶評(píng)的意見和客戶的一些問題。
常見的文字處理需求一般涵蓋抽取信息、自動(dòng)填表、內(nèi)容審核、材料預(yù)審、材料報(bào)送、文檔歸納、資料搜索等等。為了更好的幫助員工處理文檔資料,達(dá)觀綜合性的使用了RPA和OCR,以及NLP技術(shù)。
通過OCR技術(shù)識(shí)別圖片和掃描文字,再通過自然語言處理技術(shù)去抽取文字中的關(guān)鍵要素,把這些信息做結(jié)構(gòu)化的處理。最后通過達(dá)觀的RPA技術(shù)實(shí)現(xiàn)數(shù)據(jù)的搬運(yùn)和填寫工作,這樣可以提供一套完整的解決方案,全面提升文檔處理的工作效率和準(zhǔn)確率。達(dá)觀自建了一套標(biāo)準(zhǔn)化的文檔智能處理平臺(tái),通過遷移學(xué)習(xí)和微小的調(diào)整可以很好的支持企業(yè)內(nèi)部專屬定制化的擴(kuò)展,這也是達(dá)觀的核心優(yōu)勢(shì)。
通過集成RPA、OCR和NLP技術(shù),達(dá)觀很好的解決了人工智能之前在落地時(shí)原有的信息系統(tǒng)銜接的問題,實(shí)現(xiàn)了端到端的流程自動(dòng)化,可以構(gòu)建一個(gè)全面的自動(dòng)化生態(tài)系統(tǒng)。
目前達(dá)觀智能RPA已經(jīng)應(yīng)用到各個(gè)行業(yè)的業(yè)務(wù)場(chǎng)景中,比如銀行的信貸審核,對(duì)債券募集說明書、招股說明書、企業(yè)年報(bào)的審核,金融咨詢的一些信息抽取,合同智能審閱,簡(jiǎn)報(bào)的生成,以及政務(wù)的一些智慧審批,企業(yè)材料審批,自動(dòng)填表,還有通信和互聯(lián)網(wǎng)領(lǐng)域等等。
在RPA與AI的結(jié)合方面,陳文彬列舉了幾個(gè)應(yīng)用場(chǎng)景。首先是財(cái)務(wù)報(bào)表識(shí)別與采集的場(chǎng)景。一般來說,企業(yè)在向銀行申請(qǐng)授信的過程中,首先企業(yè)要向銀行的客戶經(jīng)理提交企業(yè)的基本信息和財(cái)務(wù)報(bào)表,然后再由銀行客戶經(jīng)理把這些紙質(zhì)材料做電子化的處理。在處理的過程中,根據(jù)監(jiān)管合規(guī)要求,成立時(shí)間超過3年的企業(yè),需提交至少3年的財(cái)務(wù)報(bào)表,而每年提交的又包括三張資產(chǎn)負(fù)債表、現(xiàn)金流量表、損益表。表內(nèi)數(shù)字一般是8位數(shù)以上,所以在整個(gè)采集過程中,除了耗時(shí),還很容易出錯(cuò)。
基于此,達(dá)觀給出了智能化的解決方案,首先通過OCR技術(shù)把財(cái)務(wù)報(bào)表掃描進(jìn)行電子化的處理,面對(duì)不規(guī)范的報(bào)表,還需要再基于NLP的技術(shù)識(shí)別企業(yè)提交的很多會(huì)計(jì)科目的同義詞。比如一個(gè)會(huì)計(jì)科目,A企業(yè)叫實(shí)收股本,B企業(yè)叫實(shí)收資本,但它們代表的都是同一個(gè)會(huì)計(jì)科目的含義,所以這里達(dá)觀會(huì)用自然語言處理的技術(shù)去識(shí)別這類同義詞,來提高整個(gè)信息采集的準(zhǔn)確率和完整度。
最后再通過RPA技術(shù)將這些結(jié)構(gòu)化的數(shù)據(jù)計(jì)算、填寫在信息系統(tǒng)或信審報(bào)告里最終再進(jìn)行校審。整套方案實(shí)施下來,財(cái)務(wù)報(bào)表信息采集和報(bào)告填寫的工作流程,從4小時(shí)降低到10分鐘以內(nèi)。
自動(dòng)寫作
在寫作的NLP技術(shù)方面,陳文彬講解了如何自動(dòng)生成一個(gè)商業(yè)案例報(bào)告,在這個(gè)場(chǎng)景中要去自動(dòng)撰寫商業(yè)報(bào)告,它的數(shù)據(jù)源有新聞資訊、企業(yè)年報(bào)、企業(yè)研報(bào)、募集說明書,這些信息數(shù)據(jù)源的格式也是多樣的,包括圖片,PDF,Word等等。這就需要綜合的采用RPA、OCR和NLP三個(gè)技術(shù)進(jìn)行數(shù)據(jù)的提取和加工處理,形成一開始生成這個(gè)報(bào)告所需要的知識(shí)庫。陳文彬介紹,對(duì)于每一個(gè)知識(shí)點(diǎn)我們會(huì)通過時(shí)間、機(jī)構(gòu)、科目、動(dòng)作、數(shù)值5個(gè)要素進(jìn)行整理。當(dāng)完成所有的知識(shí)點(diǎn)采集以后用文本生成技術(shù),自動(dòng)的生成符合期望的商業(yè)案例報(bào)告。
在政務(wù)級(jí)場(chǎng)景方面,陳文彬舉例,國際友人來到中國工作,他需要向相關(guān)機(jī)構(gòu)申請(qǐng)工作許可證和居住許可證等多個(gè)證件。在實(shí)現(xiàn)“一網(wǎng)通辦”的過程中,達(dá)觀RPA實(shí)現(xiàn)了申請(qǐng)端和審批端的自動(dòng)化。在申請(qǐng)端,用機(jī)器人去識(shí)別申請(qǐng)材料中的關(guān)鍵要素,再由機(jī)器人自動(dòng)登錄政務(wù)機(jī)關(guān)相關(guān)的信息系統(tǒng)完成填報(bào)。在機(jī)器人的幫助下,整個(gè)人工錄入的信息采集從94項(xiàng)降低到27項(xiàng)。在審批端,申請(qǐng)材料由機(jī)器人進(jìn)行完備性、一致性、合規(guī)性和真實(shí)性的預(yù)審,再由工作人員做復(fù)審,在這個(gè)方式下,審批時(shí)間從12天降低到5天內(nèi)。
點(diǎn)擊視頻,觀看陳文彬現(xiàn)場(chǎng)演講內(nèi)容
在演講的最后,陳文彬用四句話表達(dá)了達(dá)觀的愿景:千層網(wǎng)絡(luò)、萬卷詩書,寒暑相推,而歲成焉。
千層網(wǎng)絡(luò)代表了達(dá)觀擁有的過硬算法技術(shù);
萬卷詩書 表示著達(dá)觀有的豐富數(shù)據(jù);
寒暑相推 寓意達(dá)觀將繼續(xù)深耕行業(yè),落實(shí)到每個(gè)場(chǎng)景;
最后的而歲成焉表示,需要達(dá)觀數(shù)據(jù)將持之以恒,打造真正優(yōu)秀智能、的數(shù)字員工,為企業(yè)提供最佳的數(shù)字化體驗(yàn)。
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國RPA生態(tài)發(fā)展 | 流 > 達(dá)觀數(shù)據(jù)陳文彬:深耕文本處理,重塑企業(yè)數(shù)字員工
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場(chǎng)發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會(huì)成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國