技術專欄

流程機器人如何做好文件辨識作業

UiPath RPA 機器人流程自動化全球第一品牌
2021/08/18

早期的文件、影像都是透過紙本傳遞,而隨著電郵及文件處理器興起,並透過全球網路的完整建構,人們開始處理大量的電子資料。然而在面對大量的電子資資料時,要如何迅速將「結構化」、「半結構化」及「非結構化」的資料轉換成數字資訊及整合後匯入公司系統,也是一門企業面臨的數位轉型課題。本文提到的RPA (Robotic Process Automation)即是可加速企業數位轉型的工具。

 

以下以某客戶詢問的接單流程(圖一)可否有機會自動化,來做進一步說明。

 

圖一  :訂單流程

 

在開始自動化前,建議客戶先對日常作業流程做「第一輪梳理」,以配合RPA特性並將相關流程規則化。目的是要讓RPA可以正確無誤執行所交付的流程,同時也透過流程梳理及作業標凖化,達到優化的作業模式。

 

再來,請檢視平常作業流程,並先做大方向的動作拆解。這段接單流程共可分為訂單讀取資料整理登入系統做相關登打發送信件4個大方向,並確認整段流程有無特殊要求要注意。

 

將作業流程確定及表單格式標凖化後,即可將這些具規則標凖化的動作和資料,設計成RPA可執行的流程,以順利將接單流程自動化。

 

而在設計自動化的過程中,「訂單讀取」是一個重要的環節。對於固定不會變動的資料,可以指定RPA抓取該段資料;若資料是無法完全固定於某個位置時,這時就可以利用UiPath提供的Document Understand (DU)功能來協助讀取電子訂單,進而將整段流程以人機協作的方式自動化。

 

DU的產生,主要在於協助人們處理大量的電子文件,並將其數據化。它的執行主要利用傳統RPA的特性,再透過AI機器學習,來增加對電子文件讀取的準確度。整個流程可參考「圖二」及下列拆段解說,可更瞭解DU的作業方式。

 

 

圖二:Document Understand (DU) 自動化流程表

 

首先,將文件類型做不同的分類 (Load taxonomy ,圖三) ,並將需要提取的電子資料做型態定義(例如﹔將PO Date 設定為日期格式) 作為後續讀取資料時使用。

 

圖三 :Load taxonomy 分類

 

定義完所需提取的資料格式後,利用不同的方式(例如﹔OCR文字辨識軟體)將電子檔案(例如﹔pdf, text)內的文字數位化(Digitize,圖四)。

 

圖四﹔數位化 (Digitize)

 

數位化後,將資料依一開始Taxonomy的定義做分類 (Classify,圖五)。目標是為正確提取所需數據,提供後續不同的用途。

 

圖五﹔ 分類 (Classify)

 

最後則是讀取(Extract,圖六) 所需資料並將其匯出(Export)成指定的檔案格式。

 

圖六:讀取 (Extract)

 

在讀取的過程,可同步利用內建的驗證(Validate,圖七)功能,重覆修正RPA所讀取出來的數據條件,以AI可不斷學習(Train/Retrain)的能力,提高RPA對文件和欄位的識別度。

 

 

圖七:驗證 (Validate)

 

「數位化、數位優化、數位轉型」是企業數位轉型的三大階段,而自動化工具則是加速整個階段的重要環節。UiPath簡易且彈性的設計流程,讓自動化流程更容易普及於企業內;再加上AI的協助讓RPA功能再進化,是實體資料數位化的一項利器,也是企業數位化良好的基礎橋樑。以優化過的數據,做進一步的資料共用、分析再利用,可使企業取得有利的先機。

聯絡 我們