深源恆際醫療票據OCR落地九省市 服務範圍覆蓋過半市場

近年來,我國健康險市場規模持續保持高增加。銀保監會最新統計數據顯示,2019年中國健康險業務原保險保費收入6564億元,同比增加29.75%。同時,隨着民衆風險保障意識的不斷提高,將來健康險仍有巨大的潛在增加空間。據天風證券研報預測,將來五年內健康險複合增速將保持在20%左右。算法

與市場規模呈正相關,健康險理賠案件數也在逐年走高。據瞭解,自2015年起,健康險理賠案件數量和賠付金額正以年均20%的速度增加。所以,如何提高服務效率、優化服務體驗,成爲保險機構加強市場競爭力的重要抓手。api

保險科技公司深源恆際從健康險核賠理算業務場景入手,研發了醫療票據OCR產品,基於深度學習算法下的專項模型訓練,自動識別、提取醫療票據上的核心理算信息,並將結構化的信息錄入理算系統,旨在經過計算機視覺替代人力做業,大幅下降人力投入、縮短業務耗時,幫助健康險提高理賠服務效率、優化理賠服務體驗。數據結構

截至目前,該產品已前後在北京、天津、上海、廣東、浙江、江蘇、山東、河南及河北九省市完成落地,預估服務範圍覆蓋健康險過半市場。併發

01
切中要害 直擊痛點ide

出於行業監管因素,目前商業醫保機構沒法直接獲取或即時共享到投保用戶的醫療信息。在涉及健康險理賠時,理算人員須要從用戶提交的醫療單據上獲取原始的理算數據,並將相關信息逐項錄入系統,一般單個案件涉及錄入的信息多達百餘項。而人工錄入的做業方式不夠經濟,一方面人工做業不免出現錯漏,影響理算準確性,容易形成理賠滲漏,另外一方面配置大量人力資源從事高度重複的事務性工做,耗時費力、效率低下。性能

深源恆際基於OCR識別技術,開發了集識別、提取、結構化功能於一體的信息識別錄入自動化解決方案。在健康險核賠理算中,自動從各種醫療票據圖像中識別、提取出理算所需的字段信息,並同步完成結構化錄入,大幅縮短信息處理耗時,減小八成以上人力投入,使理賠效率總體提高60%-80%。同時,醫療票據OCR的應用,有助於健康險機構優化人力資源配置,基於流程自動化而釋放的勞動力可參與從事對腦力依賴更強的工做。學習

目前,支持識別錄入的票據類型包括門診發票、住院發票、醫保結算單、費用清單,字符識別準確率超過98%。優化

02
對症下藥 攻破難點blog

事實上,醫療票據OCR在實際落地應用中面臨諸多技術難點,如票面信息模糊、發票摺疊畸變、內容重疊、信息串行等,均會對識別準確率造成干擾,給算法模型訓練帶來相應挑戰。爲下降、消弭噪音,深源恆際結合多種圖像處理技術,在不損害文字信息的前提下排除干擾因素,讓識別模型具有很好的抗干擾能力和魯棒性。事務

image

首先,醫療票據在全國範圍內沒有統一的製版格式,各地版式差別明顯。面對此類情形,通用OCR算法難以突破模版多樣化的問題。深源恆際針對各地模版進行獨立強化訓練,在模型訓練中加強特徵提取細粒度,根據不一樣模版上的啓發性信息輔助文字區域的定位和切分,弱化版式差別帶來的不良影響。目前,已有包含北京、天津、上海、廣東、浙江、江蘇、山東、河南及河北九省市在內的票據模版完成針對性強化訓練併發布上線。

其次,醫療票據多采用數據與格式分離的套打方式,在OCR識別中一般會帶來兩方面困擾:一是套打發票大多采用針式打印技術,圖像分辨率低、打印字跡模糊,影響識別準確率;二是不免出現機打信息和印刷信息串行或內容重疊的情形,串行增長了信息提取難度,影響數據結構化;內容重疊形成部分信息被遮擋,在文本檢測時容易致使漏檢,在文本識別時容易致使誤識。

深源恆際基於深度學習算法,經過圖層分離技術解決了突破性地解決了套打票據識別中存在的技術難題,使識別準確率大幅提高。

圖層分離:經過大量分析樣本數據,提取機打部分與印刷部分的差別化特徵,強化特徵提取細粒度,基於深度學習方法搭建像素級圖層分離模型,實現從原始圖像中分離出機打信息與印刷信息,經過圖層分離完成信息剝離。

座標定位:圖層分離後,基於圖像識別技術獲取全部文本條目的座標信息,經過傳統匹配算法完成印刷類文本條目座標信息與機打類文本條目座標信息的關聯,實現印刷字段信息與機打字段信息的匹配,從而解決信息串行帶來的干擾。

雙識別模型:針對機打和印刷兩類文本信息分別訓練算法模型,大幅提高圖層分離精確度,下降信息重疊帶來的干擾。

再次,爲確保理算信息完整無誤,深源恆際提出「機器校驗爲主、人工複覈爲輔」的校驗機制,開發了多重校驗規則引擎。基於字段間的內在邏輯與關聯關係,自動甄別置信度較低的字段信息,對存疑的高風險信息進行預警提示,並依據內在邏輯對可能出錯的數據進行啓發式糾正;對於模糊文字,則經過醫療詞典庫進行智能校驗。綜合多種方式輔助複覈,快速完成數據的校驗與糾正,爲理算提供完整、精確的數據依據。

此外,醫療票據OCR服務與健康險理算中經常使用的智能理算規則引擎相銜接,可實現從信息錄入到結果輸出全面自動化,讓健康險理賠真正駛入快車道。

將來,深源恆際將持續迭代算法模型,進一步擴大產品落地範圍,在不間斷的落地應用中優化產品性能,將技術創新優點延展到行業全流程中,打造全棧式智能服務。

相關文章
相關標籤/搜索