數據的價值

數據的價值html

袁永福 2015-9-17數據庫

[本文首發地址 http://www.hit180.com/17351.html ]安全

做者簡介:袁永福,C#大神,微軟MVP,長期從事醫療信息化行業,著書立做,技術屌絲創業,創立南京都昌信息科技有限公司從事開發和推廣電子病歷編輯器控件、醫學時間軸控件等醫療信息化過程當中的核心軟件組件。編輯器

 

筆者有過十幾年的醫療信息化行業(HIT)的從業經歷,一直在試圖發現HIT系統的價值所在。筆者認爲HIT價值主要分爲數據的價值和IT系統的價值,其中又以數據的價值爲重。本文就來討論數據的價值。[袁永福原創]大數據

筆者認爲,數據的價值在於數據的內容質量和數據的被引用,二者是相輔相成的。加密

說到數據的價值能夠首先聯想到人的價值。如今社會環境中,人的價值在於人自己的能力及人脈關係,有時候人脈關係是更重要的,而人脈關係實際上就是人和人之間的相互引用。高價值的人,會被其餘人頻繁的引用,好比常常有人引用馬雲、巴菲特的話。htm

相似人的價值,數據的價值也是這種規律。資源

HIT系統的數據基本上就是病歷數據,這裏的病歷數據是廣義的,不只包含各類門急診臨牀文書,還包括各類PASC影像、各類檢查檢驗數據等等等。開發

病歷數據的質量包括病歷質控、存儲或傳輸格式。質控是數據質量的必要非充分條件。文檔

病歷數據的引用分爲三個步驟:第一步:數據的存儲、第二步:數據的傳遞、第三步:數據在客戶端的解析應用。這就是 「互聯互通」,整個過程因素複雜多變,本文只討論技術方面的因素。

數據的傳遞實現起來比較簡單,好比各類前置機、中間數據庫、數據上報系統等等。相比之下,數據的解析利用作得就不夠好,其重要緣由就是有大量的病歷文檔數據物理存儲格式不是開放的,也就是說第一步就沒作好。[袁永福原創]

數據的物理存儲格式是數據引用的第一步,沒有良好的開放的物理存儲格式,數據即便傳遞出去了也無法解析利用,也就無法產生價值。這方面目前業界作得良莠不齊。

對於醫學影像,數據的物理組織格式都採用了國際統一的DICOM格式,這樣影像數據的互聯互通就比較容易了,各個組織之間的醫學影像數據引用比較方便。

對於一些醫囑、護理和LIS等數據,大多存在關係型數據庫中的各個字段中,因爲都是採用SQL語言來訪問,並且SQL語法也有國際標準,所以這些關係型數據庫中的數據格式也勉強算是開放的,能作到相互引用,只是工做量繁瑣。

而對於醫學文書數據的引用,業界作得最差,也是從此業界最須要關注的方面。

醫學文書數據基本上[袁永福原創]都是各類電子病歷文檔編輯器生成的,物理存儲格式各類各樣,有TXT、RTF、DOC、ODT、XML、HTML以及各類廠家自定義的二進制格式,甚至還有分散存在數據庫字段中。有些病歷文檔文件還被人爲加密,第三方沒法解析。這種封閉格式的病歷文書數據即便被引用了也是沒有多少價值的。因此說醫學文書數據的引用是業界作得最差的。

產生這種問題能夠說是軟件廠商和醫療機構共同形成的。

當前不少醫療機構對HIT認知不夠,缺少遠見,對於病歷文書只關注內容的錄入、顯示和打印,並無主動提出醫學文書數據的引用的需求,不關心病歷文件存儲格式。

軟件廠商沒有確切的病歷文檔數據引用的市場需求,因而也就不關注這方面,實現程序功能時就怎麼方便怎麼來了。[袁永福原創]

另外還有些軟件廠商內部認識到病歷數據引用的價值,故意對病歷數據作出第三方沒法解析的加密操做,綁定客戶,損害客戶的利益最大化。

軟件廠商在開發電子病歷文檔編輯器時主要有兩大方式:第一種是基於某種已有的通用文檔編輯器上開發,另一種就是徹底自主研發。

基於已有的通用文檔編輯器進行開發。最多見的就是基於MS WORD、開源編輯器控件、RichTextBox控件或者Delphi RichView控件開發。這種方式開發難度低,不過受制於通用編輯器控件底層的功能限制,一些醫療行業特有的功能就很難實現了,並且文件存儲格式也大可能是難於解析的二進制格式。此時編輯器不先進,整個電子病歷系統就談不上先進了。

徹底自主研發編輯器,技術難度大,只有極個別公司能作得很好,一旦作好也就能持續的先進,能對醫學文書數據引用提供強力的支持。先進的編輯器是開發先進的電子病歷系統的必要非充分條件。

軟件廠商因爲技術水平有限使得軟件不能產生良好開放格式的醫學文書文檔;還有一些軟件廠商爲了綁架客戶,故意對病歷文檔進行加密,主觀上阻止了文檔數據被第三方引用,損害了客戶的利益最大化。[袁永福原創]

因爲病歷文件格式的不開放透明造成的短板效應,致使了病歷文件數據的引用目前作的很很差。所以推廣開放的病歷文件格式標準成爲提升病歷數據價值的關鍵之一。

筆者做爲HIT中的一員,正在這方面作着本身的努力。筆者所在的南京都昌信息科技有限公司正在推廣的DCWriter電子病歷編輯器生成的文檔採用徹底開放透明的XML格式,並且正在促進一家一家HIT公司的採購,一家一家醫院的應用,但願再努力若干年,使得基於DCWriter XML的電子病歷文檔存儲格式成爲事實上的行業標準。這樣各個醫療信息化系統至少對於電子病歷文檔來講都是採用統一的XML存儲格式,數據引用的第一步就天然能作好,爲數據引用的後續步驟打下紮實的基礎。

爲了改善慘淡的病歷數據的引用現狀,衛計委是屢戰屢敗,屢敗屢戰。

此前原衛生部提出的CDA/HL7試圖以一己之力來推行病歷數據的格式公開透明,這是單純的行政干預市場,[袁永福原創]結果幾年下來沒能普及。

而如今衛計委又提出了「互聯網+」和「互聯互通」來試圖打通數據的引用通道。再也不單純的行政干預市場,而是藉助整個社會的「互聯網+」的風潮,引入社會資本,結果迅速冒出了春雨醫生、卓健科技等「互聯網+」的HIT企業。此次不是孤家寡人,有衆多推手,衛計委的努力很快有所成就了。

提升數據的引用對整個行業具備重要的戰略意義。被引用的數據不必定是最早進的數據,只要質量高於平均值,則引用得多,就能提升總體的平均質量,就能帶來行業的進步。

識時務者爲俊傑,當前時務就是數據和資源的整合和相互引用。如今還建設封閉信息化系統的是不識時務,是封建軍閥,必然遭到普遍的抵觸和淘汰。

國家和國家之間不該再搞意識形態,一樣的企業和企業之間、醫院和醫院之間也不該該繼續搞意識形態。組織內部和組織和組織之間的數據應該在保證安全的狀況下作到相互引用。引用得越多,數據的價值越大。

不過只要有人就有江湖,只要有江湖就有幫派,只要有幫派就會阻礙數據的引用。這就須要有合適的市場利益分配製度以及針對性的行政干預制度來下降幫派對數據引用的阻礙,實現整個行業的利益最大化。

參考其餘社會行業的發展經歷,好比金融行業中各家銀行之間的數據互聯互通,電信行業中各個電信公司之間的數據互聯互通,這些都是通過長期利益博弈以及國家行政和法律的干預才慢慢熬出來的。[袁永福原創]所以中國公立醫療體制做爲比較封閉落後頑固的經濟行政體制,其數據的互聯互通必然也要通過各方長期反覆努力才能實現。

展望將來,當病歷數據的引用廣泛作得比較好,互聯互通獲得普及,病歷數據的價值將獲得很大的提高。遠程會診、移動醫療、大數據挖掘等等整個HIT行業將從中受益巨大,[袁永福原創]各個醫療機構共同生產數據、各處按需使用數據的數據共產主義將獲得實現。

相關文章
相關標籤/搜索