有很多醫院的 HIS 系統用的是 Caché 數據庫,好比北京協和醫院、四川大學華西醫院等。用過 Caché 開發的都知道,Caché 數據庫的開發維護同咱們常見的關係型數據庫有很大差異,如 SQL SERVER 有很是方便的可視化的企業管理器,Caché 則沒有,Caché 能夠經過 Terminal 建立數據表,而後導出成類文件,也能夠直接使用 Caché Studio 建立可持久化類,究其緣由,是 Caché 以多維數組存儲數據,而關係數據庫以二維表存儲數據。python
Caché 不只提供了數據庫,還提供了比較完善的 Web 應用,大大加快了模塊開發速度,足以知足醫院的信息化需求。多年的醫療應用積累了大量的數據,如何對這些數據進行挖掘是個問題。醫療大數據提了不少年,業界也有很多的醫療數據挖掘產品,但數據挖掘的需求實際上是很是複雜的,單靠某個產品的一些標準挖掘,恐怕很難知足需求。醫院的醫技科室的經常使用需求更多的是一些探索性統計分析,這個使用 Caché web 開發就能知足,但要想更充分的挖掘醫療數據,還須要使用一些更便捷的技術。web
雖然 Caché 的開發語言 ObjectScript 很不友好,但好在基於 Caché 的應用程序能夠和使用其它技術如 .NET、C++、Java、Python、SQL 的程序交互。數據庫
以前對一些孕婦數據進行過簡單統計,先用 SQL 查出數據,複製到文本文件,而後又用 Matlab 統計繪圖。數組
功能效果沒問題,但總以爲很麻煩,要在 SQL 和 Matlab 之間切換,還要用文本文件中轉,不能自動化,用過一次以後就不想再用第二次。網絡
此次打算嘗試下使用 Python 直接訪問 Caché 數據庫獲取數據,而後就能夠利用 Python 的強大功能了。測試
軟件環境大數據
操做系統:Windows 7 旗艦版 64位spa
數據庫:ensemble-2010.2.8.1104-win_x64操作系統
Python:2.7,執行文件路徑必定要加到環境變量 Path blog
C++ compiler:Visual Studio .NET 2008,最好是2008,若是是2012或其它,須要修改環境變量 VS90COMNTOOLS 。
一、安裝 Ensemble 或者 Caché 。若是安裝時出現如下錯誤,就果斷重裝系統吧,我當時花了三天時間在網絡上搜索解決方案,最終放棄。
二、安裝 Python 2.7,安裝路徑添加到環境變量。
三、安裝 Visual Studio .NET 2008 ,添加 D:\Program Files (x86)\Microsoft Visual Studio 9.0\VC\vcvarsall.bat 添加到環境變量。
四、在 C:\InterSystems\Ensemble\dev\python 目錄,按 shift + 右鍵,「在此處打開命令窗口」,輸入:python setup.py install,提示輸入路徑時再輸入:C:\InterSystems\Ensemble,回車,安裝完成。查看 Python 目錄以下。
五、測試。cmd 進入 C:\InterSystems\Ensemble\dev\python\samples 目錄,執行 python test.py 。
參考資料:
一、http://docs.intersystems.com/cache20152/csp/docbook/DocBook.UI.Page.cls
二、http://docs.intersystems.com/ens20152/csp/docbook/DocBook.UI.Page.cls?KEY=GBPY