繼上次說的關鍵詞展現存在的幾點問題與修改的計劃以後,這周作了以下改進:數據庫
1、關鍵詞展現更具備分析性。工具
相比以前統計全部政策中出現頻率最高的關鍵詞,如今加入了時間範圍選擇功能和政策發佈部門功能。spa
政府部門的分類方面,國家級的是按照國務院標準部門進行分類,河北省的包括河北省科技廳和11個市。用戶能夠選擇某個部門,對該部門出臺的科技政策進行關鍵詞分析。3d
經過比較發現,不一樣時期,不一樣部門出臺的科技政策關鍵詞有較好的區分度,進一步具備可分析性。blog
存在的問題在於:事件
1. 數據庫中的科技政策不完整,而且分佈不均。最嚴重的的在於各市出臺的科技政策文件,基本都處於缺失狀態,並不利於統計。方法
2. 一個政策可能由有多個部門聯合發佈。一個部門有多個名稱,如「科技部」、「科學技術部」、「科技部辦公廳」。這些在對部門進行分類處理的時候增長了障礙。im
2、新增科技服務業政策比重統計對比功能。技術
科技服務業有着普遍需求與良好前景。科技服務業的政策數量不斷增多,經過對關鍵詞進行分類,能夠看出每一年科技服務業的政策在不一樣服務領域所佔的比重。d3
統計分類方法以下表所示:
展現效果以下所示:
3、新增政策實施效果評估模塊。
政策工具是政策實施的具體手段,經過對不一樣工具設置相應的核心關鍵詞,再與政策中的關鍵詞想比較,就能夠分析出政策在不一樣層面的着手力度。再結合經濟統計年鑑等數據,就能夠分析出政策的實施效果與影響力。
政策工具與關鍵詞設置以下表所示:
在實現的時候,用戶能夠選擇統計某個時間區間內,某個部門出臺的科技政策,運用政策工具,從供給面、環境面和需求面三個層面進一步細分,統計各個子類下政策數量與所佔比重。(目前的效果只是個構思,還未加入真是的數據。)
下面的三個圖與政策工具的三個層面對應,在各個層面設置了不一樣的評價指標,從本題庫中統計得出。經過結合科技政策工具,作進一步的分析。(目前的效果只是個構思,還未加入真是的數據。)
具體的評價指標參考下表:
4、存在的問題
目前採起的方案是先對政策量化,而後再從多個本體指標來對比,從而探究科技政策的實施效果以及影響力。目前只作了兩大類數據統計以後的顯示的功能,並無作實際的對比,若是繼續採起這個方案,對比的方法仍須要好好構思。
還有一種想法是對科技政策作非量化的分類,作句子級別的關聯和分析以及主題挖掘。若是經過量化科技政策並不能很好的與年鑑數據或熱點事件想結合,這種方案或許能夠試一下。