關注微信公衆號:FocusBI 查看更多文章;加QQ羣:808774277 獲取學習資料和一塊兒探討問題。html
《商業智能教程》pdf下載地址 數據庫
連接:https://pan.baidu.com/s/1f9VdZUXztwylkOdFLbcmWw 密碼:2r4vc#
數據行業發展的很快,不少一塊兒作BI的朋友都已轉入大數據、雲計算、人工智能等高大上的領域去了,而我還停留在原地作BI,致使能一塊兒討論問題的人愈來愈少,我還有太多BI領域的知識不會,須要深刻學習,只好一我的慢慢前行一點一點的去學。服務器
在作BI實施的過程當中,發現重複性的事情太多、比較耗時、而又容易混亂;作BI最大的特色是面向整個企業的各個部門各個管理層級,而不像業務系統面向的是某幾個部門;因爲這個特色致使需求很難一步把握準確設計合適的數據結構。在項目中作好數據字典管理是很是重要的,由於整個項目的基礎是需求和數據表結構,表結構方便項目全部人員瞭解項目,若是數據字典是用excel 、word 或者是PowerDesigner來管理對於項目人員來講是不方便的也很是容易遺漏搞錯;特別是項目上線交付後過段時間有需求要改動或增長,項目人員拿到的數據字典是不完整的這樣他得花時間理解以前項目的需求和字段做用及來源,爲了方便項目交付及後期維護,我自學了幾天c#開發了一個小工具用來管理BI項目,我把它命名爲《DW/BI項目管理》,這個工具還有一些功能須要完善,還須要增減 <指標體系建設> 模塊。微信
此次介紹《DW/BI項目管理》中的 <數據庫表結構> ,數據結構
首先雙擊BI項目管理.exe 應用程序,彈出一個登陸窗口輸入用戶名和密碼。工具
登陸成功,會跳轉到主業,你將看到 導航條、表結構空值數據、SSIS警告錯誤信息,post
導航條是系統的模塊。學習
表結構空值數據:這個是顯示數據庫中表和字段沒有描述的信息,它有填充功能只要雙擊表名稱或列名稱空白格子處就能填寫相應的描述,並且這些描述填好後按回車鍵就能保存到數據庫中,表名稱和列名稱都填寫了就會在這裏消失;數據庫的下拉框是讓你選擇服務器上的任何數據庫,選擇好後單擊 查詢按鈕就能把空值顯示出來。這個功能有什麼做用了,它就是隨時提醒開發人員你給表增長了字段或增長了表要隨時作好說明方便整個項目人員知道這個事情,若是遺漏過段時間本身都不記得作的是什麼。大數據
SSIS警告錯誤信息:這裏會顯示ETL執行後全部的警告和錯誤信息,日期選項框能夠選擇你要查看的日期,類型選項框能夠選擇要查看警告仍是錯誤的信息。當日期和類型選擇好後單擊查詢按鈕就能查看你想看的信息,
《DW/BI項目管理》的數據庫表結構模塊包含三個子模塊分別是:數據字典管理、數據空間管理、數據空值率。
數據字典管理模塊能隨時看到你想看的數據庫所有表結構,它有導出excel 的功能,由於數據字典也是BI項目交付給客戶的一部分。這裏也能對錶說明和列說明進行修改。
數據空間管理能清楚的知道目前表中有多少行數據、數據量使用了多少空間、索引空間等。若是天天把這些數據保存起來經過循環相減就能知道天天的增量是多少。做用是當數據量達到某個點的時候是否要考慮表分區管理等。
數據空值率能知道某個表的某個字段有多少空值數據,有可能這些數據並非無效的是在某種規則下允許爲空值,可是數據倉庫是不允許空值存在的這屬於噪音數據;知道這些空值後但願BI開發人員能查明緣由或修正取數規則,方便後期覈對數據時說明空值緣由;若是前期開發時就檢查好空值數據項目結尾覈對數據時會節省不少時間。這個模塊有一個BUG正在修復中。
歷史文章:
FocusBI: 使用Python爬蟲爲BI準備數據源(原創)