首先,先了解一下數據庫的基本概念要點:html
數據庫是數據存儲的集合,表示數據結構化的信息sql
列存儲表中的信息數據庫
行存儲表的明細服務器
主鍵是表中的惟一標識數據結構
主鍵不具有業務意義函數
在實際操做中,對錶的主鍵不作強制性要求,可是建議設立性能
主鍵必須惟一編碼
每行必須有一個主鍵,不可爲空命令行
主鍵的值不可被修改3d
主鍵值被刪除後不可重用
表A的主鍵,能夠做爲表B的字段,此時不受約束
數據庫的基本類型(最基礎的):char--文本 int--整數 float--小數點 date--到日的日期 timestamp--精確到秒或者毫秒
數據庫的實際操做:
MySQL的安裝略,直接按照網上教學視頻逐步安裝便可。(這裏面寫到幾個本人安裝踩到的比較低級的坑,對我一個嘎嘎新的小新手來講是坑,就是在裝win7的本的時候一次完成,基本沒什麼,在裝臺式機的win10的時候,第一次裝的時候沒有workbench,重裝以後發現依然部分報錯,緣由是沒有將原有文件刪除乾淨,再後來裝的時候,仔細看了一下每一步,肯定有workbench的時候,就正常裝好了。)接下來打開workbench進行操做。
點擊新建數據庫
建立一個表,對錶進行命名,建議養成好的習慣在註釋的地方進行備註,以便往後表多的時候或者別人使用的時候更好的瞭解內容。
數據編碼先擇UTF8形式的
將須要的字段輸入進區,並調整字段的值類型,可設置主鍵。
再將表格導入數據庫表內(建議.csv格式的,前面提到過爲何,由於Excel自己會有不少形式)
此時在導入數據的時候有2中方法:
1.用workbench界面直接導入,有點是交互性強易掌握,缺點是速度會慢須要等待。
2.直接寫代碼的形式,有點是運行很快,缺點是代碼須要本身一點點寫進去。(在數據量較大多行的狀況下,建議直接用代碼形式加載)
【注意】加載數據是別的編碼例如jbk形式的,導入進去的時候就會出現亂碼的狀況,當數據庫選擇的是UTF8的時候,導入的數據也應是utf8纔可。
解決方式:將Excel另存爲utf8形式的.csv文件導入便可。
導入的過程當中會直接把表頭導入進去,直接選擇刪除行便可。
須要注意的是:
有的時候文本過長~長出了文本限定的45,這時候將須要進行修改將45變大,不然會報錯。
導入後檢查無誤建表保存。
【MySQL語句】
1.核心:select查詢語句
select*form data.表名稱
*爲通配符,表明所有
2.limit 100 限制搜索100條數據,查找100行
執行兩條sql語句的話,結束時用「;」進行結束
點擊保存,可將查找出來的數據進行導出生成。
3.order by 字段 desc
將字段進行升序排列
加desc爲降序排列
4.過濾功能where命令
where 字段=過濾字段
邏輯關係符號「=」「>」"<"
between 數值 and 數值:在兩個數值之間
in(「字段」,「字段」)特定的條件篩選兩個字段的內容
「!=」不等於
「<>」不等於
not in (「字段」,「字段」)過濾掉兩個字段的內容
多條件查找 加and 連接 and 字段=「」
or 或者
多重嵌套
where city=「上海」
and education=「本科」
or work=「1-3年」
【注意】條件順序
where city=「上海」
and (eudcation="本科"
or work =「1-3年」)
執行邏輯爲()內進行優先進行
模糊查找
where
字段 like 「%模糊詞%」:過濾包含模糊次的
%模糊詞:以模糊詞結尾的
模糊詞%:以模糊詞開頭的
進行分組
group by 字段
【實例應用】
select 城市 ,count(城市ID)form data.表名
group by 城市
運行後:城市分組對應的城市ID進行計數的數量和
distinct去重
【group by 分組的高級用法】
having單純針對分組的過濾
添加佔比
as 字段別名化將過長複雜的代碼進行替代
結果是同樣的,可是,不能用於邏輯出發的運算,由於不能識別,不能直接用於select,可是能夠在where,group by 的層面進行使用
【函數】
1.拆分技巧
left與Excel基本一致
locate()與Excel裏面的find同樣
寫嵌套的時候,建議一步一步寫,分步驟走
支持中間截取函數substr
效果等同於上面求出薪資的上線和下線,可是「8K以上」這樣的數據就沒法進行處理。
子查詢
上案例可視爲一個tab進行查詢
能夠進行嵌套,給表添加別名
就能夠直接引用別名 bottom top 等等
數據清洗
計算爲順序計算
調整一下讓代碼優雅一些,而且有別名運行起來效果較好。
子查詢的字段要保持一致,不然會報錯
跨表分析,使用子查詢
獲得的並非所有的明細字段,經過用jion能夠將兩張表進行關聯。
加載萬條以上的數據須要使用命令行的方式:
打開MySQL 5.7 Command Line Client
路徑能夠直接拖拽進去
指定分割符,不然會報錯
【時間操做】
進行格式的改變
MySQL可連接Power BI 進行使用,在使用的過程當中,建議先將語句寫好,再在Power BI中運行得出想要添加字段和內容。不建議直接在Power BI上面直接添加進行,由於前者爲服務器直接運行後再Power BI中顯示結果,後者則是考量自身電腦的性能。
多多結合實際進行練習,或者去課程提供的素材晚上去刷題進行聯繫。祝看到筆記的全部人都能熟悉掌握MySQL。