這是全棧數據工程師養成攻略系列教程的第六期:6 數據 解讀數據結構和類型。javascript
在DT時代,咱們的生活中隨處都會接觸到各類各樣的數據。以地鐵數據爲例,能夠分爲靜態數據和動態數據兩大類。前端
時間戳是指從1970年1月1日0時0分0秒到某一時刻所經歷的秒數。對於同一個時刻,不一樣的人會有不一樣的表述方式,即不一樣格式的時間文本。經過時間戳,咱們能夠用整數或浮點數來表示任意一個時刻,從而便於代碼表示和計算。java
大多數數據是以行和列的結構表示的。每一行表示一條記錄,或者稱爲一條觀測,例如在地鐵線路數據裏,每一行就表示一條線路的信息。每一列表示一個字段,或者稱爲一項屬性,例如在地鐵線路數據裏,可能包含「線路名稱」、「運營時間」、「線路顏色」等列。sql
所以能夠用二維數組或二維表的概念來表示大多數數據,就像Excel中的表格,以及關係型數據庫中的數據表等。數據庫
TXT
是最多見的文本數據,裏面存放的是純文本,能夠記錄任意內容,每行的長度是可變的,文件的總行數也是任意的,所以很是自由。json
CSV
是Comma Seperated Value,即逗號分隔值。能夠將CSV理解爲一種文本形式表示的二維表,每一行表明一條記錄,每條記錄的字段數量是一致的,字段之間以逗號分隔。CSV能夠包含一行表頭,用於說明每一個字段的名稱,所以CSV和Excel中的表格、關係型數據庫中的數據表都是相似的,如下就是一個簡單的例子。後端
id,name,gender,age
1,Honlan,male,24
2,Baby,female,22複製代碼
JSON
是一種很是通用的數據類型,本質上是一種鍵值對字符串,在前端、後端等多種場景多門語言中均可以加載使用。若是將CSV理解爲Python中的二維數組即嵌套的列表,那麼就能夠將JSON理解爲Python中的字典,如下就是一個簡單的例子。數組
{"id": 1, "name": "Honlan", "gender": "male", "age": 24}複製代碼
總的來講,TXT、CSV和JSON裏存的都是文本,不一樣的只是文本的組織結構,以及文件命名時分別使用 .txt
、 .csv
和 .json
做爲後綴名。數據結構
SQL
是關係型數據庫文件,以最經常使用的 MySQL
數據庫爲例,MySQL中的數據庫和數據表均可以導出爲 .sql
文件用於數據備份,而 .sql
文件也能夠導入已有的數據庫和數據表中用於數據恢復。less
後續章節中會介紹如何使用MAMP和WAMP在我的電腦上搭建Web環境,並詳細講解和MySQL數據庫相關的內容。
視頻連接:解讀數據結構和類型