全棧 - 6 數據 解讀數據結構和類型

這是全棧數據工程師養成攻略系列教程的第六期:6 數據 解讀數據結構和類型。javascript

數據的結構

在DT時代,咱們的生活中隨處都會接觸到各類各樣的數據。以地鐵數據爲例,能夠分爲靜態數據和動態數據兩大類。前端

  • 靜態數據:包括線路信息和站點信息等,例如一共有多少條線路,每條線路包含哪些站點,各個站點的名稱、首末班車時間等信息。這類數據通常不包含時間戳,更新頻率較低,數據量總體較少;
  • 動態數據:主要是地鐵的刷卡記錄,乘客在進站和出站時的刷卡操做都會產生一條刷卡記錄。這類數據通常包含時間戳,用於說明數據產生的時間,而且是不斷產生的。

時間戳是指從1970年1月1日0時0分0秒到某一時刻所經歷的秒數。對於同一個時刻,不一樣的人會有不一樣的表述方式,即不一樣格式的時間文本。經過時間戳,咱們能夠用整數或浮點數來表示任意一個時刻,從而便於代碼表示和計算。java

大多數數據是以行和列的結構表示的。每一行表示一條記錄,或者稱爲一條觀測,例如在地鐵線路數據裏,每一行就表示一條線路的信息。每一列表示一個字段,或者稱爲一項屬性,例如在地鐵線路數據裏,可能包含「線路名稱」、「運營時間」、「線路顏色」等列。sql

所以能夠用二維數組或二維表的概念來表示大多數數據,就像Excel中的表格,以及關係型數據庫中的數據表等。數據庫

數據的類型

TXT 是最多見的文本數據,裏面存放的是純文本,能夠記錄任意內容,每行的長度是可變的,文件的總行數也是任意的,所以很是自由。json

CSV 是Comma Seperated Value,即逗號分隔值。能夠將CSV理解爲一種文本形式表示的二維表,每一行表明一條記錄,每條記錄的字段數量是一致的,字段之間以逗號分隔。CSV能夠包含一行表頭,用於說明每一個字段的名稱,所以CSV和Excel中的表格、關係型數據庫中的數據表都是相似的,如下就是一個簡單的例子。後端

id,name,gender,age
1,Honlan,male,24
2,Baby,female,22複製代碼

JSON 是一種很是通用的數據類型,本質上是一種鍵值對字符串,在前端、後端等多種場景多門語言中均可以加載使用。若是將CSV理解爲Python中的二維數組即嵌套的列表,那麼就能夠將JSON理解爲Python中的字典,如下就是一個簡單的例子。數組

{"id": 1, "name": "Honlan", "gender": "male", "age": 24}複製代碼

總的來講,TXT、CSV和JSON裏存的都是文本,不一樣的只是文本的組織結構,以及文件命名時分別使用 .txt.csv.json 做爲後綴名。數據結構

SQL 是關係型數據庫文件,以最經常使用的 MySQL 數據庫爲例,MySQL中的數據庫和數據表均可以導出爲 .sql 文件用於數據備份,而 .sql 文件也能夠導入已有的數據庫和數據表中用於數據恢復。less

後續章節中會介紹如何使用MAMP和WAMP在我的電腦上搭建Web環境,並詳細講解和MySQL數據庫相關的內容。

視頻連接:解讀數據結構和類型

若是以爲文章不錯,不妨點一下左下方的喜歡~

相關文章
相關標籤/搜索