芝麻HTTP:非關係型數據庫存儲

NoSQL,全稱Not Only SQL,意爲不單單是SQL,泛指非關係型數據庫。NoSQL是基於鍵值對的,並且不須要通過SQL層的解析,數據之間沒有耦合性,性能很是高。數據庫

非關係型數據庫又可細分以下。性能

  • 鍵值存儲數據庫:表明有Redis、Voldemort和Oracle BDB等。
  • 列存儲數據庫:表明有Cassandra、HBase和Riak等。
  • 文檔型數據庫:表明有CouchDB和MongoDB等。
  • 圖形數據庫:表明有Neo4J、InfoGrid和Infinite Graph等。

對於爬蟲的數據存儲來講,一條數據可能存在某些字段提取失敗而缺失的狀況,並且數據可能隨時調整。另外,數據之間還存在嵌套關係。若是使用關係型數據庫存儲,一是須要提早建表,二是若是存在數據嵌套關係的話,須要進行序列化操做才能夠存儲,這很是不方便。若是用了非關係型數據庫,就能夠避免一些麻煩,更簡單高效。文檔

本節中,咱們主要介紹MongoDB和Redis的數據存儲操做。it

相關文章
相關標籤/搜索