大數據分析處理必備工具

大數據技術,就是從各類類型的數據中快速得到有價值信息的技術。大數據領域已經涌現出了大量新的技術,它們成爲大數據採集、存儲、處理和展示的有力武器。shell

1、大數據接入
  一、大數據接入
      已有數據接入、實時數據接入、文件數據接入、消息記錄數據接入、文字數據接入、圖片數據接入、視屏數據接入
  二、大數據接入技術
      Kafka、ActiveMQ、ZeroMQ、Flume、Sqoop、Socket(Mina、Netty)、ftp/sftp
2、大數據存儲
  一、大數據存儲
      結構化數據存儲、半結構化數據存儲、非結構化數據存儲
  二、大數據存儲技術
      Hdfs、Hbase、Hive、S三、Kudu、MongoDB、Neo4J 、Redis、Alluxio(Tachyon)、Lucene、Solr、ElasticSearch
3、數據分析挖掘
  一、大數據分析與挖掘
      離線分析、準實時分析、實時分析、圖片識別、語音識別、機器學習
  二、大數據分析與挖掘技術
      MapReduce、Hive、Pig、Spark、Flink、Impala、Kylin、Tez、Akka、Storm、S四、Mahout、MLlib
      數據的分析離不開各類數據庫客戶端工具,例如P/L SQL, 查詢分析器,Navicat, shell等,客戶端工具繁多,安裝繁瑣,
      使用基於Web的TreeSoft數據庫管理系統,能夠同時鏈接MySQL,Oracle,DB2,PostgreSQL, SQL Server, MongoDB, Hive, SAP HANA 十分方便。
      使用基於Web的工具備個好處是:一次佈署,處處使用,省時省力。數據庫

4、大數據共享交換
   一、大數據共享交換
      數據接入、數據清洗、轉換、脫敏、脫密、數據資產管理、數據導出
      數據接入後,一般是存入數據庫中,以便於進行分析、清洗、轉換、脫敏等處理,而這些操做都離不開數據可視化客戶端工具。
      海量大數據需分批次,分任務,分時段進行處理,TreeSoft數據庫管理系統提供了數據定時任務管理,數據交換同步任務管理,
      任務統一管理,執行進度展現,處理日誌查看等,十分強大,是大數據處理的好工具。機器學習

  二、大數據共享交換技術
      Kafka、ActiveMQ、ZeroMQ、Dubbo、Socket(Mina、Netty)、ftp/sftp、RestFul、Web Service 工具


5、大數據展示
   一、大數據展示
      圖化展現(散點圖、折線圖、柱狀圖、地圖、餅圖、雷達圖、K線圖、箱線圖、熱力圖、關係圖、矩形樹圖、平行座標、桑基圖、漏斗圖、儀表盤),文字展現;
二、大數據展示技術
      Echarts、Tableau,TreeSoft數據庫管理系統將SQL查詢結果直接以圖表展現,快速展示分析結果。
oop

相關文章
相關標籤/搜索