瞭解Drill Sandbox《譯》

本節涵蓋Apache鑽教程中的關鍵信息。在安裝鑽沙箱和啓動沙箱後,您能夠打開另外一個(Linux)終端窗口或(Windows)命令提示符,使用安全的shell(ssh殼)鏈接到VM,假設ssh已安裝好。使用下面的登陸名和密碼:mapr/ mapr。爲例子登陸:web

$ ssh mapr@localhost -p 2222
Password:
Last login: Mon Sep 15 13:46:08 2014 from 10.250.0.28
Welcome to your Mapr Demo virtual machine.

使用安全shell代替VM接口有一些優點。您能夠從本教程複製/粘貼命令,避免鼠標控制問題。sql

Drill包括一個外殼鏈接到關係數據庫和執行SQL命令。沙箱,鑽殼運行在嵌入式模式。登陸到沙盒後,使用 SQLLine命令。鑽殼出現,您能夠運行鑽查詢。shell

[mapr@maprdemo ~]$ sqlline
apache drill 1.1.0 
"Does your data know the Drill?"
0: jdbc:drill:>

在本教程中,您查詢的數據集,包括hive和HBase和在文件系統中的文件,例如CSV、JSON、Parquet等文件。去訪問這些不一樣的數據源,你鏈接鑽到存儲插件。數據庫

存儲插件概述apache

你使用存儲插件鏈接到一個數據源,如文件或Hive元存儲。看看存儲插件經過打開存儲在鑽Web控制檯定義標籤。啓動一個web瀏覽器並打開:http://<IP address>:8047/storage.json

控制面板來管理存儲插件出現。
clipboard.png瀏覽器

你看到下面的存儲插件配置:安全

  • cpssh

  • dfsoop

  • hive

  • maprdb

  • hbase

  • mongo

單擊更新檢查配置。

若是你在使用沙箱以前使用一個已安裝的鑽,你可 能會注意到,在沙箱中幾個存儲插件配置不一樣與在drill安裝的存儲插件。沙箱配置dfs,hive,maprdb和hbase存儲插件定義在模擬運行的集羣環境中扮演一個角色在教程中。

dfs

沙箱中dfs存儲插件配置鏈接到MapR文件系統(MapR-FS)。

在沙箱中配置存儲插件還包含一組工做區;每個表明在MapR-FS中的一個位置:

  • 根:訪問根文件系統位置

  • 點擊:訪問嵌套的JSON日誌數據

  • 日誌:在日誌目錄及其子目錄訪問平面(非嵌套)JSON日誌數據

  • 視圖:建立視圖的工做區域

dfs配置包含格式定義。

{
  "type": "file",
  "enabled": true,
  "connection": "maprfs:///",
  "workspaces": {
    "root": {
      "location": "/mapr/demo.mapr.com/data",
      "writable": false,
      "defaultInputFormat": null
    },
    "clicks": {
      "location": "/mapr/demo.mapr.com/data/nested",
      "writable": true,
      "defaultInputFormat": "parquet"
    },
 . . .
 "formats": {
 . . .
   "csv": {
      "type": "text",
      "extensions": [
        "csv"
      ],
     "delimiter": ","
  },
 . . .
   "json": {
      "type": "json"
  },
   "maprdb": {
      "type": "maprdb"
  }
 . . .

maprdb

maprdb是MapR-DB在沙箱中的配置。你使用這種格式在沙箱查詢MapR-DB/HBase表。

hive

在沙箱內hive爲hive數據倉庫配置。鑽經過使用配置元存儲鏈接到hive元存儲節省URI。drill的元數據表自動供用戶查詢。

{
  "type": "hive",
  "enabled": true,
  "configProps": {
    "hive.metastore.uris": "thrift://localhost:9083",
    "hive.metastore.sasl.enabled": "false"
  }
}

不要在沙箱以外使用這個存儲插件配置。使用的配置爲遠程或嵌入式雲存儲配置 。

←【用MapR Sandbox學習鑽】
←【關於MapR沙箱】

關於MapR沙箱

本教程使用Hadoop用drill的預先配置環境,MapR沙箱。MapR包括鑽做爲的Hadoop分佈的一部分。MapR的 沙箱的鑽是一個功能齊全的單節點集羣,被用來在Hadoop環境下獲取鑽的概覽。商業和技術分析師、產品經理和開發人員能夠使用沙箱環境經過執行各類類型的查詢瞭解鑽的力量和才能。

Hadoop不是鑽的一個先決條件,用戶能夠開始增長 與鑽直接在本地文件系統上運行SQL查詢。請參考Apache鑽在10分鐘內 進行介紹在本地使用鑽 (嵌入式)模式。

下一節Lesson1:學習數據集→

相關文章
相關標籤/搜索