NVIDIA Jetson TX2做爲一個嵌入式平臺的深度學習端,具有不錯的GPU性能,能夠發現TX2的GPU的計算能力是6.2。這意味着TX2對半精度運算有着良好的支持,所以,徹底能夠在桌面端訓練好模型,而後移植到TX2上利用半精度運行進行推理,這樣能夠達到生產落地的效果。編程
各類狀況的硬件:網絡
https://developer.nvidia.com/embedded/develop/hardware多線程
高性能低功耗NVIDIA®Jetson™系統可在邊緣端提供用戶最須要的實時人工智能(AI)性能,能夠在機載小型節能設備上完成複雜數據的處理,所以,能夠在網絡受限的環境中可以快速和準確地進行推理。架構
NVIDIA Jetson TX2 開發套件和模塊與NVIDIA JetPack SDK一塊兒,提供了使用一個統一的軟件體系結構爲多種用例開發和部署應用程序所需的一切,顯著地下降了軟件開發成本,併爲自動機提供了可擴展的AI策略。邊緣端的AI釋放了從醫療保健到製造業再到農業等全部領域的巨大潛力。框架
技術指標:機器學習
JetPack 4.2.2 for Jetson AGX Xavier, Jetson TX2 and Jetson Nano is available now。工具
Jetson TX2 Module性能
https://developer.nvidia.com/embedded/jetson-tx2學習
Jetson TX2是一款人工智能超級計算機模塊並採用NVIDIA Pascal™架構。Jetson TX2是最快,最節能的嵌入式AI計算設備。這臺7.5瓦超級計算機將真正的AI計算帶到了邊緣端。它基於NVIDIA Pascal™系列GPU構建,並集成8GB內存和59.7GB / s的內存帶寬。它集成多種標準硬件接口,可輕鬆將其集成到各類產品中。優化
技術指標:
GPU |
256-core NVIDIA Pascal™ GPU with 256 NVIDIA CUDA cores 一塊有256個CUDA核心的GPU |
CPU |
Dual-Core NVIDIA Denver 2 64-Bit CPU 雙核丹佛2 64位CPU集羣(提升單線程性能) Quad-Core ARM® Cortex®-A57 MPCore 四核心ARM CortexA57集羣(適合於多線程應用程序) |
Memory |
8GB 128-bit LPDDR4 Memory 8G 128位內存控制器,提供高帶寬LPDDR4支持 1866 MHx - 59.7 GB/s 內存帶寬 |
Storage |
32GB eMMC 5.1閃存 |
Power |
7.5W / 15W |
WI-FI |
Wifi和藍牙 |
爲了讓開發者快速上手,Jetson TX2 預先搭載了 JetPack 3.0。開發者能夠在雲端、數據中心或是我的計算機上使用最新的 NVIDIA DIGITS™ 5.0 接口訓練深度學習模型,而後運用 JetPack 最新版本搭載的高性能推理引擎 TensorRT™ 1.0 將訓練完成的模型部署到 Jetson TX2。
Jetson TX2提供兩種運行模態:一種是MAX Q,能效比能達到最高,是上一代的TX1的2倍,功耗在7.5W如下;另外一種是MAX P,性能能夠作到最高,能效比一樣能夠作到前一代的2倍,功耗則在15W如下。
和TX1的對比:
自帶的軟件包配置JetPack 3.0
這款功能強大的開發者套件可以使主板的硬件功能和接口充分發揮效用,預裝 Linux 開發環境。同時,它還支持 NVIDIA Jetpack SDK,包括 BSP、深度學習庫、計算機視覺、GPU 計算、多媒體處理等衆多功能。
JetsonDevelopment Pack(JetPack) 是一個按需提供的一體化軟件包,捆綁並安裝了適用於 NVIDIA Jetson 嵌入式平臺的全部開發用軟件工具。NVIDIA JetPack SDK是構建AI應用程序的最全面的解決方案。它捆綁了全部Jetson平臺軟件,包括TensorRT,cuDNN,CUDA工具包,VisionWorks,Streamer和OpenCV,這些都是基於LTS Linux內核的L4T。
JetPack 包括:
深度學習: TensorRT、cuDNN、NVIDIADIGITS™ 工做流程;
計算機視覺: NVIDIA VisionWorks、OpenCV;
GPU 計算: NVIDIA CUDA、CUDA 庫;
多媒體: ISP 支持、攝像頭圖像、視頻 CODEC;
同時,它還包括 ROS 兼容性、OpenGL、高級開發者工具等等。
VisionWorks:
VisionWorks是用於計算機視覺(CV)和圖像處理的軟件開發包。VisionWorks™實現並擴展了Khronos OpenVX標準,並針對具備CUDA功能的GPU和SOC進行了優化,使開發人員可以在可擴展的靈活平臺上實現CV應用程序。它包括VPI(視覺編程接口),這是CUDA開發人員使用的一組優化的CV原語。NVX庫容許直接訪問VPI,OVX庫容許經過OpenVX框架間接訪問VPI。VisionWorks的核心功能是針對如下方面的解決方案而設計的:機器人和無人機,自動駕駛,智能視頻分析,加強現實。
OpenCV:
OpenCV是計算機視覺,圖像處理和機器學習領域的領先開源庫,如今提供GPU加速以實現實時操做。OpenCV被普遍的應用,包括:街景圖像拼接,自動檢查和監視,機器人和無人駕駛的汽車導航和控制,醫學圖像分析,視頻/圖像搜索和檢索,電影–3D,交互藝術設備。
其餘有用的超級鏈接如此下:
https://developer.nvidia.com/embedded/learn/getting-started-jetson