(此文章同時發表在本人微信公衆號「dotNET開發經驗談」,歡迎右邊二維碼來關注。)微信
題記:在上個月的Connect() 2016大會上,微軟宣佈了VS 2017 RC的發佈,其中爲數據分析師帶來了一體化的開發環境。機器學習
咱們知道Visual Studio 2017帶來的一大改變就是,輕量級的快速安裝模式:把各類功能特性按照開發領域(Workload)進行組織劃分,安裝的時候只須要選擇本身所須要用到的那部分開發領域就能夠快速完成VS的安裝。函數
隨着數據科學愈來愈熱門,在剛剛發佈的VS 2017 RC中,微軟已經獨立提供了兩種和數據分析相關的開發領域了:數據存儲和處理、數據科學和分析應用。見下圖所示:工具
選擇「數據存儲和處理」開發領域,讓你可以得到大數據存儲和高級分析的開發環境。除了基本SQL之外,還支持HDInsight(Hadoop/Spark)和Azure機器學習的開發能力。oop
選擇「數據科學和分析應用」開發領域,讓你可以得到用於構建分析應用的相應開發環境。包括以下內容:visual-studio
可用來構建桌面、Web、科學計算、數據科學和機器學習應用的Python的開發工具(PTVS)。支持CPython 2.x/3.x、IronPython、Jython、PyPy等。也包含了Anaconda這一能夠安裝大量科學計算和分析Python包的包管理器。以下圖所示:學習
可用來構建統計、數據科學和機器學習應用的R開發工具(RTVS)。同時支持CRAN R和Microsoft R兩種發行版本。以下圖所示:開發工具
可用來開發各種數據處理任務的的F#開發工具。因爲F#是類LISP的函數式爲先的語言,同時兼具面向對象的特性,因此自然就是用來開發機器學習等人工智能應用的首選語言。以下圖所示:大數據
F#做爲微軟頭等語言之一,Visual Studio一直以來都支持它的開發環境。而對於Python和R,其實微軟以前也一直以開源插件的形式爲VS提供這方面的開發能力。我以前的文章都有介紹過。人工智能
另外須要強調的是,Python和R已經成爲數據分析、數據挖掘、數據科學方面使用最廣的兩種語言,見下圖:
本文基於The Data Science Workloads in Visual Studio 2017 RC整理翻譯而來。