數據科學主要以統計學、機器學習、數據可視化以及(某一)領域知識爲理論基礎,其主要研究內容包括數據科學基礎理論、數據預處理、數據計算和數據管理(來自百度百科)。python
#使用JAVA輸出Hello World
class test{
public static void main(String args[]){
System.out.println("Hello World");
}
}
#使用python語言輸出Hello World 僅需一行代碼
print("Hello World")
複製代碼
若是須要作統計科學計算,python中具有Numpy、Scipy、statsmodels.編程
若是須要進行深度學習,又可使用TensorFlow、MXNET,它們都有python的接口bash
作結構化數據處理與分析,又能夠用Pandasmarkdown
對大數據進行處理,可使用PySparkapp
機器學習, python上又有Scikit-learnpython2.7
看過我以前文章的同窗都知道,我一直用的是python2.7 最先也使用過3.5,如今卻要帶你們安裝Anaconda,原諒我當初學習python的時候太年輕,Python易學,但用好卻不容易,其中比較頭疼的就是包的管理和Python不一樣版本的問題,特別是當你使用Windows的時候。而後就出現了發行版的Python(好比Anaconda),發行版最直接的好處就是將python和許多經常使用的package打包,方便咱們使用。接下來我帶你們安裝Anaconda.機器學習
建議安裝使用Python3,理由以下編程語言
而後根據本身電腦進行32/64位的下載。 函數
Jupyter Notebook(此前被稱爲 IPython notebook)是一個交互式筆記本,支持運行 40 多種編程語言。Jupyter Notebook 的本質是一個 Web 應用程序,便於建立和共享文學化程序文檔,支持實時代碼,數學方程,可視化和 markdown。 用途包括:數據清理和轉換,數值模擬,統計建模,機器學習等等。這也是咱們爲何要使用它的緣由。post
和其餘語言同樣,python3有六個標準的數據類型:
- Number(數字)
- String(字符串)
- List(列表)
- Tuple(元組)
- Sets(集合)
- Dictionary(字典)
type()
函數能夠用來查詢變量所指的對象類型。 此外還能夠用Python的自省 isinstance 來判斷>>>a = 0609
>>> isinstance(a, int)
True
>>>
複製代碼
#設置一個list
li = [304,12,999,46,405]
#查看list的相關功能使用dir()
dir(li)
複製代碼
#查看list的長度
>>>len(li)
5
#查看list內容
>>>print(li)
[304,12,999,46,405]
#經過下標取值
>>>li[0]
304
>>>li[-1]
405
>>>li[0:3]
[304,12,999]
#列表增長
>>>li.append(609)
>>>print(li)
[304,12,999,46,405,609]
#列表擴展extend 接受一個參數,這個參數老是一個 list,
而且把這個 list 中的每一個元素添加到原 list 中
>>>li.extend(['xlm','love'])
>>>print(li)
[304,12,999,46,405,'xlm','love']
#list排序
>>>li.sort
>>>print(li)
[12, 46, 304, 405, 999, 'xlm', 'love']
#將一個列表降序排列
>>>li = [304,12,999,46,405]
>>>li.sort(reverse=True)
>>>print(li)
[999, 405, 304, 46, 12]
複製代碼
元組(tuple)與列表相似,不一樣之處在於元組的元素不能修改。
tuple = (304,12,999,46,405)
複製代碼
未完待續,連載中...