1,python基礎入門

1.經常使用操做符算法

         算術操做符,賦值操做符,比較操做符和邏輯操做符shell

2.數字數據數據結構

         變量與賦值、 數字數據類型函數

3.流程控制spa

          條件語句、While語句、break語句和continue語句、for循環指針

4.數據結構ip

           標量、序列、映射、集合 字符串

           列表、列表函數、字符串、字符串函數、元組、字典、集合get

5.文件讀寫鍍金string

           文件訪問是一門語言重要的一環,適當地進行文本讀寫可以保存一次程序
     運行下來的結果。
            在數據挖掘的工做中,數據量很大,整個挖掘程序能夠分爲幾部分,咱們
     應該把每一部分運行的結果都保存下來,若是後面的程序出現錯誤,咱們
     也沒必要再從頭開始。
            要進行文件的讀寫,首先要設置工做目錄。若是使用腳本運行,那麼默認
      的工做目錄爲腳本所在的目錄。
            要改變工做目錄,首先要引入os模塊,語句爲:import os。查看當前工
       做目錄的方法是os.getwd(),改變工做目錄的方法是os.chdir(string)。

Python進行文件讀寫的函數是open或file。其格式以下:
file_handler = open(filename,mode=’r’)
其中filename是咱們但願打開的文件的字符串名字,mode表示咱們的讀
寫模式,默認爲read模式。若是此語句執行成功,那麼一個文件句柄就
會返回,後面的文件操做需依賴文件句柄的方法進行。
咱們經常使用的文件讀入函數是readline()和readlines()。
首先咱們假設在咱們腳本目錄下有這樣一個data.txt,其數據以下:
1,2 3,4
注意第一行中有一個換行符。若是咱們採用readline()語句讀取,執行
f=open(‘data.txt’,’r’)和 a =f. readline(),那麼就會將第一行以字
符串的形式返回,此時a=’1,2\n’ 。

 

同時文件指針指向第一行末尾,若是再執行語句b = f.readline(),那麼
b=’3,4’ ,此時文件指針就指向文件末尾,文件已讀取完畢。可使
用下面的while循環讀取全部語句:L=2#文件的行數
for i in range(L):
a = readline()# 對該行的處理
若是咱們想去掉第一行的讀取的換行符,可使用語a=a.strip(),strip()
是一個能夠去掉一個字符串開頭和末尾的空白字符,包括換行符。
而readlines則返回一個列表,列表的包含了每一行的字符串數據。如執
行a=f.readlines(),那麼此時a=[‘1,2\n’,’3,4’]。最終保存的形式是
一個二維列表,在後面的數據處理能夠很容易的變換爲numpy.array,
大部分數據挖掘的算法都須要numpy.array做爲數據存儲的格式。

csv文件讀取:

文件輸出:

咱們把數據成功讀入到程序中,如今咱們考慮,假設咱們的程序中得出
了一個二維列表,咱們從新輸出到文件。
咱們可使用方法f.write(string),而且藉助字符串的join方法輸出到文
件中。
若是二維列表的元素不是字符類型而是整數類型,咱們不能使用join方
法,使用f.write(string)輸出比較麻煩,這裏介紹另外一中更靈活的輸出到
文件的方式:print>>>f,…。這樣就會把本來print函數輸出到shell的內
容改成輸出到文件中。

JSON處理數據:

相關文章
相關標籤/搜索