如下筆記是我在 xue.cn 學習羣之數據分析小組所整理分享的心得。相關背景是:我選擇中文詞頻統計案例做爲考察你們python基礎功掌握程度。python
以小見大,下面是2個小技能的具體實戰:學習
拷貝文章時,直接把內容賦值給一個變量,保存到一個 .py 文件中。而後在腳本中,導入它。spa
存儲文章的文件 article.py
code
content = """ 複製的文章內容 """
複製代碼
存儲腳本的文件 my_code.py
ip
from article import content
複製代碼
拷貝文章內容到一個txt文件(一般人們都這麼幹)。直接讀取文件內容。utf-8
用 read()
方法能直接生成字符串。字符串
with open('test.txt','r',encoding='utf-8') as f:
content = f.read()
複製代碼
用readlines()
或readline()
結合 for 迭代
來本身構成 字符串。數據分析
好比 bsdzsz 的代碼片斷:string
data = ''
with open('test.txt', 'r',encoding='utf-8') as f:
for line in f.readlines():
line = line.strip()
data += line
複製代碼
固然,還有更多方法。以上3種方法對於零基礎新人都很友好,剛剛掌握一點皮毛就能夠搞定。it
從這個方法舉例中,你們能夠初步創建一個意識:同一個數據(文章內容),其存儲形式多是多樣的(.py文件的一個字符串變量被別的.py文件調用,或一個常規的txt文件),咱們去取那個數據的方法也是多樣的。