Python編程從入門到實踐-------基礎入門html
1、Python中的變量java
2、Python首字母大寫使用title()方法,所有大寫upper()方法,所有小寫lower()方法python
3、Python中字符串拼接使用 + 號git
4、Python中刪除字符串的空格 刪除末尾空格的rstrip(),刪除開頭空格的lstrip(),刪除兩端空格的strip()編程
5、Python2與python3的print區別:app
6、Python中整數運算,使用兩個乘號表示乘方運算機器學習
7、Python中避免類型錯誤使用str()函數,將其餘類型值轉化爲字符串函數
8、Python中的註釋工具
1、Python中的變量學習
變量名:大小寫英文,數字和下劃線的組合,不能以數字開頭
2、Python首字母大寫使用title()方法,所有大寫upper()方法,所有小寫lower()方法
>>> name='ce shi python'
>>> name.title();
'Ce Shi Python'
>>> print(name.upper())
CE SHI PYTHON
>>> name2="CE SHI PYTHON"
>>> print (name2.lower())
ce shi python
3、Python中字符串拼接使用 + 號
>>> first_name='ce'
>>> last_name="shi"
>>> full_name=first_name + last_name
>>> print(full_name)
ceshi
>>> print("Hello"+" "+full_name+" "+'welcome!')
Hello ceshi welcome!
4、Python中刪除字符串的空格 刪除末尾空格的rstrip(),刪除開頭空格的lstrip(),刪除兩端空格的strip()
>>> best_language=" python "
>>> best_language = best_language.rstrip()
>>> best_language
' python'
>>> best_language = best_language.lstrip()
>>> best_language
'python'
>>> best_language=" python "
>>> best_language
' python '
>>> best_language.strip()
'python'
5、Python2與python3的print區別:
python2中無需將要打印的內容放在括號內。python3中的print是一個函數,所以括號必不可少;有些python2的print也包含括號。
6、Python中整數運算,使用兩個乘號表示乘方運算
>>> 3**2 #(=3*3)
>>> 10**3
1000
7、Python中避免類型錯誤使用str()函數,將其餘類型值轉化爲字符串
>>> age = 25
>>> message = "Happy " + str(age) +" Birthday!"
>>> message
'Happy 25 Birthday!'
>>> print(message)
Happy 25 Birthday!
8、Python中的註釋
以# 開頭,後面的都是註釋
基礎
數據類型
Number整數/浮點數
String字符串
Boolean布爾值True和False
空值None不是0
Tuple元組類型沒必要統一(1,‘abc’,0.4)
Dictionary key-value
List內置數據類型:列表[1,‘abc’,0.4],list是一種有序的集合,能夠隨時添加和刪除其中的元素
變量
python是動態變量,不只能夠是數字,還能夠是任意數據類型,是引用
與之對應的是靜態變量,java是靜態變量
字符串
字符串能夠用’'或者""括起來表示。
若是一個字符串包含不少須要轉義的字符,對每個字符都進行轉義會很麻煩。爲了不這種狀況,咱們能夠在字符串前面加個前綴 r ,表示這是一個 raw 字符串,裏面的字符就不須要轉義了。
編程庫
1.time
import time
print(time.time())
time = time.localtime( time.time() )
print(time)
print(time.tm_year)
"""
1563803665.310865
time.struct_time(tm_year=2019,XM代理申請http://www.fx61.com/brokerlist/xm.html tm_mon=7, tm_mday=22, tm_hour=21, tm_min=54, tm_sec=25, tm_wday=0, tm_yday=203, tm_isdst=0)
2019
"""
2.Matplotlib
繪圖工具包
3.Scikit-learn
封裝了大量經典以及最新的機器學習模型
4.Pandas
針對於數據處理和分析的python工具包,實現了大量便於數據讀寫,清洗,填充及分析功能
4.1讀取文件
import pandas as pd
# 兩個數據類型:Series, DataFrame
data_path = "C:/Users/admin/Desktop/111.csv"
# 讀取文件
def read_file(data_path):
datas = pd.read_csv(data_path, encoding="GBK")
datas = datas.dropna()
return datas
data = read_file(data_path)
print(data)
# 獲取某一列文字 Python 字典(Dictionary) -->contents_agent 轉化成一整段
contents_agent = data["asr_agent_raw"]
contents = contents_agent.values.tolist()
5.jieba
import jieba
stopwords_file = "D:/gitProject/smartlink-sqc/smartlink-sqc-wordle/python/dict/user_dict.txt"
def seg_word(contents):
contents = contents.values.tolist()
jieba.load_userdict(stopwords_file)
segment = []
for line in contents:
try:
segs = jieba.lcut(line)
for seg in segs:
if len(seg) > 1 and seg != '\r\n' and \
u'\u4e00' <= seg <= u'\u9fa5' or \
u'\u0041' <= seg <= u'\u005a' or \
u'\u0061' <= seg <= u'\u007a':
segment.append(seg)
except:
print(line)
continue
words_df = pd.DataFrame({'words': segment})
stopwords = pd.read_csv(stopwords_file,
index_col=False,
quoting=3,
sep="\t",
names=['stopwords'],
encoding='utf-8') # quoting=3全不引用
words_df = words_df[~words_df.words.isin(stopwords.stopwords)]
return words_df
# 進行分詞
words_agent = seg_word(contents_agent)
print(words_agent)
6.NumPy & SciPy
NumPy最基礎的編程庫,提供一些高級的數學運算機制和高效的向量和矩陣運算功能
SciPy是子啊NumPy的基礎上構建的,更爲強大的科學計算包
import numpy as np
def word_freq(words_df):
words_stat = words_df.groupby(by=['words'])['words'].agg({"count":np.size})
words_stat = words_stat.reset_index().sort_values(by=["count"], ascending=False)
return words_stat
words_stat_agent = word_freq(words_agent)
# 打印詞頻較高的前10
print(words_stat_agent.head(10))
7.Anaconda平臺
一次性得到300多種用於科學和工程計算相關任務的python編程庫的支持