python基礎和編程庫

時間 2019-11-18

標籤 python 基礎編程欄目 Python 简体版

原文原文鏈接

Python編程從入門到實踐-------基礎入門html

1、Python中的變量java

2、Python首字母大寫使用title()方法，所有大寫upper()方法，所有小寫lower()方法python

3、Python中字符串拼接使用 + 號git

4、Python中刪除字符串的空格刪除末尾空格的rstrip(),刪除開頭空格的lstrip(),刪除兩端空格的strip()編程

5、Python2與python3的print區別:app

6、Python中整數運算，使用兩個乘號表示乘方運算機器學習

7、Python中避免類型錯誤使用str()函數,將其餘類型值轉化爲字符串函數

8、Python中的註釋工具

1、Python中的變量學習

變量名：大小寫英文，數字和下劃線的組合，不能以數字開頭

2、Python首字母大寫使用title()方法，所有大寫upper()方法，所有小寫lower()方法

>>> name='ce shi python'

>>> name.title();

'Ce Shi Python'

>>> print(name.upper())

CE SHI PYTHON

>>> name2="CE SHI PYTHON"

>>> print (name2.lower())

ce shi python

3、Python中字符串拼接使用 + 號

>>> first_name='ce'

>>> last_name="shi"

>>> full_name=first_name + last_name

>>> print(full_name)

ceshi

>>> print("Hello"+" "+full_name+" "+'welcome!')

Hello ceshi welcome!

4、Python中刪除字符串的空格刪除末尾空格的rstrip(),刪除開頭空格的lstrip(),刪除兩端空格的strip()

>>> best_language=" python "

>>> best_language = best_language.rstrip()

>>> best_language

' python'

>>> best_language = best_language.lstrip()

>>> best_language

'python'

>>> best_language=" python "

>>> best_language

' python '

>>> best_language.strip()

'python'

5、Python2與python3的print區別:

python2中無需將要打印的內容放在括號內。python3中的print是一個函數，所以括號必不可少；有些python2的print也包含括號。

6、Python中整數運算，使用兩個乘號表示乘方運算

>>> 3**2 #(=3*3)

>>> 10**3

1000

7、Python中避免類型錯誤使用str()函數,將其餘類型值轉化爲字符串

>>> age = 25

>>> message = "Happy " + str(age) +" Birthday!"

>>> message

'Happy 25 Birthday!'

>>> print(message)

Happy 25 Birthday!

8、Python中的註釋

以# 開頭，後面的都是註釋

基礎

數據類型

Number整數/浮點數

String字符串

Boolean布爾值True和False

空值None不是0

Tuple元組類型沒必要統一(1,‘abc’,0.4)

Dictionary key-value

List內置數據類型:列表[1,‘abc’,0.4],list是一種有序的集合，能夠隨時添加和刪除其中的元素

變量

python是動態變量,不只能夠是數字，還能夠是任意數據類型,是引用

與之對應的是靜態變量,java是靜態變量

字符串

字符串能夠用’'或者""括起來表示。

若是一個字符串包含不少須要轉義的字符，對每個字符都進行轉義會很麻煩。爲了不這種狀況，咱們能夠在字符串前面加個前綴 r ，表示這是一個 raw 字符串，裏面的字符就不須要轉義了。

編程庫

1.time

import time

print(time.time())

time = time.localtime( time.time() )

print(time)

print(time.tm_year)

"""

1563803665.310865

time.struct_time(tm_year=2019,XM代理申請http://www.fx61.com/brokerlist/xm.html tm_mon=7, tm_mday=22, tm_hour=21, tm_min=54, tm_sec=25, tm_wday=0, tm_yday=203, tm_isdst=0)

2019

"""

2.Matplotlib

繪圖工具包

3.Scikit-learn

封裝了大量經典以及最新的機器學習模型

4.Pandas

針對於數據處理和分析的python工具包,實現了大量便於數據讀寫,清洗,填充及分析功能

4.1讀取文件

import pandas as pd

# 兩個數據類型：Series, DataFrame

data_path = "C:/Users/admin/Desktop/111.csv"

# 讀取文件

def read_file(data_path):

datas = pd.read_csv(data_path, encoding="GBK")

datas = datas.dropna()

return datas

data = read_file(data_path)

print(data)

# 獲取某一列文字 Python 字典(Dictionary) -->contents_agent 轉化成一整段

contents_agent = data["asr_agent_raw"]

contents = contents_agent.values.tolist()

5.jieba

import jieba

stopwords_file = "D:/gitProject/smartlink-sqc/smartlink-sqc-wordle/python/dict/user_dict.txt"

def seg_word(contents):

contents = contents.values.tolist()

jieba.load_userdict(stopwords_file)

segment = []

for line in contents:

try:

segs = jieba.lcut(line)

for seg in segs:

if len(seg) > 1 and seg != '\r\n' and \

u'\u4e00' <= seg <= u'\u9fa5' or \

u'\u0041' <= seg <= u'\u005a' or \

u'\u0061' <= seg <= u'\u007a':

segment.append(seg)

except:

print(line)

continue

words_df = pd.DataFrame({'words': segment})

stopwords = pd.read_csv(stopwords_file,

index_col=False,

quoting=3,

sep="\t",

names=['stopwords'],

encoding='utf-8') # quoting=3全不引用

words_df = words_df[~words_df.words.isin(stopwords.stopwords)]

return words_df

# 進行分詞

words_agent = seg_word(contents_agent)

print(words_agent)

6.NumPy & SciPy

NumPy最基礎的編程庫,提供一些高級的數學運算機制和高效的向量和矩陣運算功能

SciPy是子啊NumPy的基礎上構建的,更爲強大的科學計算包

import numpy as np

def word_freq(words_df):

words_stat = words_df.groupby(by=['words'])['words'].agg({"count":np.size})

words_stat = words_stat.reset_index().sort_values(by=["count"], ascending=False)

return words_stat

words_stat_agent = word_freq(words_agent)

# 打印詞頻較高的前10

print(words_stat_agent.head(10))

7.Anaconda平臺

一次性得到300多種用於科學和工程計算相關任務的python編程庫的支持

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。