python基礎和編程庫

Python編程從入門到實踐-------基礎入門html

1Python中的變量java

2Python首字母大寫使用title()方法,所有大寫upper()方法,所有小寫lower()方法python

3Python中字符串拼接使用 + git

4Python中刪除字符串的空格 刪除末尾空格的rstrip(),刪除開頭空格的lstrip(),刪除兩端空格的strip()編程

5Python2python3print區別:app

6Python中整數運算,使用兩個乘號表示乘方運算機器學習

7Python中避免類型錯誤使用str()函數,將其餘類型值轉化爲字符串函數

8Python中的註釋工具

1Python中的變量學習

變量名:大小寫英文,數字和下劃線的組合,不能以數字開頭

2Python首字母大寫使用title()方法,所有大寫upper()方法,所有小寫lower()方法

>>> name='ce shi python'

>>> name.title();

'Ce Shi Python'

>>> print(name.upper())

CE SHI PYTHON

>>> name2="CE SHI PYTHON"

>>> print (name2.lower())

ce shi python

3Python中字符串拼接使用 +

>>> first_name='ce'

>>> last_name="shi"

>>> full_name=first_name + last_name

>>> print(full_name)

ceshi

>>> print("Hello"+" "+full_name+" "+'welcome!')

Hello ceshi welcome!

4Python中刪除字符串的空格 刪除末尾空格的rstrip(),刪除開頭空格的lstrip(),刪除兩端空格的strip()

>>> best_language=" python  "

>>> best_language = best_language.rstrip()

>>> best_language

' python'

>>> best_language = best_language.lstrip()

>>> best_language

'python'

>>> best_language=" python  "

>>> best_language

' python  '

>>> best_language.strip()

'python'

5Python2python3print區別:

python2中無需將要打印的內容放在括號內。python3中的print是一個函數,所以括號必不可少;有些python2print也包含括號。

6Python中整數運算,使用兩個乘號表示乘方運算

>>> 3**2     #(=3*3)

>>> 10**3

1000

7Python中避免類型錯誤使用str()函數,將其餘類型值轉化爲字符串

>>> age = 25

>>> message = "Happy " + str(age) +" Birthday!"

>>> message

'Happy 25 Birthday!'

>>> print(message)

Happy 25 Birthday!

8Python中的註釋

# 開頭,後面的都是註釋

基礎

數據類型

Number整數/浮點數

String字符串

Boolean布爾值TrueFalse

空值None不是0

Tuple元組類型沒必要統一(1,abc,0.4)

Dictionary key-value

List內置數據類型:列表[1,abc,0.4],list是一種有序的集合,能夠隨時添加和刪除其中的元素

變量

python是動態變量,不只能夠是數字,還能夠是任意數據類型,是引用

與之對應的是靜態變量,java是靜態變量

字符串

字符串能夠用'或者""括起來表示。

若是一個字符串包含不少須要轉義的字符,對每個字符都進行轉義會很麻煩。爲了不這種狀況,咱們能夠在字符串前面加個前綴 r ,表示這是一個 raw 字符串,裏面的字符就不須要轉義了。

編程庫

1.time

import time

print(time.time())

time  = time.localtime( time.time() )

print(time)

print(time.tm_year)

"""

1563803665.310865

time.struct_time(tm_year=2019,XM代理申請http://www.fx61.com/brokerlist/xm.html tm_mon=7, tm_mday=22, tm_hour=21, tm_min=54, tm_sec=25, tm_wday=0, tm_yday=203, tm_isdst=0)

2019

"""

2.Matplotlib

繪圖工具包

3.Scikit-learn

封裝了大量經典以及最新的機器學習模型

4.Pandas

針對於數據處理和分析的python工具包,實現了大量便於數據讀寫,清洗,填充及分析功能

4.1讀取文件

import pandas as pd

# 兩個數據類型:Series,  DataFrame

 

data_path = "C:/Users/admin/Desktop/111.csv"

# 讀取文件

def read_file(data_path):

    datas = pd.read_csv(data_path, encoding="GBK")

    datas = datas.dropna()

    return datas

data = read_file(data_path)

print(data)

# 獲取某一列文字   Python 字典(Dictionary) -->contents_agent 轉化成一整段

contents_agent = data["asr_agent_raw"]

contents = contents_agent.values.tolist()

5.jieba

import jieba

stopwords_file = "D:/gitProject/smartlink-sqc/smartlink-sqc-wordle/python/dict/user_dict.txt"

def seg_word(contents):

    contents = contents.values.tolist()

    jieba.load_userdict(stopwords_file)

    segment = []

    for line in contents:

        try:

            segs = jieba.lcut(line)

            for seg in segs:

                if len(seg) > 1 and seg != '\r\n' and \

                        u'\u4e00' <= seg <= u'\u9fa5' or \

                        u'\u0041' <= seg <= u'\u005a' or \

                        u'\u0061' <= seg <= u'\u007a':

                    segment.append(seg)

        except:

            print(line)

            continue

    words_df = pd.DataFrame({'words': segment})

    stopwords = pd.read_csv(stopwords_file,

                            index_col=False,

                            quoting=3,

                            sep="\t",

                            names=['stopwords'],

                            encoding='utf-8')   # quoting=3全不引用

    words_df = words_df[~words_df.words.isin(stopwords.stopwords)]

    return words_df

# 進行分詞

words_agent = seg_word(contents_agent)

print(words_agent)

6.NumPy & SciPy

NumPy最基礎的編程庫,提供一些高級的數學運算機制和高效的向量和矩陣運算功能

SciPy是子啊NumPy的基礎上構建的,更爲強大的科學計算包

import numpy as np

def word_freq(words_df):

    words_stat = words_df.groupby(by=['words'])['words'].agg({"count":np.size})

    words_stat = words_stat.reset_index().sort_values(by=["count"], ascending=False)

    return words_stat

words_stat_agent = word_freq(words_agent)

# 打印詞頻較高的前10

print(words_stat_agent.head(10))

7.Anaconda平臺

一次性得到300多種用於科學和工程計算相關任務的python編程庫的支持

相關文章
相關標籤/搜索