3-12 字符串操做

 

In [1]:
import pandas as pd
import numpy as np
s=pd.Series(['A','b','B','gaer','AGER',np.nan])
s
Out[1]:
0       A
1       b
2       B
3    gaer
4    AGER
5     NaN
dtype: object
 

1.大小寫轉換javascript

In [2]:
s.str.lower()#大寫轉小寫
Out[2]:
0       a
1       b
2       b
3    gaer
4    ager
5     NaN
dtype: object
In [3]:
s.str.upper()#小寫轉大寫
Out[3]:
0       A
1       B
2       B
3    GAER
4    AGER
5     NaN
dtype: object
 

2.計算字符串的長度css

In [4]:
s.str.len()
Out[4]:
0    1.0
1    1.0
2    1.0
3    4.0
4    4.0
5    NaN
dtype: float64
 

3.刪除字符串裏的空格html

In [5]:
index=pd.Index(['  tang ','  yu ','  di '])
index
Out[5]:
Index(['  tang ', '  yu ', '  di '], dtype='object')
In [6]:
index.str.strip()#刪除字符串裏的空格
Out[6]:
Index(['tang', 'yu', 'di'], dtype='object')
In [7]:
index.str.lstrip()#刪除左邊空格
Out[7]:
Index(['tang ', 'yu ', 'di '], dtype='object')
In [8]:
index.str.rstrip()#刪除右邊空格
Out[8]:
Index(['  tang', '  yu', '  di'], dtype='object')
 

4.改變DataFrame名稱html5

In [9]:
df=pd.DataFrame(np.random.randn(3,2),columns=['A a','B b'],index=range(3))
df
Out[9]:
 
  A a B b
0 -1.587250 -0.362449
1 0.179732 0.197893
2 -0.115557 0.378154
In [10]:
df.columns=df.columns.str.replace(' ','_')#空格替換成 "_"
df
Out[10]:
 
  A_a B_b
0 -1.587250 -0.362449
1 0.179732 0.197893
2 -0.115557 0.378154
 

5.用分隔符刪除java

In [11]:
s=pd.Series(['a_b_C','c_d_e','f_g_h'])
s
Out[11]:
0    a_b_C
1    c_d_e
2    f_g_h
dtype: object
In [12]:
s.str.split('_')#用分隔符刪除,變成list結構
Out[12]:
0    [a, b, C]
1    [c, d, e]
2    [f, g, h]
dtype: object
 

6.切分數據node

In [13]:
s.str.split('_',expand=True)#把數據所有分開
Out[13]:
 
  0 1 2
0 a b C
1 c d e
2 f g h
In [14]:
s.str.split('_',expand=True,n=1)#把數據切分一次
Out[14]:
 
  0 1
0 a b_C
1 c d_e
2 f g_h
In [15]:
s.str.split('_',expand=True,n=2)#把數據切分兩次
Out[15]:
 
  0 1 2
0 a b C
1 c d e
2 f g h
In [16]:
s=pd.Series(['A','Aas','Asjfds','Ajdd','Adhee'])
s
Out[16]:
0         A
1       Aas
2    Asjfds
3      Ajdd
4     Adhee
dtype: object
In [17]:
s.str.contains('Aa')#判斷Aa 是否存在
Out[17]:
0    False
1     True
2    False
3    False
4    False
dtype: bool
 

7.查詢分隔符的位置python

In [18]:
s=pd.Series(['a','a|b','a|c'])
s
Out[18]:
0      a
1    a|b
2    a|c
dtype: object
In [19]:
s.str.get_dummies(sep='|')#查詢分隔符的位置
Out[19]:
 
  a b c
0 1 0 0
1 1 1 0
2 1 0 1
相關文章
相關標籤/搜索