python 入門拾遺

時間 2019-11-09

標籤 python 入門拾遺欄目 Python 简体版

原文原文鏈接

三元運算

實例

進制

二進制，01
八進制，01234567
十進制，0123456789

十六進制，0123456789ABCDEF 二進制到16進制轉換html

http://jingyan.baidu.com/album/47a29f24292608c0142399cb.html?picindex=1

bytes類型

因爲Python的字符串類型是str，在內存中以Unicode表示，一個字符對應若干個字節。若是要在網絡上傳輸，或者保存到磁盤上，就須要把str變爲以字節爲單位的bytes。python

python3都是以2進制bytes傳輸
網絡

Python對bytes類型的數據用帶b前綴的單引號或雙引號表示：函數

x = b'ABC'
  要注意區分'ABC'和b'ABC'，前者是str，後者雖然內容顯示得和前者同樣，但    **bytes的每一個字符都只佔用一個字節。**

以Unicode表示的str經過 encode() 方法能夠編碼爲指定的bytes，例如：編碼

>>> 'ABC'.encode('ascii')
  b'ABC'
  >>> '中文'.encode('utf-8')
  b'\xe4\xb8\xad\xe6\x96\x87'
  >>> '中文'.encode('ascii')
  Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
  UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in     range(128)

  純英文的str能夠用ASCII編碼爲bytes，內容是同樣的，含有中文的str能夠用UTF-8編碼爲bytes。含有中文的str沒法用ASCII編碼，由於中文編碼的範圍超過了ASCII編碼的範圍，Python會報錯。

在bytes中，沒法顯示爲ASCII字符的字節，用\x##顯示。code
反過來，若是咱們從網絡或磁盤上讀取了字節流，那麼讀到的數據就是bytes。要把bytes變爲str，就須要用decode()方法：htm
```
>>> b'ABC'.decode('ascii')
  'ABC'
  >>> b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')
  '中文'
```

要計算str包含多少個字符，能夠用len()函數：blog

>>> len('ABC')
  3
  >>> len('中文')
  2
  len()函數計算的是str的字符數，若是換成bytes，len()函數就計算字節數：
  >>> len(b'ABC')
  3
  >>> len(b'\xe4\xb8\xad\xe6\x96\x87')
  6
  >>> len('中文'.encode('utf-8'))
  6
  可見，1箇中文字符通過UTF-8編碼後一般會佔用3個字節，而1個英文字符只佔用1個字節。

在操做字符串時，咱們常常遇到str和bytes的互相轉換。爲了不亂碼問題，應當始終堅持使用UTF-8編碼對str和bytes進行轉換。內存

因爲Python源代碼也是一個文本文件，因此，當你的源代碼中包含中文的時候，在保存源代碼時，就須要務必指定保存爲UTF-8編碼。當Python解釋器讀取源代碼時，爲了讓它按UTF-8編碼讀取，咱們一般在文件開頭寫上這兩行：utf-8

#!/usr/bin/env python
  # -*- coding: utf-8 -*-

  第一行註釋是爲了告訴Linux/OS X系統，這是一個Python可執行程序，Windows系統會忽略這個註釋；

  第二行註釋是爲了告訴Python解釋器，按照UTF-8編碼讀取源代碼，不然，你在源代碼中寫的中文輸出可能會有亂碼。

實例

# author = "zhuyouen"
msg = "我愛北京天安門"
print(msg)
print(msg.encode('utf-8'))
print(msg.encode('utf-8').decode('utf-8'))


D:\python35\python.exe D:/PycharmProjects/zhuyouen/0402/encoding.py
我愛北京天安門
b'\xe6\x88\x91\xe7\x88\xb1\xe5\x8c\x97\xe4\xba\xac\xe5\xa4\xa9\xe5\xae\x89\xe9\x97\xa8'
我愛北京天安門

1. 入門知識拾遺
2. Python拾遺（一）
3. Python 學習拾遺
4. [TODO]Python拾遺（二）
5. [TODO]Python拾遺（三）
6. Python之路,Day12 - Python基礎-入門知識拾遺
7. java拾遺5----Java操做Mongo入門
8. 拾遺
9. Python學習---Django拾遺180328
10. golang拾遺：嵌入類型
更多相關文章...
• Memcached入門教程 - NoSQL教程
• SQLite - Python - SQLite教程
• YAML 入門教程
• Java Agent入門實戰（一）-Instrumentation介紹與使用

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。