Python之路，Day 1.1，Python基礎1

時間 2019-11-13

標籤 python 之路 day 1.1 基礎欄目 Python 简体版

原文原文鏈接

本週學習內容：html

Python介紹
Hello World程序
變量、字符編碼
用戶輸入
交互程序與格式化輸出
.pyc是個什麼鬼？

1、 Python介紹

Python 是一門什麼樣的語言？

編譯型和解釋型、靜態語言和動態語言、強類型定義語言和弱類型定義語言java

編譯器是把源程序的每一條語句都編譯成機器語言,並保存成二進制文件,這樣運行時計算機能夠直接以機器語言來運行此程序,速度很快; python

而解釋器則是隻在執行程序時,才一條一條的解釋成機器語言給計算機來執行,因此運行速度是不如編譯後的程序運行的快的. linux

編譯型vs解釋型程序員

編譯型算法

優勢：編譯器通常會有預編譯的過程對代碼進行優化。由於編譯只作一次，運行時不須要編譯，因此編譯型語言的程序執行效率高。能夠脫離語言環境獨立運行。shell

缺點：編譯以後若是須要修改就須要整個模塊從新編譯。編譯的時候根據對應的運行環境生成機器碼，不一樣的操做系統之間移植就會有問題，須要根據運行的操做系統環境編譯不一樣的可執行文件。編程

解釋型vim

優勢：有良好的平臺兼容性，在任何環境中均可以運行，前提是安裝瞭解釋器（虛擬機）。靈活，修改代碼的時候直接修改就能夠，能夠快速部署，不用停機維護。瀏覽器

缺點：每次運行的時候都要解釋一遍，性能上不如編譯型語言。

動態語言和靜態語言

一般咱們所說的動態語言、靜態語言是指動態類型語言和靜態類型語言。

（1）動態類型語言：動態類型語言是指在運行期間纔去作數據類型檢查的語言，也就是說，在用動態類型的語言編程時，永遠也不用給任何變量指定數據類型，該語言會在你第一次賦值給變量時，在內部將數據類型記錄下來。Python和Ruby就是一種典型的動態類型語言，其餘的各類腳本語言如VBScript也多少屬於動態類型語言。

（2）靜態類型語言：靜態類型語言與動態類型語言恰好相反，它的數據類型是在編譯其間檢查的，也就是說在寫程序時要聲明全部變量的數據類型，C/C++是靜態類型語言的典型表明，其餘的靜態類型語言還有C#、JAVA等。

強類型定義語言和弱類型定義語言

（1）強類型定義語言：強制數據類型定義的語言。也就是說，一旦一個變量被指定了某個數據類型，若是不通過強制轉換，那麼它就永遠是這個數據類型了。舉個例子：若是你定義了一個整型變量a,那麼程序根本不可能將a看成字符串類型處理。強類型定義語言是類型安全的語言。

（2）弱類型定義語言：數據類型能夠被忽略的語言。它與強類型定義語言相反, 一個變量能夠賦不一樣數據類型的值。

Python的優缺點

先看優勢

Python的定位是「優雅」、「明確」、「簡單」，因此Python程序看上去老是簡單易懂，初學者學Python，不但入門容易，並且未來深刻下去，能夠編寫那些很是很是複雜的程序。
開發效率很是高，Python有很是強大的第三方庫，基本上你想經過計算機實現任何功能，Python官方庫裏都有相應的模塊進行支持，直接下載調用後，在基礎庫的基礎上再進行開發，大大下降開發週期，避免重複造輪子。
高級語言————當你用Python語言編寫程序的時候，你無需考慮諸如如何管理你的程序使用的內存一類的底層細節
可移植性————因爲它的開源本質，Python已經被移植在許多平臺上（通過改動使它可以工做在不一樣平臺上）。若是你當心地避免使用依賴於系統的特性，那麼你的全部Python程序無需修改就幾乎能夠在市場上全部的系統平臺上運行
可擴展性————若是你須要你的一段關鍵代碼運行得更快或者但願某些算法不公開，你能夠把你的部分程序用C或C++編寫，而後在你的Python程序中使用它們。
可嵌入性————你能夠把Python嵌入你的C/C++程序，從而向你的程序用戶提供腳本功能。

再看缺點：

速度慢，Python 的運行速度相比C語言確實慢不少，跟JAVA相比也要慢一些，所以這也是不少所謂的大牛不屑於使用Python的主要緣由，但其實這裏所指的運行速度慢在大多數狀況下用戶是沒法直接感知到的，必須藉助測試工具才能體現出來，好比你用C運一個程序花了0.01s,用Python是0.1s,這樣C語言直接比Python快了10倍,算是很是誇張了，可是你是沒法直接經過肉眼感知的，由於一個正常人所能感知的時間最小單位是0.15-0.4s左右，哈哈。其實在大多數狀況下Python已經徹底能夠知足你對程序速度的要求，除非你要寫對速度要求極高的搜索引擎等，這種狀況下，固然仍是建議你用C去實現的。
代碼不能加密，由於PYTHON是解釋性語言，它的源碼都是以名文形式存放的，不過我不認爲這算是一個缺點，若是你的項目要求源代碼必須是加密的，那你一開始就不該該用Python來去實現。
線程不能利用多CPU問題，這是Python被人詬病最多的一個缺點，GIL即全局解釋器鎖（Global Interpreter Lock），是計算機程序設計語言解釋器用於同步線程的工具，使得任什麼時候刻僅有一個線程在執行，Python的線程是操做系統的原生線程。在Linux上爲pthread，在Windows上爲Win thread，徹底由操做系統調度線程的執行。一個python解釋器進程內有一條主線程，以及多條用戶程序的執行線程。即便在多核CPU平臺上，因爲GIL的存在，因此禁止多線程的並行執行。關於這個問題的折衷解決方法，咱們在之後線程和進程章節裏再進行詳細探討。

Python解釋器

當咱們編寫Python代碼時，咱們獲得的是一個包含Python代碼的以.py爲擴展名的文本文件。要運行代碼，就須要Python解釋器去執行.py文件。

因爲整個Python語言從規範到解釋器都是開源的，因此理論上，只要水平夠高，任何人均可以編寫Python解釋器來執行Python代碼（固然難度很大）。事實上，確實存在多種Python解釋器。

CPython

當咱們從Python官方網站下載並安裝好Python 2.7後，咱們就直接得到了一個官方版本的解釋器：CPython。這個解釋器是用C語言開發的，因此叫CPython。在命令行下運行python就是啓動CPython解釋器。

CPython是使用最廣的Python解釋器。教程的全部代碼也都在CPython下執行。

IPython

IPython是基於CPython之上的一個交互式解釋器，也就是說，IPython只是在交互方式上有所加強，可是執行Python代碼的功能和CPython是徹底同樣的。比如不少國產瀏覽器雖然外觀不一樣，但內核其實都是調用了IE。

CPython用>>>做爲提示符，而IPython用In [序號]:做爲提示符。

PyPy

PyPy是另外一個Python解釋器，它的目標是執行速度。PyPy採用JIT技術，對Python代碼進行動態編譯（注意不是解釋），因此能夠顯著提升Python代碼的執行速度。

絕大部分Python代碼均可以在PyPy下運行，可是PyPy和CPython有一些是不一樣的，這就致使相同的Python代碼在兩種解釋器下執行可能會有不一樣的結果。若是你的代碼要放到PyPy下執行，就須要瞭解PyPy和CPython的不一樣點。

Jython

Jython是運行在Java平臺上的Python解釋器，能夠直接把Python代碼編譯成Java字節碼執行。

IronPython

IronPython和Jython相似，只不過IronPython是運行在微軟.Net平臺上的Python解釋器，能夠直接把Python代碼編譯成.Net的字節碼。

Python的解釋器不少，但使用最普遍的仍是CPython。若是要和Java或.Net平臺交互，最好的辦法不是用Jython或IronPython，而是經過網絡調用來交互，確保各程序之間的獨立性。

2、Hello World程序

在linux 下建立一個文件叫hello.py,並輸入

 
         print 
         ( 
         "Hello World!" 
         )

而後執行命令:python hello.py ,輸出

 
         localhost:~ jieli$ vim hello.py 
        
         localhost:~ jieli$ python hello.py 
        
         Hello World!

指定解釋器

上一步中執行 python hello.py 時，明確的指出 hello.py 腳本由 python 解釋器來執行。

若是想要相似於執行shell腳本同樣執行python腳本，例： ./hello.py ，那麼就須要在 hello.py 文件的頭部指定解釋器，以下：

 
        #!/usr/bin/env python 
       
        print  
        "hello,world"

如此一來，執行： ./hello.py 便可。

ps：執行前需給予 hello.py 執行權限，chmod 755 hello.py

ps: #!user/bin/python 目錄已經寫死，會用到python默認裝在系統內的低版本解釋器；相對而言，上方是在整個系統環境下尋找python，用於聲明所須要的解釋器

3、變量\字符編碼

變量定義的規則：

變量名只能是字母、數字或下劃線的任意組合
變量名的第一個字符不能是數字
如下關鍵字不能聲明爲變量名
['and', 'as', 'assert', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'exec', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'not', 'or', 'pass', 'print', 'raise', 'return', 'try', 'while', 'with', 'yield']

python解釋器在加載 .py 文件中的代碼時，會對內容進行編碼（python2 默認ascill，python3 utf-8）。

ASCII（American Standard Code for Information Interchange，美國標準信息交換代碼）是基於拉丁字母的一套電腦編碼系統，主要用於顯示現代英語和其餘西歐語言，其最多隻能用 8 位來表示（一個字節），即：2**8 = 256-1，因此，ASCII碼最多隻能表示 255 個符號。

關於中文

爲了處理漢字，程序員設計了用於簡體中文的GB2312和用於繁體中文的big5。

GB2312(1980年)一共收錄了7445個字符，包括6763個漢字和682個其它符號。漢字區的內碼範圍高字節從B0-F7，低字節從A1-FE，佔用的碼位是72*94=6768。其中有5個空位是D7FA-D7FE。

GB2312 支持的漢字太少。1995年的漢字擴展規範GBK1.0收錄了21886個符號，它分爲漢字區和圖形符號區。漢字區包括21003個字符。2000年的 GB18030是取代GBK1.0的正式國家標準。該標準收錄了27484個漢字，同時還收錄了藏文、蒙文、維吾爾文等主要的少數民族文字。如今的PC平臺必須支持GB18030，對嵌入式產品暫不做要求。因此手機、MP3通常只支持GB2312。

從ASCII、GB23十二、GBK 到GB18030，這些編碼方法是向下兼容的，即同一個字符在這些方案中老是有相同的編碼，後面的標準支持更多的字符。在這些編碼中，英文和中文能夠統一地處理。區分中文編碼的方法是高字節的最高位不爲0。按照程序員的稱呼，GB23十二、GBK到GB18030都屬於雙字節字符集 (DBCS)。

有的中文Windows的缺省內碼仍是GBK，能夠經過GB18030升級包升級到GB18030。不過GB18030相對GBK增長的字符，普通人是很難用到的，一般咱們仍是用GBK指代中文Windows內碼。

顯然ASCII碼沒法將世界上的各類文字和符號所有表示，因此，就須要新出一種能夠表明全部字符和符號的編碼，即：Unicode

Unicode（統一碼、萬國碼、單一碼）是一種在計算機上使用的字符編碼。Unicode 是爲了解決傳統的字符編碼方案的侷限而產生的，它爲每種語言中的每一個字符設定了統一而且惟一的二進制編碼，規定雖有的字符和符號最少由 16 位來表示（2個字節），即：2 **16 = 65536，
注：此處說的的是最少2個字節，可能更多

UTF-8，是對Unicode編碼的壓縮和優化，他再也不使用最少使用2個字節，而是將全部的字符和符號進行分類：ascii碼中的內容用1個字節保存、歐洲的字符用2個字節保存，東亞的字符用3個字節保存...

因此，python解釋器在加載 .py 文件中的代碼時，會對內容進行編碼（默認ascill），若是是以下代碼的話：

報錯：ascii碼沒法表示中文

 
         #!/usr/bin/env python 
        
         print  
         "你好，世界"

改正：應該顯示的告訴python解釋器，用什麼編碼來執行源代碼，即：

 
         #!/usr/bin/env python 
        
         # -*- coding: utf-8 -*- 
        
         print  
         "你好，世界"

4、用戶輸入　

 1 import getpass
 2 
 3 _username = 'Alex'
 4 _password = 'ab123'
 5 username = input("username:")
 6 #password = getpass.getpass("password:")  # 注意，在CMD中運行良好，在pycharm中有Bug
 7 password = input("password:")
 8 
 9 if _username == username and _password == password:
10     print("Welcome user {name} login...".format(name = username)) # 注意，輸入過程當中不能有空格
11 else:
12     print("Invalid password or username!")
13 
14 print(username,password)

 
      #!/usr/bin/env python 
     
      #_*_coding:utf-8_*_ 
     
      #name = raw_input("What is your name?") #only on python 2.x 
     
      name  
      =  
      input 
      ( 
      "What is your name?" 
      ) 
     
      print 
      ( 
      "Hello "  
      +  
      name )

輸入密碼時，若是想要不可見，須要利用getpass 模塊中的 getpass方法，即：

 
         #!/usr/bin/env python 
        
         # -*- coding: utf-8 -*- 
        
         import  
         getpass 
        
         # 將用戶輸入的內容賦值給 name 變量 
        
         pwd  
         =  
         getpass.getpass( 
         "請輸入密碼：" 
         ) 
        
         # 打印輸入的內容 
        
         print 
         (pwd)

5、交互程序與格式化輸出

 1 name = input("name:")
 2 salary = input("salary:")             # 即便在這裏輸入的是int，可是系統默認爲str，info3會報錯
 3 job = input("job:")
 4 
 5 info1 = '''---info of ''' + name + '''---
 6 salary:''' + salary + ''' 
 7 job:'''+ job
 8 
 9 
10 info2 = '''--- info of %s ---
11 salary: %s
12 job: %s
13 '''%( name, salary ,job )
14 
15 """
16 info3 = '''--- info of %s ---
17 salary: %d
18 job: %s
19 '''%( name, salary ,job )
20 """
21 
22 info4 = '''--- info of  {_name} ---
23 salary: {_salary}
24 job: {_job}
25 '''.format( _name = name,
26             _salary = salary,
27             _job = job )
28 
29 info5 = '''--- info of  {} ---
30 salary: {}
31 job: {}
32 '''.format(  name,
33              salary,
34              job )                                 # 要求順序一致，推薦上一種方式
35 
36 print(info1,info2,info4,info5)

6、.pyc是個什麼鬼？

1. Python是一門解釋型語言？

我初學Python時，聽到的關於Python的第一句話就是，Python是一門解釋性語言，我就這樣一直相信下去，直到發現了*.pyc文件的存在。若是是解釋型語言，那麼生成的*.pyc文件是什麼呢？c應該是compiled的縮寫纔對啊！

爲了防止其餘學習Python的人也被這句話誤解，那麼咱們就在文中來澄清下這個問題，而且把一些基礎概念給理清

2. 解釋型語言和編譯型語言

計算機是不可以識別高級語言的，因此當咱們運行一個高級語言程序的時候，就須要一個「翻譯機」來從事把高級語言轉變成計算機能讀懂的機器語言的過程。這個過程分紅兩類，第一種是編譯，第二種是解釋。

編譯型語言在程序執行以前，先會經過編譯器對程序執行一個編譯的過程，把程序轉變成機器語言。運行時就不須要翻譯，而直接執行就能夠了。最典型的例子就是C語言。

解釋型語言就沒有這個編譯的過程，而是在程序運行的時候，經過解釋器對程序逐行做出解釋，而後直接運行，最典型的例子是Ruby。

經過以上的例子，咱們能夠來總結一下解釋型語言和編譯型語言的優缺點，由於編譯型語言在程序運行以前就已經對程序作出了「翻譯」，因此在運行時就少掉了「翻譯」的過程，因此效率比較高。可是咱們也不能一律而論，一些解釋型語言也能夠經過解釋器的優化來在對程序作出翻譯時對整個程序作出優化，從而在效率上超過編譯型語言。

此外，隨着Java等基於虛擬機的語言的興起，咱們又不能把語言純粹地分紅解釋型和編譯型這兩種。

用Java來舉例，Java首先是經過編譯器編譯成字節碼文件，而後在運行時經過解釋器給解釋成機器文件。因此咱們說Java是一種先編譯後解釋的語言。

3. Python究竟是什麼

其實Python和Java/C#同樣，也是一門基於虛擬機的語言，咱們先來從表面上簡單地瞭解一下Python程序的運行過程吧。

當咱們在命令行中輸入python hello.py時，實際上是激活了Python的「解釋器」，告訴「解釋器」：你要開始工做了。但是在「解釋」以前，其實執行的第一項工做和Java同樣，是編譯。

熟悉Java的同窗能夠想一下咱們在命令行中如何執行一個Java的程序：

javac hello.java

java hello

只是咱們在用Eclipse之類的IDE時，將這兩部給融合成了一部而已。其實Python也同樣，當咱們執行python hello.py時，他也同樣執行了這麼一個過程，因此咱們應該這樣來描述Python，Python是一門先編譯後解釋的語言。

4. 簡述Python的運行過程

在說這個問題以前，咱們先來講兩個概念，PyCodeObject和pyc文件。

咱們在硬盤上看到的pyc天然沒必要多說，而其實PyCodeObject則是Python編譯器真正編譯成的結果。咱們先簡單知道就能夠了，繼續向下看。