Python‘最難’的問題——GIL問題

時間 2020-05-23

標籤 python 最難問題 gil 欄目 Python 简体版

原文原文鏈接

[TOC]python

1、什麼是GIL

GIL（解釋器全局鎖）

從名字上看能告訴咱們不少東西，很顯然，這是一個加在解釋器上的全局（從解釋器的角度看）鎖（從互斥或者相似角度看）。編程

首先來看回顧一下什麼是鎖：安全

爲何加鎖

因爲多線程共享進程的資源和地址空間，所以，在對這些公共資源進行操做時，爲了防止這些公共資源出現異常的結果，必須考慮線程的同步和互斥問題。多線程

加鎖的做用

一、用於非線程安全，二、控制一段代碼，確保其不產生調度混亂。spa

GIL官方給出的解釋

In CPython, the global interpreter lock, or GIL, is a mutex that prevents multiple native threads from executing Python bytecodes at once. This lock is necessary mainly because CPython’s memory management is not thread-safe. (However, since the GIL exists, other features have grown to depend on the guarantees that it enforces.)線程

在CPython中，全局解釋器鎖(global interpreter lock, GIL)是一個互斥體，它防止多個本機線程同時執行Python字節碼。這個鎖是必要的，主要是由於CPython的內存管理不是線程安全的。(然而，自從GIL存在以來，其餘特性已經逐漸依賴於它強制執行的保證。)設計

2、GIL的影響

GIL的設計缺陷

從上文的介紹和官方的定義來看，GIL就是一把全局排他鎖。這種方式固然很安全，可是這對於任何Python程序來講，無論有多少的處理器，任什麼時候候都老是隻有一個線程在執行。毫無疑問全局鎖的存在會對多線程的效率有不小影響。code

可是咱們課上講的例子，並非這樣啊接口

上課的多線程例子：進程

from threading import Thread
import time

def task():
    time.sleep(5)
    
def run():
    t1 = Thread(target=task)
    t2 = Thread(target=task)
    start = time.time()
    t1.start()
    t1.join()

    t2.start()
    t2.join()
    end = time.time()
    print(f'Total time: {end - start}')
	
    '''
    串行結果：
    Total time:10
    '''

    
    t1.start()
    t2.start()
    t1.join()
    t2.join()
    
    
    '''
    並行結果：
    Total time:5
    '''

可是！

看看這個

from threading import Thread
import time


def counter():
    # 計數到一億
    i = 0
    for _ in range(100000000):
        i += 1
    return True
  


def run():
    t1 = Thread(target=counter)
    t2 = Thread(target=counter)
    start = time.time()
    t1.start()
    t1.join()
    t2.start()
    t2.join()
    end = time.time()
    print(f'Total time: {end - start}')
	
    '''
	串行結果（即單線程）：
	Total time: 15.838918209075928
	'''
	
    t1.start()
    t2.start()
    t1.join()
    t2.join()
    
    '''
    並行結果：
    Total time: 16.79609990119934 
    （其實他們兩個結果我跑的時候不相上下，可是也能說明問題）
    '''
if __name__ == '__main__':
    run()

問題來了。

爲何多線程並行比單線程慢，可是老師講的例子爲何多線程並行時間又更少？

剛剛也說了是由於GIL致使的，python解釋器任什麼時候候都是一個線程在執行。

課上例子多線程並行快的緣由是：線程作的是i/o操做，能夠掛起當前線程去執行下一線程。由於遇到像 i/o操做這種會有時間空閒狀況形成cpu閒置的狀況會釋放GIL

因此在python上只要在進行耗時的IO操做的時候，能釋放GIL，這樣也仍是能夠提高運行效率的。