筆記-協程

時間 2019-11-09

標籤筆記简体版

原文原文鏈接

筆記-Python-協程

1. 簡介

協程（微線程，Coroutine）。python

server的發展以下：git

IO密集型應用: 多進程->多線程->事件驅動->協程github

CPU密集型應用:多進程-->多線程編程

多進程對應多CPU，多線程對應多核CPU，事件驅動和協程則是充分挖掘單核能力。安全

異步事件驅動模型中，把會致使阻塞的操做轉化爲一個異步操做，主線程負責發起這個異步操做，並處理這個異步操做的結果。因爲全部阻塞的操做都轉化爲異步操做，理論上主線程的大部分時間都是在處理實際的計算任務，少了多線程的調度時間，因此這種模型的性能一般會比較好。總的說來，當單核cpu性能提高，cpu不在成爲性能瓶頸時，採用異步server可以簡化編程模型，也能提升IO密集型應用的性能。多線程

1.1. 協程優勢

爲何要用協程?併發

效率，效率，效率，重要的事情說三遍！異步

爲何協程的效率高？異步編程

一個線程執行，沒有線程切換開銷；性能

由於只有一個線程，不須要多線程的鎖機制；

2. python的協程實現

python對協程的支持是經過generator來實現的。

def consumer():

r = ''

while True:

n = yield r

if not n:

return

print('[CONSUMER] Consuming %s...' % n)

r = '200 OK'

def produce(c):

c.send(None)

n = 0

while n < 5:

n = n + 1

print('[PRODUCER] Producing %s...' % n)

r = c.send(n)

print('[PRODUCER] Consumer return: %s' % r)

c.close()

c = consumer()

produce(c)

整個流程無鎖，由一個線程執行，produce和consumer協做完成任務，因此稱爲「協程」，而非線程的搶佔式多任務。

上面的例子中，整個過程沒有鎖的出現，還能保證數據安全，還能夠控制順序，優雅的實現了併發，甩多線程幾條街

線程叫微進程，而協程又叫微線程。協程擁有本身的寄存器上下文和棧，所以能保留上一次調用的狀態。

3. gevent模塊

Python環境下使用協程通常調用是gevent模塊，其基本原理是：

當一個greenlet遇到IO操做時，就會自動切換到其餘的greenlet,等IO操做完成，再切換回來，這樣就保證了總有greenlet在運行，而不是等待。

3.1. 基本使用

import requests

import gevent

import time

def foo(url):

response=requests.get(url)

response_str=response.text

print('get data %s'%len(response_str))

s=time.time()

gevent.joinall([gevent.spawn(foo,"https://itk.org/"),

gevent.spawn(foo, "https://www.github.com/"),

gevent.spawn(foo, "https://zhihu.com/"),])

# foo("https://itk.org/")

# foo("https://www.github.com/")

# foo("https://zhihu.com/")

print(time.time()-s)

3.2. 協程池：

from gevent.pool import Pool

pool = Pool(2)

g1 = pool.spwan(get_page,'www.baidu.com')

g2 = pool.spwan(get_page,'www.baidu2.com')

g3 = pool.spwan(get_page,'www.baidu3.com')

gevent.joinall([g1,g3,g2,])

print(g1.value,g2.value)

4. 進程，線程，協程的不一樣

進程

進程是具備必定獨立功能的程序關於某個數據集合上的一次運行活動,進程是系統進行資源分配和調度的一個獨立單位。每一個進程都有本身的獨立內存空間，不一樣進程經過進程間通訊來通訊。因爲進程比較重量，佔據獨立的內存，因此上下文進程間的切換開銷（棧、寄存器、虛擬內存、文件句柄等）比較大，但相對比較穩定安全。

線程

線程是進程的一個實體,是CPU調度和分派的基本單位,它是比進程更小的能獨立運行的基本單位.線程本身基本上不擁有系統資源,只擁有一點在運行中必不可少的資源(如程序計數器,一組寄存器和棧),可是它可與同屬一個進程的其餘的線程共享進程所擁有的所有資源。線程間通訊主要經過共享內存，上下文切換很快，資源開銷較少，但相比進程不夠穩定容易丟失數據。