一、协程

1.1协程的概念
协程,又称微线程,纤程。英文名Coroutine。一句话说明什么是线程:协程是一种用户态的轻量级线程。(其实并没有说明白~)
那么这么来理解协程比较容易: 
线程是系统级别的,它们是由操作系统调度;协程是程序级别的,由程序员根据需要自己调度。我们把一个线程中的一个个函数叫做子程序,那么子程序在执行过程中可以中断去执行别的子程序;别的子程序也可以中断回来继续执行之前的子程序,这就是协程。也就是说同一线程下的一段代码执行着执行着就可以中断,然后跳去执行另一段代码,当再次回来执行代码块的时候,接着从之前中断的地方开始执行。
比较专业的理解是:
协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈。因此:协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置。
1.2 协程的优缺点
协程的优点:
(1)无需线程上下文切换的开销,协程避免了无意义的调度,由此可以提高性能(但也因此,程序员必须自己承担调度的责任,同时,协程也失去了标准线程使用多CPU的能力)
(2)无需原子操作锁定及同步的开销
(3)方便切换控制流,简化编程模型
   (4)高并发+高扩展性+低成本:一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。
协程的缺点:
(1)无法利用多核资源:协程的本质是个单线程,它不能同时将 单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上.当然我们日常所编写的绝大部分应用都没有这个必要,除非是cpu密集型应用。
(2)进行阻塞(Blocking)操作(如IO时)会阻塞掉整个程序
2、Python中如何实现协程
2.1 yield实现协程
前文所述“子程序(函数)在执行过程中可以中断去执行别的子程序;别的子程序也可以中断回来继续执行之前的子程序”,那么很容易想到Python的yield,显然yield是可以实现这种切换的。

1
2
3
4
5
6
7
def eater(name):
    
print(
"%s eat food" 
%name)
    
while 
True:
        
food = yield
    
print(
"done"
)
g = eater(
"gangdan"
)
print(g)

执行结果:

1
<generator object eater at 0x0000000002140FC0>

由执行结果可以证明g现在就是生成器函数

2.2 协程函数赋值过程

用的是yield的表达式形式,要先运行next(),让函数初始化并停在yield,然后再send() ,send会在触发下一次代码的执行时,给yield赋值
next()和send() 都是让函数在上次暂停的位置继续运行,

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def creater(name):
    
print(
'%s start to eat food' 
%name)
    
food_list = []
    
while 
True:
        
food = yield food_list
        
print(
'%s get %s ,to start eat' 
%(name,food))
        
food_list.append(food)
# 获取生成器
builder = creater(
'tom'
)
# 现在是运行函数,让函数初始化
next(builder)
print(builder.send(
'包子'
))
print(builder.send(
'骨头'
))
print(builder.send(
'菜汤'
))
 
执行结果:
1
2
3
4
5
6
7
tom start to eat food
tom get 包子 ,to start eat
[
'包子'
]
tom get 骨头 ,to start eat
[
'包子'
'骨头'
]
tom get 菜汤 ,to start eat
[
'包子'
'骨头'
'菜汤'
]

需要注意的是每次都需要先运行next()函数,让程序停留在yield位置。

如果有多个这样的函数都需要执行next()函数,让程序停留在yield位置。为了防止忘记初始化next操作,需要用到装饰器来解决此问题

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
def init(func):
    
def wrapper(*args,**kwargs):
        
builder = func(*args,**kwargs)
        
next(builder)    
# 这个地方是关键可以使用builder.send("None"),第一次必须传入None。
        
return 
builder
    
return 
wrapper
@init
def creater(name):
    
print(
'%s start to eat food' 
%name)
    
food_list = []
    
while 
True:
        
food = yield food_list
        
print(
'%s get %s ,to start eat' 
%(name,food))
        
food_list.append(food)
# 获取生成器
builder = creater(
"tom"
)
# 现在是直接运行函数,无须再函数初始化
print(builder.send(
'包子'
))
print(builder.send(
'骨头'
))
print(builder.send(
'菜汤'
))

执行结果:

1
2
3
4
5
6
7
8
9
10
tom start to eat food
tom get 包子 ,to start eat
[
'包子'
]
tom get 骨头 ,to start eat
[
'包子'
'骨头'
]
tom get 菜汤 ,to start eat
[
'包子'
'骨头'
'菜汤'
]
 
 
2.3 协程函数简单应用

请给Tom投喂食物

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
def init(func):
    
def wrapper(*args,**kwargs):
        
builder = func(*args,**kwargs)
        
next(builder)
        
return 
builder
    
return 
wrapper
@init
def creater(name):
    
print(
'%s start to eat food' 
%name)
    
food_list = []
    
while 
True:
        
food = yield food_list
        
print(
'%s get %s ,to start eat' 
%(name,food))
        
food_list.append(food)
def food():
    
builder = creater(
"Tom"
)
    
while 
True:
        
food = input(
"请给Tom投喂食物:"
).strip()
        
if 
food == 
"q"
:
            
print(
"投喂结束"
)
            
return 
0
        
else
:
            
builder.send(food)
if 
__name__ == 
'__main__'
:
    
food()

执行结果:

1
2
3
4
5
6
7
Tom start to eat food
请给Tom投喂食物:骨头
Tom get 骨头 ,to start eat
请给Tom投喂食物:菜汤
Tom get 菜汤 ,to start eat
请给Tom投喂食物:q
投喂结束

2.4 协程函数的应用

实现linux中"grep -rl error <目录>"命令,过滤一个文件下的子文件、字文件夹的内容中的相应的内容的功能程序
首先了解一个OS模块中的walk方法,能够把参数中的路径下的文件夹打开并返回一个元组

1
2
3
4
5
6
>>> 
import 
os 
# 导入模块
>>> os.walk(r
"E:\Python\script"
#使用r 是让字符串中的符号没有特殊意义,针对的是转义
<generator object walk at 0x00000000035D3F10>
>>> g = os.walk(r
"E:\Python\script"
)
>>> next(g)
(
'E:\\Python\\script'
, [
'.idea'
'函数'
], [])

返回的是一个元组,第一个元素是文件的路径,第二个是文件夹,第三个是该路径下的文件

这里需要用到一个写程序的思想:面向过程编程
二、面向过程编程
面向过程:核心是过程二字,过程及即解决问题的步骤,基于面向过程设计程序就是一条工业流水线,是一种机械式的思维方式。流水线式的编程思想,在设计程序时,需要把整个流程设计出来
优点:
1:体系结构更加清晰
2:简化程序的复杂度
缺点:
可扩展性极其的差,所以说面向过程的应用场景是:不需要经常变化的软件,如:linux内核,httpd,git等软件
下面就根据面向过程的思想完成协程函数应用中的功能
目录结构:

1
2
3
4
5
6
7
8
9
10
11
test
├── aa
│   ├── bb1
│    │    └── file2.txt
│   └── bb2
│       └── file3.txt
└─ file1.txt
文件内容:
file1.txt:error123
file2.txt:123
file3.txt:123error

程序流程

    第一阶段:找到所有文件的绝对路径
    第二阶段:打开文件
    第三阶段:循环读取每一行
    第四阶段:过滤“error”
    第五阶段:打印该行属于的文件名
第一阶段:找到所有文件的绝对路径
g是一个生成器,就能够用next()执行,每次next就是运行一次,这里的运行结果是依次打开文件的路径

1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>> 
import 
os
>>> g = os.walk(r
"E:\Python\script\函数\test"
)
>>> next(g)
(
'E:\\Python\\script\\函数\\test'
, [
'aa'
], [])
>>> next(g)
(
'E:\\Python\\script\\函数\\test\\aa'
, [
'bb1'
'bb2'
], [
'file1.txt'
])
>>> next(g)
(
'E:\\Python\\script\\函数\\test\\aa\\bb1'
, [], [
'file2.txt'
])
>>> next(g)
(
'E:\\Python\\script\\函数\\test\\aa\\bb2'
, [], [
'file3.txt'
])
>>> next(g)
Traceback (most recent call last):
  
File 
"<input>"
, line 1, 
in 
<module>
StopIteration

我们在打开文件的时候需要找到文件的绝对路径,现在可以通过字符串拼接的方法把第一部分和第三部分进行拼接

用循环打开:

1
2
3
4
import 
os
dir_g = os.walk(r
"E:\Python\script\函数\test"
)
for 
dir_path 
in 
dir_g:
    
print(dir_path)

结果:

1
2
3
4
(
'E:\\Python\\script\\函数\\test'
, [
'aa'
], [])
(
'E:\\Python\\script\\函数\\test\\aa'
, [
'bb1'
'bb2'
], [
'file1.txt'
])
(
'E:\\Python\\script\\函数\\test\\aa\\bb1'
, [], [
'file2.txt'
])
(
'E:\\Python\\script\\函数\\test\\aa\\bb2'
, [], [
'file3.txt'
])

将查询出来的文件和路径进行拼接,拼接成绝对路径

1
2
3
4
5
6
import 
os
dir_g = os.walk(r
"E:\Python\script\函数\test"
)
for 
dir_path 
in 
dir_g:
    
for 
file 
in 
dir_path[2]:
        
file 
"%s\\%s" 
%(dir_path[0],
file
)
        
print(
file
)

执行结果:

1
2
3
E:\Python\script\函数\
test
\aa\file1.txt
E:\Python\script\函数\
test
\aa\bb1\file2.txt
E:\Python\script\函数\
test
\aa\bb2\file3.txt

用函数实现:

1
2
3
4
5
6
7
8
9
10
11
12
import 
os
def search():
    
while 
True:
        
dir_name = yield
        
dir_g = os.walk(dir_name)
        
for 
dir_path 
in 
dir_g:
            
for 
file 
in 
dir_path[2]:
                
file 
"%s\\%s" 
%(dir_path[0],
file
)
                
print(
file
)
g = search()
next(g)
g.send(r
"E:\Python\script\函数\test"
)

为了把结果返回给下一流程

1
2
3
4
5
6
7
8
9
@init   
# 初始化生成器
def search(target):
    
while 
True:
        
dir_name = yield
        
dir_g = os.walk(dir_name)
        
for 
pardir,_,files 
in 
dir_g:
            
for 
file 
in 
files:
                
abspath = r
"%s\%s" 
%(pardir,
file
)
                
target.send(abspath)

第二阶段:打开文件

1
2
3
4
5
6
@init
def opener(target):
    
while 
True:
        
abspath=yield
        
with 
open
(abspath,
'rb'
) as f:
            
target.send((abspath,f))

第三阶段:循环读出每一行内容

1
2
3
4
5
6
7
@init
def 
cat
(target):
    
while 
True:
        
abspath,f=yield 
#(abspath,f)
        
for 
line 
in 
f:
            
res=target.send((abspath,line))
            
if 
res:
break

第四阶段:过滤

1
2
3
4
5
6
7
8
9
@init
def 
grep
(pattern,target):
    
tag=False
    
while 
True:
        
abspath,line=yield tag
        
tag=False
        
if 
pattern 
in 
line:
            
target.send(abspath)
            
tag=True

第五阶段:打印该行属于的文件名

1
2
3
4
5
6
7
@init
def printer():
    
while 
True:
        
abspath=yield
        
print(abspath)
g = search(opener(
cat
(
grep
(
'error'
.encode(
'utf-8'
), printer()))))
g.send(r
'E:\Python\script\函数\test'
)

执行结果:

1
2
E:\Python\script\函数\
test
\aa\file1.txt
E:\Python\script\函数\
test
\aa\bb2\file3.txt