在python 的并发编程领域 以前有tornado 后来有gevent
python 在发展的过程当中 有过一些失败的修复CPython 的缺陷和提高性能的尝试,比如消除GIL(这么多年 这么多的大牛 没有一个解决的方案???) 也有成功的案例 比如 Pypy
协程
每个人都在谈论协程的好处 优点 为了KPI 强行上协程 并不可取。
Coroutine 也就是 corporate routine,直译为「协同的例程」,中文一般叫做「协程」, 实际上这个概念和进程与线程有相似之处, 因为linux线程就是所谓的「轻量级进程」。
gevent源码分析的描述当中
相同点:
二者都是可以看做是一种执行流, 该执行流可以挂起,并且在将来又可以在 你挂起的地方恢复执行, 这实际上都可以看做是continuation, 我们来看看当我们挂 起一个执行流时我们要保存的东西:
栈, 因为如果你不保存栈,那么局部变量你就无法恢复,同时函数的调用链你也无 法恢复,
寄存器的状态: 这好理解, 比如说EIP,如果你不保存,那么你恢复执行流就不知道 到底执行哪一条指令, 在比如说ESP,EBP, 如果你不保存,那么你即便有完整的栈 你也不知道怎么用.
这二者实际就是所谓的上下文,也可以说是continuation. 在执行流切换时必须保存 这两个东西, 内核调度进程时也是一回事.
不同点:
执行流的调度者不同, 进程是内核调度, 而协程是在用户态调度, 也就是说进程 的上下文是在内核态保存恢复的,而协程是在用户态保存恢复的. 很显然用户态的 代价更低
进程会被抢占,而协程不会,也就是说协程如果不主动让出CPU,那么其他的协程是不 可能得到执行机会,这实际和早期的操作系统类似,比如DOS, 它有一个yield原语, 一个进程调用yield,那么它就会让出CPU, 其他的进程也就有机会执行了, 如果一 个进程进入了死循环,那么整个系统也就挂起了,永远无法运行其他的进程了, 但 对协程而言,这不是问题
对内存的占用不同,实际上协程可以只需要4K的栈就够了, 而进程占用的内存要大 的多.
从操作系统的角度讲, 多协程的程序是单线程,单进程的
协程的优势在于
由开发者决定协程的切换,操作系统无法干预切换,且占用内存小的多。
Gevent是一种基于协程的Python网络库,它用到Greenlet提供的,封装了libevent事件循环的高层同步API。它让开发者在不改变编程习惯的同时,用同步的方式写异步I/O的代码。
gevent 缺点
- Monkey-patching。中文「猴子补丁」,常用于对测试环境做一些hack。我个人不太喜欢这种「黑魔法」,因为如果其他人不了解细节,极为容易产生困惑。Gvanrossum说用它就是”patch-and-pray”,太形象了。由于Gevent直接修改标准库里面大部分的阻塞式系统调用,包括socket、ssl、threading和 select等模块,而变为协作式运行。但是我们无法保证你在复杂的生产环境中有哪些地方使用这些标准库会由于打了补丁而出现奇怪的问题,那么你只能祈祷(pray)了。其次,在Python之禅中明确说过:「Explicit is better than implicit.」,猴子补丁明显的背离了这个原则。最后,Gvanrossum说Stackless之父Christian Tismer也赞同他。 我喜欢显式的「yield from」
- 第三方库支持。得确保项目中用到其他用到的网络库也必须使用纯Python或者明确说明支持Gevent,而且就算有这样的第三方库,我还会担心这个第三方库的代码质量和功能性。
- Greenlet不支持Jython和IronPython,这样就无法把gevent设计成一个标准库了。
建议py 3.6 之后 选择标准库 asyncio