分布式定时任务框架——python定时任务框架APScheduler扩充

2012-09-06

分布式定时任务框架——python定时任务框架APScheduler扩展如果将定时任务部署在一台服务器上，那么这个定时

分布式定时任务框架——python定时任务框架APScheduler扩展

如果将定时任务部署在一台服务器上，那么这个定时任务就是整个系统的单点，这台服务器出现故障的话会影响服务。对于可以冗余的任务（重复运行不影响服务），可以部署在多台服务器上，让他们同时执行，这样就可以很简单的避免单点。但是如果任务不允许冗余，最多只能有一台服务器执行任务，那么前面的方法显然行不通。本篇文章就向大家介绍如何避免这种互斥任务的单点问题，最后再介绍一下基于APScheduler的分布式定时任务框架，这个框架是通过多个项目的实践总结而成的。

对于运行在同一台服务器上的两个进程，可以通过加锁实现互斥执行，而对于运行在多个服务器上的任务仍然可以通过用加锁实现互斥，不过这个锁是分布式锁。这个分布式锁并没有那么神秘，实际上只要一个提供原子性的数据库即可。比如，在数据库的locks表里有一个记录（lock record），包含属性：

name：锁的名字，互斥的任务需要用名字相同的锁。

active_ip：持有锁的服务器的ip。

update_time：上次持有锁的时间，其他非活跃的服务器通过这个属性判断活跃的服务器是否超时，如果超时，则会争夺锁。

一个持有锁的服务器通过不断的发送心跳，来更新这个记录，心跳的内容就是持有锁的时间戳（update_time），以及本机ip。也就是说，通过发送心跳来保证当前的服务器是活跃的，而其他服务器通过lock record中的update_time来判断当前活跃的服务器是否超时，一旦超时，其他的服务器就会去争夺锁，接管任务的执行，并发送心跳更新active_ip。

通过上面描述，这个框架中最重要的两个概念就是分布式锁和心跳。下面看一下分布式定时任务框架中是如何实现这两点的。当然，这个框架依赖于APScheduler，所以必须安装这个模块，具体APScheduler的介绍见我的另一篇文章，因为依赖APScheduler，所以这个框架很简单，只有一个类：

easy_install pymongo

easy_install的安装件另一篇文章。

这个任务很简单就是定时打印整数序列。同时在两台服务器上部署运行，可以发现只有一台服务器会输出整数序列。

使用起来还是很方便的。源代码见github，其中还有使用redis存储锁，已经在锁记录中存放自定义信息的例子。

热点排行

perl python

分布式定时任务框架——python定时任务框架APScheduler扩充