Celery必须实例化后才可以使用,实例称之为application或者简称app。实例是线程安全的,多个Celery实例(不同的配置、部件和任务)都可以在一个进程空间中运行。
创建一个最简单的app:
>>> from celery import Celery
>>> app = Celery()
>>> app
<Celery __main__ at 0x7f6be52d0cd0>
上述的app是一个运行在__main__模块中的Celery实例。
Main Name
Celery发送任务信息时,是不发送任何源代码的,只是发送要执行的任务名称,而每个worker都维持着一个任务名称到任务具体函数的映射,称之为任务注册。
所以每个任务task都要有一个独特的不重复名称,可以看下任务默认名称是如何生成的:
>>> @app.task
... def add(x, y):
... return x + y
...
>>> add.name
u'__main__.add'
可见任务的名称是实例运行模块的名称加上任务函数的名称。
现在在py文件中创建一个app实例,tasks.py:
from celery import Celery
app = Celery() @app.task
def add(x, y): return x + y if __name__ == '__main__':
print add.name
app.worker_main()
在shell中直接创建Celery实例、模块直接运行或者在命令行中运行模块,都是在main模块中运行的:
$ python tasks.py
__main__.add
而使用import导入模块的时候,main name为定义Celery实例模块的名称:
>>> from tasks import add
>>> add.name
u'tasks.add'
在main模块中运行是可以手动指定实例的Main name的:
>>> from celery import Celery
>>> app = Celery('tasks')
>>> app.main
'tasks'
任务的名称也可以指定:
>>> @app.task(name='sum-of-two-numbers')
>>> def add(x, y):
... return x + y >>> add.name
'sum-of-two-numbers'
Configuration
要为app实例添加配置有几种方式:
创建app实例时初始化:
app = Celery('tasks', backend='redis://localhost:6379/0',
┆ ┆ ┆broker='redis://localhost:6379/0')
使用app.conf属性设置:
app.conf.result_backend = 'redis://localhost:6379/0'
app.conf.broker_url = 'redis://localhost:6379/0'
update多个配置:
>>> app.conf.update(
... enable_utc=True,
... timezone='Asia/Shanghai',
...)
使用配置文件,在当前目录下或者python可以搜索到的目录下建立一个配置文件,保证可以import,celeryconfig.py :
result_backend = 'redis://localhost:6379/0'
broker_url = 'redis://localhost:6379/0'
然后:
app.config_from_object('celeryconfig')
可以测试一下配置文件是否有格式错误:
$ python -m celeryconfig
也可以建立一个配置类:
class Config:
enable_utc = True
timezone = 'Europe/London' app.config_from_object(Config)
从环境变量中获取:
import os
from celery import Celery #: Set default configuration module name
os.environ.setdefault('CELERY_CONFIG_MODULE', 'celeryconfig') app = Celery()
app.config_from_envvar('CELERY_CONFIG_MODULE')
查看配置:
>>> app.conf.humanize(with_defaults=False, censored=True)
>>> app.conf.table(with_defaults=False, censored=True)
第一条以字符串的形式返回,第二条以字典的形式返回。
with_defaults设置为True时可以查看默认的配置,censored设置为True可以过滤掉敏感信息,包括API, TOKEN, KEY, SECRET, PASS, SIGNATURE, DATABASE。
Laziness
app实例是延迟的,创建一个实例只会将app设置为current app,只有在真正需要的时候才会完成。
实例只有在调用app.finalize()方法或者访问app.tasks属性时才会完成。
Finalizing实例会复制apps之间可以共享的tasks,执行未确定的tasks装饰器,确定所有的tasks都绑定于current app。
app.task装饰器并不会真正的创建task任务,直到task被调用或者app finalize完成时才创建:
>>> from celery import Celery
>>> app = Celery()
>>> @app.task
... def add(x, y):
... return x + y
...
>>> add.__evaluated__()
False
>>> repr(add)
'<@task: __main__.add of __main__ at 0x7f6571694cd0>'
>>> add.__evaluated__()
True
调用了task的__repr__方法后,task就被真正创建了。
Breaking the chain
当使用current app时,最好将其作为参数进行传递,称之为app chain,比较好的实践是:
class Scheduler(object): def __init__(self, app):
self.app = app
而不要:
from celery import current_app class Scheduler(object): def run(self):
app = current_app
通用的的写法:
from celery.app import app_or_default class Scheduler(object):
def __init__(self, app=None):
self.app = app_or_default(app)
开发时可以设置:
$ CELERY_TRACE_APP=1 celery worker -l info
当app chain断裂时会raise一个异常。
Abstract Tasks
使用app.task装饰器创建的任务都继承自Task类。
可以自定义:
from celery import Task class DebugTask(Task): def __call__(self, *args, **kwargs):
print('TASK STARTING: {0.name}[{0.request.id}]'.format(self))
return super(DebugTask, self).__call__(*args, **kwargs)
然后用base参数指定:
@app.task(base=DebugTask)
def add(x, y):
return x + y
也可以使用app的Task参数修改:
>>> app.Task = DebugTask