乐知付加密服务平台

如果你有资源, 平台可以帮你实现内容变现, 无需搭建知识付费服务平台。

点击访问官方网站 https://lezhifu.cc

扫码关注公众号 乐知付加密服务平台-微信公众号
Airflow元数据表dag介绍 | chenzuoli's blog

Airflow元数据表dag介绍

大家好,我是Lee。

上次介绍了airflow的元数据表log,里面的主要字段event是干嘛的,怎么识别手动操作和系统操作,今天就说下dag表中的一些字段,是什么意思,该怎么用。

pexels

我使用的airflow是1.10.14版本。

先看下表结构:

FieldTypeNullKeyDefaultExtra
dag_idvarchar(250)NOPRI
is_pausedtinyint(1)YES
is_subdagtinyint(1)YES
is_activetinyint(1)YES
last_scheduler_runtimestamp(6)YES
last_pickledtimestamp(6)YES
last_expiredtimestamp(6)YES
scheduler_locktinyint(1)YES
pickle_idint(11)YES
filelocvarchar(2000)YES
ownersvarchar(2000)YES
descriptiontextYES
default_viewvarchar(25)YES
schedule_intervaltextYES
root_dag_idvarchar(250)YESMUL
  1. dag_id: dag的唯一标识,也是这个表的主键;
  2. is_paused: 表示这个dag是否是开启状态,1表示开启,0表示关闭,关闭状态,scheduler不会调度该dag;
  3. is_subdag: 表示这个dag是否是一个subdag。airflow中有dag包含的概念,我们可以新建一个dag,然后把其他的dag也包含进来,作为自己的其中一个子dag(一个task),子dag会依赖父dag的运行参数,但是子dag也会在元数据库中新建一个dag,dag名字为parent_dag_id.child_dag_id,并且字段root_dag_idparent_dag_id,我们可以看下图:
    subdag
  4. is_active: 表示这个dag是否存在,=0代表这个dag文件之前存在过,现在已经被删除了。
  5. fileloc: 表示这个dag对应的文件所在位置;
  6. owners: 这个dag的属主,我们在定义dag文件的时候,有个owner参数可以使用:
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    default_args = {
    'owner': 'chenzuoli',
    'depends_on_past': False,
    'start_date': datetime(2018, 12, 24),
    'email': ['chenzuoli709@163.com'],
    'email_on_failure': True,
    'email_on_retry': False,
    'retries': 3,
    'retry_delay': timedelta(minutes=5),
    'sla': timedelta(seconds=30),
    'catchup' : False
    }

    dag = DAG(
    dag_id,
    default_args=default_args,
    schedule_interval='10 0 * * *',
    catchup=False)
  7. description: 是dag的描述,我们可以在定义dag的时候指定,相当于dag的中文注释;
  8. schedule_interval: 是dag的调度时间,我们可以使用crontab表达式进行描述,也可以使用airflow可识别的参数,如下:
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    {
    '@hourly': '0 * * * *',
    '@daily': '0 0 * * *',
    '@weekly': '0 0 * * 0',
    '@monthly': '0 0 1 * *',
    '@quarterly': '0 0 1 */3 *',
    '@yearly': '0 0 1 1 *',
    '@once': 一次,
    'none': 无
    }
  9. root_dag_id: 如果dag为subdag,那么这个字段就是subdag对应的父dag;

好了,其他字段用得少,基本不用介绍。

下期带大家看跟dag定义相关的表dag_run,它类似我们面向对象中的类的实例,而dag表就是类的定义。

下期再见。


我不入地狱谁入地狱。

欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:
程序员写书

喜欢宠物的朋友可以关注:【电巴克宠物Pets】
电巴克宠物

一起学习,一起进步。

-------------本文结束感谢您的阅读-------------