在讲airflow安装之前,我们先来了解下airflow的架构,这有助于我们去理解安装的步骤到底是干嘛的。
来看这篇文章:airflow架构

我讲的airflow是1.10.14版本的哈。
所以,如果我们搭建airflow是做大量的任务调度,那么就推荐元数据库使用mysql/postgresql,消息队列使用redis/rabbitmq。
我以mysql和rabbitmq为例来讲解安装airflow 1.10.14版本。
1.AIRFLOW_HOME环境变量
这个变量是我们在初始化的时候,airflow它要去哪里生成对应的airflow.cfg和webserver_config.py文件
airflow.cfg配置文件很重要,配置了我们需要用到的所有组件信息,还有airflow自身的一些配置参数。
我们一般在用户根目录下的.bash_profile中添加该环境变量,这样在用户登录shell时,就会有对应的环境变量。
1 | vim ~/.bash_profile |
记住,在每台机器上都有执行。
2.安装
1 | pip install apache-airflow==1.10.14 |
记住,在每台机器上都要执行。
3.生成配置文件
1 | airflow initdb |

4.修改配置文件
因为前面我们已经设置了AIRFLOW_HOME环境变量,所以airflow.cfg配置文件就生成在变量所指定的位置,我们cd到那里去,然后编辑它:
1 | cd $AIRFLOW_HOME |
然后我们来介绍一下重点的配置参数,重要的我都说一遍:
1 | [core] |
5.启动
1 | airflow scheduler -D |
记住,上述三条命令,会在执行命令的当前目录生成相应的pid和log文件,下次启动如果还在这个目录下,记住清理掉pid文件,不然会报文件已经存在异常。
好了,就到这里,airflow.cfg配置就介绍到这里,都是平时调整比较多的参数。
下期带你们看跟airflow相关的元数据表。
吾之初心,永世不忘。
要做一个有良心的人。
欢迎关注我的微信公众号,比较喜欢分享知识,也喜欢宠物,所以做了这2个公众号:
喜欢宠物的朋友可以关注:【电巴克宠物Pets】
一起学习,一起进步。
