Назад | Перейти на главную страницу

Terraform: как предотвратить появление экземпляра ASG ec2 до создания шлюза NAT

Использую 2 модуля. Один - это настраиваемый модуль VPC, а другой - модуль для запуска экземпляра jenkins ec2.

Вы не можете использовать depends_on с модулями, но модуль Jenkins полагается на определенные выходные данные модуля VPC, например ...

  jenkins_elb_subnets_ids                 = ["${module.vpc.public_subnets_ids[0]}", "${module.vpc.public_subnets_ids[1]}"]
  jenkins_instance_subnets_ids            = ["${module.vpc.private_subnets_ids[0]}", "${module.vpc.private_subnets_ids[1]}"]
  vpc_id                                  = "${module.vpc.vpc_id}"
  vpc_cidr                                = "${var.vpc_cidr}"

Это по-прежнему не препятствует запуску экземпляра jenkins Ec2 еще до создания шлюзов NAT.

�[0m�[1mmodule.jenkins.aws_launch_configuration.jenkins_lc: Creation complete after 5s (ID: devops-jenkins-lc-20180309131935169800000002)�[0m�[0m
�[0m�[1mmodule.jenkins.aws_autoscaling_group.jenkins_asg: Creating...�[0m
  arn:                            "" => "<computed>"
  default_cooldown:               "" => "<computed>"
  desired_capacity:               "" => "1"
  force_delete:                   "" => "false"
  health_check_grace_period:      "" => "300"
  health_check_type:              "" => "EC2"
  launch_configuration:           "" => "devops-jenkins-lc-20180309131935169800000002"
  load_balancers.#:               "" => "1"
  load_balancers.2235174564:      "" => "devops-jenkins-elb"
  max_size:                       "" => "1"
  metrics_granularity:            "" => "1Minute"
  min_size:                       "" => "1"
  name:                           "" => "devops-jenkins-lc-20180309131935169800000002"
  protect_from_scale_in:          "" => "false"
  tags.#:                         "" => "4"
  tags.0.%:                       "" => "3"
  tags.0.key:                     "" => "Name"
  tags.0.propagate_at_launch:     "" => "1"
  tags.0.value:                   "" => "devops-jenkins"
  tags.1.%:                       "" => "3"
  tags.1.key:                     "" => "BackupDisable"
  tags.1.propagate_at_launch:     "" => "1"
  tags.1.value:                   "" => "No"
  tags.2.%:                       "" => "3"
  tags.2.key:                     "" => "Environment"
  tags.2.propagate_at_launch:     "" => "1"
  tags.2.value:                   "" => "dev"
  tags.3.%:                       "" => "3"
  tags.3.key:                     "" => "AppComponent"
  tags.3.propagate_at_launch:     "" => "1"
  tags.3.value:                   "" => "Jenkins-master"
  target_group_arns.#:            "" => "<computed>"
  vpc_zone_identifier.#:          "" => "2"
  vpc_zone_identifier.3355635847: "" => "subnet-4f13e705"
  vpc_zone_identifier.3554579391: "" => "subnet-8e92b2d3"
  wait_for_capacity_timeout:      "" => "0"�[0m
�[0m�[1mmodule.jenkins.aws_autoscaling_group.jenkins_asg: Creation complete after 1s (ID: devops-jenkins-lc-20180309131935169800000002)�[0m�[0m
�[0m�[1mmodule.vpc.aws_vpn_gateway.transit_vgw: Still creating... (10s elapsed)�[0m�[0m
�[0m�[1mmodule.vpc.aws_route53_zone.main: Still creating... (10s elapsed)�[0m�[0m
�[0m�[1mmodule.vpc.aws_nat_gateway.private_nat_gw.1: Still creating... (10s elapsed)�[0m�[0m
�[0m�[1mmodule.vpc.aws_nat_gateway.private_nat_gw.0: Still creating... (10s elapsed)�[0m�[0m

Это приводит к тому, что Дженкинс не может правильно подняться.

Cannot find a valid baseurl for repo: amzn-main/latest
Could not retrieve mirrorlist http://repo.us-east-1.amazonaws.com/latest/main/mirror.list error was
12: Timeout on http://repo.us-east-1.amazonaws.com/latest/main/mirror.list: (28, 'Connection timed out after 5001 milliseconds')
Mar 09 13:19:55 cloud-init[2581]: util.py[WARNING]: Failed to install packages: ['git', 'aws-cfn-bootstrap', 'docker', 'jq-libs', 'jq', 'perl-Test-Simple.noarch', 'perl-YAML.noarch', 'gcc', 'amazon-ssm-agent.rpm', 'perl-Switch', 'perl-DateTime', 'perl-Sys-Syslog', 'perl-LWP-Protocol-https', 'perl-Test-Simple.noarch', 'perl-YAML.noarch']

Теперь у Terraform есть «официальный» модуль VPC от команды AWS. Я просмотрел его код, и, похоже, он ничего не делает, чтобы смягчить это? Но с 90k развертываний и всего 36 проблем ... не похоже, что это проблема у них. Я не тестировал его сам, потому что его использование не вариант, но это может означать, что проблема связана с моими модулями.

Изменить: это не сработало @ sysadmin1138 Я пробовал это ...

resource "aws_autoscaling_group" "jenkins_asg" {
  depends_on                = ["module.vpc.aws_nat_gateway.private_nat_gw.1", "module.vpc.aws_nat_gateway.private_nat_gw.0"]

и получил эту ошибку

Initializing the backend...

Successfully configured the backend "s3"! Terraform will automatically
use this backend unless the backend configuration changes.

Error: aws_autoscaling_group.jenkins_asg: resource depends on non-existent module 'vpc.aws_nat_gateway.private_nat_gw.1'



Error: aws_autoscaling_group.jenkins_asg: resource depends on non-existent module 'vpc.aws_nat_gateway.private_nat_gw.0'

Edit2:

Я попытался добавить вывод public_ip из NAT Gatway в модуль VPC в качестве ввода для модуля Jenkins. Надеясь, что он будет поддерживать модуль Jenkins до тех пор, пока NAT-шлюз не будет готов. Это не сработало. Что я наблюдал с Terraform и модулями, так это то, что если вы где-то не используете переменную, например, в пользовательских данных Jenkins, тогда переменная полностью игнорируется. Недостаточно иметь его в качестве входа для модуля, он должен быть входом для ресурса в этом модуле. Побочный эффект заключается в том, что в качестве вычисляемого значения он будет каждый раз пытаться воссоздать ваш ресурс.

Спасибо jbardin https://github.com/hashicorp/terraform/issues/14056

Чтобы исправить это, вам нужно использовать вывод вашего модуля VPC. Вы можете использовать aws_nat_gateway атрибут public_ip но поскольку у меня был маршрут, созданный после aws_nat_gateway Я использовал это вместо этого. Затем я создал фиктивную переменную и фиктивный ресурс в моем модуле Jenkins.

resource "null_resource" "dummy" {
  provisioner "local-exec" {
    command = "echo ${var.dummy}"
  }
}

Убедитесь, что вы назначили это dummy к выбранному вами выходу. Также это должна быть строка. dummy = "${join(",", module.vpc.private_nat_gw_routes)}"

После этого я использовал depends_on = ["null_resource.dummy"] на моем ресурсе ASG. Это заставляло этот ресурс ждать, пока не будут созданы маршруты NAT Gateway +, но не имеет неприятного побочного эффекта в виде повторного создания ресурса каждый раз.

No changes. Infrastructure is up-to-date.

This means that Terraform did not detect any differences between your
configuration and real physical resources that exist. As a result, no
actions need to be performed

Возможно, вы не сможете использовать depends_on на модуле, но я почти уверен, что вы все еще можете использовать его на фактическом ресурсе шлюза NAT, который создает модуль. В зависимости от вашей версии terraform получить его может быть так же просто, как использовать terraform state list и копаться в нем или вручную искать его в файле состояния терраформ.


Однако кажется этой поддержки еще нет в серии 11.x. В будущих версиях Terraform возможно, поскольку член команды HashiCorp предлагает способ предоставить здесь то, что явно необходимо.

Суть проблемы в том, что depends_on выполняется на этапе компиляции перед развертыванием модулей в ресурсы, что делает их непригодными для таргетинга с этим параметром.