Интернет задумывался как глобальная сеть, в которой любой компьютер может связаться с любым другим компьютером. На практике всё давно работает немного иначе. Где-то провайдер режет определённые сервисы, где-то появляются ограничения на отдельные протоколы, где-то плохо работает международная маршрутизация, а иногда нужный ресурс оказывается недоступен просто потому, что находится за пределами привычного маршрута вашего трафика. В результате даже опытный инженер периодически сталкивается с ситуацией, когда нужная документация не открывается, очередной релиз на GitHub скачивается со скоростью почтового голубя, пакеты PyPi становятся недоступными, Telemost начинает заикаться в голосовых каналах, а какой-нибудь зарубежный сервис внезапно оказывается недоступен из-за особенностей маршрутизации или региональной политики доступа.
Тимлид в инфраструктуре: человек, которого подозревают в безделье, пока не падает прод
Одной из причин, почему роль инфраструктурного тимлида регулярно становится объектом шуток внутри технических команд, является различие в природе результатов труда. Работа инженера предельно осязаема. Если DevOps-инженер автоматизировал разворачивание окружений через Terraform, результат можно увидеть в репозитории, протестировать и использовать. Если специалист по эксплуатации внедрил систему наблюдаемости, то через несколько часов в Grafana появляются новые панели мониторинга, а в Alertmanager - уведомления о сбоях. Если команда внедрила GitOps-подход и перевела развёртывание сервисов под управление Argo CD, это отражается на скорости доставки изменений и снижении количества ошибок при релизах. Результаты инженерной работы фиксируются в коде, конфигурациях, метриках и работающих сервисах. Они измеримы, воспроизводимы и заметны окружающим.