Управление разношерстной инфраструктурной командой - или как не сойти с ума между DevOps, SRE, SysOps, DBA и сетевиками

Есть одна вещь, о которой редко говорят на конференциях. Не Kubernetes. Не CI/CD. Не “переход в cloud-native”.
А то, что самое сложное в инфраструктуре - это вообще не технологии.

Самое сложное - люди.

Потому что одно дело - управлять командой, где все одинаковые. И совсем другое - когда у тебя:

DevOps-инженер живет в GitOps и Terraform.
Системный администратор до сих пор помнит, как восстанавливать RAID в 3 ночи через mdadm.
Сетевой инженер смотрит на Kubernetes как на “эту вашу магию поверх TCP”.
DBA физически чувствует боль, когда кто-то делает SELECT *.
А молодой джун после курса “Стань DevOps за 24 часа” предлагает “давайте все перепишем на AI-агентов”.

И вот это все - одна команда.

И самое смешное? Оно может работать. Очень хорошо работать.

Но только если перестать строить “идеальную структуру” и начать строить инженерную среду.

Главная ошибка руководителя инфраструктуры

Очень многие пытаются управлять инфраструктурной командой как обычной разработкой.

Типа:

одинаковые процессы,
одинаковые KPI,
одинаковый подход,
одинаковые митинги,
одинаковые ожидания.

А потом начинается цирк.

Потому что DBA и SRE думают по-разному. Сетевик и Kubernetes-инженер - тоже. А админ старой школы вообще живет в мире “если работает - не трогай”.

И это нормально.

Инфраструктура - это не “одна профессия”.
Это набор очень разных инженерных культур.

Инфраструктурщик - это не должность. Это психотип и половая ориентация

Это особенно видно в больших командах.

У тебя может быть:

человек, который обожает автоматизацию;
человек, который ненавидит автоматизацию после одного “terraform apply” в пятницу;
человек, который все документирует;
и человек, который документирует только собственные страдания в Telegram.

И если пытаться всех сделать одинаковыми - команда развалится.

Нормальный руководитель инфраструктуры понимает:

Не нужно делать одинаковых инженеров. Нужно сделать так, чтобы разные инженеры усиливали друг друга.

Самая токсичная фраза в инфраструктуре

“Ну ты тупой что ли? Сам не можешь разобраться?”

После этой фразы:

джуны перестают спрашивать;
мидлы начинают молчать;
сеньоры начинают скрывать проблемы;
команда начинает деградировать.

Потому что инфраструктура - слишком огромная.

Невозможно одинаково хорошо знать:

BGP,
PostgreSQL,
Linux kernel,
Ceph,
Kubernetes,
Vault,
Cisco,
Proxmox,
DNS,
backup,
GPU passthrough,
и еще почему production упал после “небольшого обновления”.

Нормальная инфраструктурная команда строится не вокруг “самых умных”.

Она строится вокруг:

обмена знаниями,
доверия,
и отсутствия страха задавать тупые вопросы.

Хотя честно - самые опасные вопросы обычно задают как раз не джуны, а уверенные сеньоры 😄

Разные поколения - это не проблема

Это вообще отдельный квест.

У тебя одновременно могут работать:

человек, который администрировал FreeBSD еще до появления YouTube;
инженер, выросший на Docker;
и молодой DevOps, который считает SSH “legacy technology”.

И вот тут начинается магия.

Старшие инженеры:

знают, как система ведет себя в авариях;
умеют мыслить фундаментально;
помнят времена без Kubernetes и “managed services”.

Молодые:

быстрее адаптируются;
лучше автоматизируют;
легче изучают новые инструменты;
меньше боятся экспериментировать.

И если команда здорова - они начинают учить друг друга.

Если команда токсична - начинается война:

“старики ничего не понимают”,
“молодые ничего не знают”.

После чего production обычно выбирает сторону хаоса.

Команда - это не набор тасок в Jira

Вот тут многие руководители внезапно открывают страшную тайну:

Люди устают. Даже самые сильные инженеры. Особенно инфраструктурщики.

Потому что:

аварии;
ночные инциденты;
ответственность;
постоянный стресс;
контекст-переключение;
десятки технологий одновременно.

И если команда постоянно живет в режиме:

“давайте еще чуть-чуть потерпим”

то потом начинается:

выгорание,
токсичность,
безразличие,
“делаю только по тикету”,
массовые увольнения.

А инфраструктурная экспертиза восстанавливается годами.

Подбор людей - это не “найти самого умного”

Очень часто лучший инженер в команде - не тот, кто знает больше всех.

А тот:

кто умеет объяснять;
не токсичен;
не ломает чужую самооценку;
умеет работать в кризис;
спокойно признает ошибки;
не устраивает культ собственной гениальности.

Потому что инфраструктура - командная игра.

Один “гениальный токсик” способен уничтожить атмосферу всей команды быстрее, чем случайный rm -rf /.

Хотя по последствиям иногда очень похоже.

Ритм работы важнее героизма

Это вообще штука, которую многие понимают слишком поздно.

Инфраструктурная команда не должна жить только на:

дедлайнах,
авариях,
срочности,
“сделать вчера”.

Потому что инженерный мозг не может бесконечно работать в panic mode.

Нужен ритм.

Нормальный ритм команды выглядит примерно так:

есть понятные процессы;
есть предсказуемость;
есть время на документацию;
есть время на изучение;
есть время на техдолг;
есть право спокойно подумать.

Да, именно подумать.

Потому что хороший инженер часто выглядит как человек, который “ничего не делает”, а потом за 15 минут решает проблему, которую без него ковыряли два дня.

Руководитель инфраструктуры - это не “главный по серверам”

На самом деле это:

переводчик между людьми;
стабилизатор хаоса;
медиатор между командами;
психолог аварийных ситуаций;
человек, который принимает удар первым.

И если честно - большая часть работы вообще не про технологии.

Она про:

доверие,
атмосферу,
коммуникацию,
зрелость,
спокойствие.

Потому что в момент серьезного инцидента команда копирует не знания руководителя.

Она копирует его состояние.

Если руководитель:

орет,
обвиняет,
паникует,
ищет виноватых -

команда развалится мгновенно.

Если руководитель:

спокойно собирает информацию,
распределяет задачи,
не устраивает публичные казни,
помогает людям думать -

даже тяжелые аварии переживаются сильно проще.

Самое важное правило инфраструктуры

Все мы инженеры.

Не “девопсы против админов”.
Не “сетевики против кубера”.
Не “старые против молодых”.

Все мы просто пытаемся:

чтобы системы работали;
чтобы данные не потерялись;
чтобы ночью никто не проснулся от алерта “Ceph HEALTH_ERR”;
и чтобы очередной “маленький фикс” не положил production.

Инфраструктура слишком сложна, чтобы тащить ее в одиночку.

Поэтому сильная команда строится не вокруг технологий.

А вокруг уважения.

Финал, который понимает любой инфраструктурщик

Рано или поздно любая инфраструктурная команда проходит одинаковый путь.

Сначала все спорят:

кто умнее,
чей стек лучше,
чей подход “правильнее”.

А потом приходит production-инцидент в 4 утра.

И внезапно:

DBA помогает сетевику,
DevOps чинит мониторинг,
админ лезет в storage,
а самый молодой инженер приносит ту самую идею, которая всех спасает.

И в этот момент все очень быстро вспоминают простую вещь:

Мы не конкуренты!
Мы одна инженерная команда.

А остальное - уже детали.