Привет! Меня зовут Сергей Антропов.
Я занимаюсь инфраструктурой, платформами, автоматизацией и всем тем странным набором магии, который обычно называют DevOps, SRE, платформенной архитектурой и инженерией, или
«Серега, у нас прод лежит! Помоги! Спасииии!!!».
Более шестнадцати лет я работаю с серверами, сетями, виртуализацией, контейнерами, Kubernetes, Terraform, Ansible, CI/CD и прочими способами усложнить себе жизнь ради того, чтобы потом сделать её проще для остальных.
— Алоха. Меня зовут Сергей, и я DevOps инженер.
— Здравствуй, Сергей…
— И я уже три дня не деплоил в пятницу вечером.
— Отлично держишься! Проходи, присаживайся. Сегодня обсуждаем Kubernetes, CI/CD и почему “это временное решение” живет в проде уже шестой год.
Сейчас я работаю в финтехе и занимаюсь проектированием и развитием инфраструктурных платформ для больших данных.
Если говорить проще — строю системы, которые должны:
- переваривать огромные объемы информации,
- выдерживать высокие нагрузки,
- масштабироваться без боли,
- переживать отказ половины инфраструктуры,
- и желательно не будить инженеров в три часа ночи.
Хотя последний пункт индустрия пока побеждает не очень стабильно.
У нас много инфраструктуры, много автоматизации, много распределённых систем, много Kubernetes, очередей, хранилищ, мониторинга и вечной инженерной философии:
«Сейчас аккуратно оптимизируем один маленький сервис…»
А через полгода:
- тысячи микросервисов,
- десятки кластеров,
- геораспределение,
- Hadoop,
- CEPH,
- Kafka,
- Livy,
- Spark,
- Terraform,
- и обсуждение того, почему внезапно закончились ресурсы в дата-центре.
Мне особенно интересны:
- архитектура отказоустойчивых платформ,
- большие распределённые системы,
- Kubernetes,
- автоматизация,
- DevSecOps,
- наблюдаемость,
- безопасность инфраструктуры,
- и построение платформ, которые не держатся на “магии одного очень уставшего инженера”.
До финтеха я работал в компании, которая занималась защитой детей от вредоносного контента и цифровой грязи интернета. Это был очень интересный и местами крайне непростой опыт - много инфраструктуры, много данных, высокая ответственность и постоянное ощущение, что ты строишь не просто очередной сервис, а действительно полезную систему.
Именно там я окончательно понял две важные вещи:
- любая инфраструктура рано или поздно начинает жить собственной жизнью;
- если всё работает слишком хорошо - либо мониторинг сломался, либо скоро будет очень интересный инцидент.
В целом за годы работы я успел пройти путь от классического системного администрирования и разработки на Perl до проектирования сложных платформ и распределённых инфраструктур.
Так что да…
Eсли где-то ночью грустит Kubernetes - есть шанс, что я уже видел что-то похожее 😄
Люблю строить системы, которые:
- переживают релизы,
- не падают от одного чиха,
- масштабируются без шаманских плясок,
- и не требуют героизма дежурного инженера в три часа ночи.
Хотя, будем честны…
Без ночных логов и поиска “почему оно работало вчера” DevOps был бы слишком скучной профессией.
Немного не про инфраструктуру
Помимо инфраструктуры, я увлекаюсь всеми видами досок:
сноуборд, серф, вейкборд и прочие способы добровольно лететь лицом в воду, снег или асфальт.
Еще я фотографирую.
Иногда людей.
Иногда природу.
Иногда уставших инженеров после шестого подряд инцидента.
Фотография для меня - это хороший способ напомнить себе, что мир состоит не только из YAML-файлов, графиков Prometheus и обсуждений “почему опять не работает DNS”.
Хотя DNS, конечно, ломает жизни куда чаще, чем плохая композиция кадра.
О содержании блога
Этот блог - моя инженерная записная книжка.
Место, куда я складываю опыт, грабли, инструкции, заметки, расследования аварий и прочие артефакты профессиональной деформации.
Большая часть материалов - это подробные HOWTO и пошаговые разборы:
- инфраструктуры,
- Kubernetes,
- Linux,
- сетей,
- автоматизации,
- мониторинга,
- безопасности,
- DevOps практик,
- отказоустойчивости,
- и всего того, что обычно внезапно «само перестало работать».
Я стараюсь писать так, как хотел бы читать сам:
без маркетинговой магии,
без “революционных платформ нового поколения”,
без советов уровня “просто внедрите DevOps”.
Только практика, опыт, реальные проблемы, реальные ошибки и иногда легкая инженерная истерика между строк.
Потому что любая инфраструктура рано или поздно приходит к одному и тому же состоянию:
«Кто вообще это писал?!»
А потом выясняется, что писал ты сам три года назад.
Об опыте работы
Я работал с:
- дата-центрами,
- облаками,
- Kubernetes-кластерами,
- большими объемами данных,
- CI/CD,
- платформенной инженерией,
- мониторингом,
- безопасностью,
- автоматизацией,
- и командами, которые сначала говорят: «Да тут маленький сервис», а через полгода у тебя уже двадцать микросервисов, очередь сообщений, GPU, Kafka и психологическая травма.
Мне интересны:
- сложные инфраструктурные задачи,
- высоконагруженные системы,
- платформы,
- архитектура,
- отказоустойчивость,
- DevSecOps,
- SRE,
- автоматизация всего, что можно автоматизировать,
- и попытки объяснить бизнесу, почему “один Вася-админ” больше не справляется.
Если хотите предложить что-то интересное - пишите: work@antropoff.ru
Условия использования
Все материалы этого уютного инженерного бложека распространяются по лицензии Creative Commons - «Attribution-ShareAlike» («Атрибуция - На тех же условиях») 4.0 Всемирная - CC BY-SA 4.0.
Вы можете:
- копировать,
- распространять,
- адаптировать,
- изменять,
- использовать материалы в коммерческих и некоммерческих целях.
Проще говоря - берите, пользуйтесь, развивайте.
Только не забывайте указывать источник.
Отказ от ответственности
Все товарные знаки принадлежат их владельцам.
Все совпадения случайны.
Все мнения - мои собственные, честные и никем не купленные.
Материалы публикуются по принципу:
«КАК ЕСТЬ» (AS IS).
Это означает:
если после выполнения команды из статьи у вас:
- упал прод,
- сломался Kubernetes,
- исчезла сеть,
- перестал отвечать Ceph,
- или сервер внезапно решил уйти в отпуск
то, пожалуйста, сначала проверьте:
- что вы вообще запускали;
- на каком сервере;
- и почему делали это в пятницу вечером.
Адекватно оценивайте свои возможности.
И помните главное правило инфраструктурного инженера:
Нет ничего более постоянного, чем временное решение, которое “пока просто работает”.
Кстати, вот мой сайт - там обо мне подробнее: https://antropoff.ru

