Чем предстоит заниматься
- Развитие направления Site Reliability Engineering — формирование стратегии, архитектурных подходов и стандартов надежности сервисов
- Улучшение процессов управления инцидентами, изменениями и проблемами, снижение MTTR и предотвращение повторных инцидентов
- Участие в аудите и реагировании на инциденты, связанных с безопасностью и стабильностью систем
- Оптимизация инфраструктуры под нагрузку и стоимость (capacity planning, cost management)
- Автоматизация инфраструктуры и операций (Infrastructure as Code, self-healing)
- Развитие единой системы мониторинга и логирования для всех ключевых сервисов, создание кастомных экспортеров
- Обеспечение стабильности, отказоустойчивости и масштабируемости продуктивных систем
- Внедрение тестирования устойчивости от сбоев (Chaos Engineering)
- Обеспечение резервного копирования, восстановления и непрерывности бизнес-процессов
- Автоматизация процессов надежности (SLO Dashboard, Error Budgets, Reliability Review)
- Управление командой: найм, планирование, приоритизация задач, развитие компетенций, организация графика дежурств
Наши ожидания от кандидата
- Опыт работы в роли SRE Lead/DevOps Lead/Tech Lead от 3 лет
- Знание Linux, контейнеризации (Docker, Kubernetes), систем балансировки и отказоустойчивости
- Опыт работы с системами CI/CD (GitLab CI, Jenkins)
- Навыки построения мониторинга и логирования (Prometheus, VictoriaMetrics, Grafana, ELK)
- Опыт автоматизациии и работы с инструментами IaC (Terraform, Ansible)
- Понимание принципов Observability, Reliability Engineering, High Availability, Performance Tuning
- Навыки работы с облачной платформой Yandex Cloud и собственными дата-центрами
- Опыт автоматизации процессов надежности (SLO Dashboard, Error Budgets, Reliability Review)
Что мы предлагаем взамен
- Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
- Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
- Полную удалёнку или гибрид на выбор, а также уютный ИТ-хаб в Москве, Санкт-Петербурге, Екатеринбурге и сезонный коворкинг в Сочи
- Сложные и интересные задачи, современный стек технологий
- Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
- Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни
- Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
- Доступ к бесплатным корпоративным библиотекам Alpina Digital, МИФ и бизнес-изданий
Как с нами связаться
По всем интересующим вопросам обращайтесь к сотруднику отдела по подбору персонала: Иванова Ирина Викторовна
iivanova5@alfabank.ruD: 905E: 214756