Чем предстоит заниматься
Разрабатывать средства мониторинга и инцидент-менеджмента для продукта
Определяет и внедряет SLO/SLA/SLI для сервисов продукта
Реагирует на инциденты, проводит постмортемы и анализирует причины сбоев (root cause analysis)
Разрабатывает и контролирует метрики надежности, отказоустойчивости и доступности продукта
Разрабатывает средства мониторинга и аллертинга (VictoriaMetrics, Prometheus, Grafana)
Оптимизировать производительность и доступность продукта
Анализирует и оптимизирует нагрузку, снижает latencies сервисов
Настраивает горизонтальное и вертикальное масштабирование сервисов
Обеспечивает отказоустойчивость через репликацию, балансировку нагрузки, улучшение архитектуры продукта
Взаимодействовать с разработчиками и внедрять DevOps/SRE-практики
Помощь в настройке логирования и трассировки (ELK, Loki, OpenTelemetry)
Улучшение процессов разработки через внедрение best practices SRE
Обучение разработчиков работе с инфраструктурой и инструментами SRE
Оптимизировать процесс развертывания приложений
Внедряет новые стратегии развёртывания программного обеспечения (Blue/Green deployemnt, Canary deployment)
Оптимизирует CI/CD процессы, устраняет toil-задачы
Оптимизирует использование ресурсов и on-prem решений
Наши ожидания от кандидата
Глубокое понимание принципов SRE: SLO/SLA/SLI, инцидент-менеджмент, проблем-менеджмент, root cause analysis, postmortem-процессы, устранение toil
Опыт стабилизации и оптимизации микросервисных систем, развернутых в Kubernetes, а также опыт с инструментами сервис-мешами (например, Istio) для микросервисной архитектуры
Опыт коммерческой разработки на Java с использованием Spring, Spring Boot в сегменте крупного бизнеса
Уверенное владение инструментами мониторинга и логирования: Zabbix, Prometheus, Grafana, ELK, Loki, OpenTelemetry и пр.
Опыт внедрения и работы с SRE-инструментами: Jaeger, AppDynamics\NewRelic\Gmonit, Sentry, линтерами и др.
Навыки ведения проектов и взаимодействия с командами разработки, безопасности, продактами и бизнесом
Знание принципов информационной безопасности и управления доступами (IAM, RBAC, secrets management)
Навыки планирования бюджета, подготовки презентаций, ведения отчетных совещаний
Что мы предлагаем взамен
Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
Полную удалёнку или гибрид на выбор, а также уютный ИТ-хаб в Москве, Санкт-Петербурге, Екатеринбурге и сезонный коворкинг в Сочи
Сложные и интересные задачи, современный стек технологий
Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни
Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины
Как с нами связаться
По всем интересующим вопросам обращайтесь к сотруднику отдела по подбору персонала: Кузеева Алена Александровна
amoroz3@alfabank.ruD: 852E: 204167