Вакансия SRE в городе Москва
Код вакансии: 6154363b0c6c6100113d1292
от 350 000 RUB в месяц
Откликнуться

    SRE

    В команду нового сайта и нового движка поиска/каталога компании - лидера на рынке бытовой техники мы ищем инженеров, пришедших (или переходящих) в SRE как из разработки (SRE/SWE), так и из администрирования (SRE/SE).


    От тебя нам важно:  

    · Опыт разработки/сопровождения микросервисных, высоконагруженных, отказоустойчивых асинхронных многокомпонентных веб-, frontend-, backend- приложений; 

    · Знание и понимание SRE подходов;  · Kubernetes - опыт развёртывания и эксплуатации, как в on-prem так и в managed вариантах (облака AWS / YC / MCS);  

    · Опыт работы на позиции ведущего разработчика, ведущего инженера по автоматизации (DevOps), SRE от 3-х лет;  · Хороший опыт работы со следующими инструментами (не обязательно со всеми!): Prometheus, Grafana, ELK, Jaeger, Loki, Zabbix, AppDynamics, Nginx, OpenResty, HAProxy, Envoy, keepalived, PostgreSQL, ElasticSearch, Redis, Couchbase, MongoDB, Kafka, Git, Gitlab CI, Jira, Confluence, Ansible, Terraform, Thanos, VictoriaMetrics, Helm, Harbor, SonarQube, Hashicorp Vault (почти всё из этого у нас так или иначе используется); 

    · Опыт в системах observability; 

    · Знания сетевых протоколов, понимание маршрутизации и фильтрации трафика;  

    ·Высшее образование (техническое).


    Чем предстоит заниматься:  

    · Делать так что бы наши клиенты получали высокий уровень сервиса, при этом обеспечивать продуктовые команды возможностью выводить новый функционал сколь угодно часто и в любое время суток (и даже в высокий сезон); 

    · Активным и проактивным поиском возможных проблем в архитектуре систем, их устранением, включая консультации на стадии дизайна, разработки, а так же планирование необходимых для работы сервиса ресурсов и т. д.;  

    · Используя практики SRE, управлять количеством нештатных ситуаций в проде таким образом, что бы их количество не приводило к превышению error budget;  

    · Автоматизацией и оптимизацией процессов, связанных с обслуживанием систем, усилением их отказоустойчивости, масштабированием - снижать операционную нагрузку на команду;  

    · Работой с инцидентами (анализ возникших инцидентов, поиск вариантов их решения, устранение последствий, расследование причин возникновения инцидентов, предотвращение инцидентов и их последствий);  

    · Диагностикой и решением проблем, включая кросс-системные;  

    · Развитием системы мониторинга для активного и проактивного подхода к сопровождению сервисов; 

    · Настраивать мониторинг не только инфрастуктуры, приложений и их производительности, но и бизнес показателей, разрабатывать дашборды, на которых будет видна их корреляция и baseline;  

    · Участвовать в развитии системы сквозного трейсинга;  

    · Настраивать получение и агрегацию метрик от всех слоёв приложений, начиная от браузера и заканчивая низкоуровневыми инфраструктурными компонентами;  

    · Участвовать в определении SLI/SLO/SLA;  

    · Быть частью продуктовых команд, находиться рядом с продуктами и фичами от момента их планирования и дизайна, до разработки, тестирования, вывода в прод и обновления;  

    · Участвовать в on-call дежурствах;  

    · Разрабатывать тулинг, направленный на автоматизацию нашей работы и на решение нестандартных задач (экспортеры, операторы);  

    · Формировать реестр рисков доступности и отказоустойчивости, участвовать в оценке таких рисков, планировать и реализовывать мероприятия по их предотвращению;  

    · Участвовать в выстраивании практик хаос-инжиниринга, в мероприятиях по регулярной проверке средств резервирования.

    Что мы предлагаем:  

    · Возможность работать удалённо (из любого города и региона);  

    · Нетривиальные задачи и real highload;  

    · Большая и сильная команда профессионалов (которые будут рады как поделиться опытом с тобой, так и перенять опыт у тебя), мы нацелены на результат;  

    · В проектах нет legacy, вся разработка ведётся на современном стэке;  

    · Ещё у нас есть отдельная команда дежурных инженеров с присутствием 24x7 - наши глаза и руки, которые в случае проблем прода, требующих вызова on-call SRE, уже смогут дать контекст к моменту нашего подключения;  · Конкурентоспособная з/п;  

    · При необходимости предоставляем оборудование для работы; 

    · Официальное оформление по ТК РФ, белая заработная плата;  

    · ДМС после испытательного срока (3 месяца);  

    · Развитая корпоративная культура.

    ANCOR Corporate Websites
    Загрузка...
    Хочу в ANCOR!
    Загрузка...
    Заявка на услугу
    Загрузка...
    Logo ANCOR
    Загрузка...
    Logo ANCOR
    Загрузка...
    Logo ANCOR
    Загрузка...