В команду NewDataPlatform банка ТОП 3 ищем инженера по инфраструктуре.
На данный момент запущены в промышленную эксплуатацию ключевые компоненты платформы:
•K8s
•ПАК Скала МБД.Г (железные сервера российского вендора)
•ADB (GreenPlum) и ADQM(ClickHouse)
•Apache SuperSet
•Apache Kafka
•Apache NiFi
•Apache Airflow
•Apache spark
•MinIO
•DBT
•Prometeus, FileBit, Grafana, PostgreSQL
•И другие
Идет этап масштабирования и георезервирования инфраструктуры. В проработке находятся задачи по миграции данных и бизнес-процессов. По каждому из компонентов сформирована L3 линия поддержки.
Выстраиваем процесс по работе с инцидентами и формируем L2 команду для эксплуатации компонентов платформы. Данная команда должна хорошо ориентироваться во всем стеке технологий и уметь решать типовые инциденты. Будет принимать участие в решении сложных обращений, заниматься сбором требований для решения часто повторяющихся инцидентов своими силами или с L3.
Обязанности
• Мониторинг состояния всех компонентов;
• Разработка собственных дашбордов и метрик;
• Анализ поступающих обращений по инцидентам компонентов (troubleshooting) Apache Airflow, Hadoop (S3, Hive), Spark, Superset, JupyteHUB, Grafana, БД PostgreSQL;
• Маршрутизация сложный обращений на 3-ю линию поддержки. Заведение задач по багам и доработкам в Jira;
• Консультация и помощь пользователям (аналитики, разработчики, дата-инженеры) в работе с инструментами платформы, выдача прав доступа к ним;
• Автоматизация рутины через пайплайны;
• Анализ, маршрутизация и коммуникация с системной инфраструктурой по предоставлению сетевого доступа между ВМ, проблемами с быстродействием виртуальных или железных серверов;
• Анализ, маршрутизация и коммуникация с командой администраторов Информационной безопасности связанных с сетью на уровне маршрутизации, фаерволла;
• Написание инструкций для пользователей по инструментам платформы в Confluence;
• Ведение и обновление Базы знаний (в Confluence) по обращениям.
Обязательные требования
Идеально если кандидат обладает базовыми знаниями в IT, есть опыт работы с Linux/ DBA, работал в поддержке и умеет общаться с пользователями,
А так же знаком со стеком технологий в платформе:
• SRE-принципов: automation, observability, toil reduction;
• DevOps-принципов: Collaboration, Automation, CI/CD, Feedback;
• Принципов администрирования СУБД/Linux/Железо: Availability, Integrity, Performance, Security.
Будет плюсом
• Навыки программирования на Python;
• Опыт работы с Git;
• Умение писать исчерпывающую, но «читабельную» техническую документацию;
• Навык ведения эффективной деловой переписки.