Сервис балансировки нагрузки (автопереключения потоков) на несколько Hadoop кластеров, включая модели сервис георезервирования и аварийного переключения Hadoop кластера, сервис бекапирования Hadoop кластера через снепшоты, прогнозирование Capacity, AI-агенты по направлению сопровождение и надежность
Обязанности
• поддержка и развитие текущего функционала;
• анализ и исправление инцидентов и багов в продакшн-среде;
• проектирование и реализация нового функционала, включая интеграцию с AI-агентом;
• участие в код-ревью, рефакторинге и улучшении архитектуры приложений;
• взаимодействие со смежными командами для уточнения требований и интеграций;
• написание технической документации.
Обязательные требования
Опыт:
• опыт разработки на Java от 3-х лет;
• опыт полного цикла разработки: от проектирования и реализации до тестирования, развертывания и поддержки;
• опыт поиска и исправления сложных ошибок (troubleshooting), оптимизации производительности.
Глубокое знание Java:
• опыт разработки на Java 8+;
• понимание и практическое применение многопоточности (concurrency, java.util.concurrent);
• знание основных паттернов проектирования (GoF) и умение их грамотно применять;
• опыт с Spring Boot:
• уверенное владение фреймворком Spring Boot для создания RESTful API;
• знание ключевых концепций: Spring MVC, Spring Security, Spring Configuration, Actuator;
REST API:
• понимание принципов REST, опыт проектирования и реализации API;
• знание лучших практик (HTTP коды состояний, версионирование, документация
- Swagger/OpenAPI);
• архитектура высоконагруженных и отказоустойчивых систем:
• понимание принципов построения высокодоступных (High Availability) и масштабируемых приложений;
• знание стратегий кэширования (Redis, Hazelcast), работы с асинхронными сообщениями (Kafka, RabbitMQ);
• понимание circuit breaker паттерна;
• работа с данными и мониторинг:
o опыт работы с базами данных (реляционными и/или NoSQL) на уровне оптимизации запросов;
o омение работать с системами мониторинга (Prometheus, Grafana) и логирования (ELK Stack).
Личностные качества:
• самостоятельность и проактивность: способность разбираться в legacy-коде и сложной предметной области (YARN, Kerberos) с минимальным контролем;
• аналитический склад ума: умение анализировать требования, предлагать технически грамотные и надежные решения;
• ответственность: понимание, что разрабатываемый продукт является критически важным звеном в инфраструктуре, и его сбои напрямую влияют на бизнес-процессы;
• командность: готовность работать в команде, делиться знаниями, писать читаемый код и понятную документацию.
Будет плюсом
Hadoop / YARN Ecosystem:
• понимание архитектуры Hadoop и, в частности, YARN;
• опыт работы с YARN REST API или клиентскими библиотеками будет огромным плюсом.
Kerberos:
• знание основ аутентификации Kerberos;
• опыт настройки или интеграции Java-приложений с Kerberos (JAAS конфигурация).
Микросервисная архитектура:
• понимание принципов MSA, проблем межсервисного взаимодействия (синхронное/асинхронное);
• опыт работы с Docker, Kubernetes, сервис-меша (Istio).
AI / Machine Learning (перспективное направление):
• базовое понимание принципов машинного обучения и AI-агентов;
• интерес к теме и готовность развиваться в этом направлении. Опыт интеграции с ML-моделями (как REST клиент) будет серьезным преимуществом.