Обязанности:
– Формирование долгосрочной стратегии платформы (Hardware, LLM/ML-платформа, стандарты, SLO/SLA, Cloud). Локальная инфра 8× NVIDIA H200 и Yandex Cloud;
– Строить с нуля MLOps-платформу, ML-конвейеры, DWH, Data pipelines;
– Кастомизация и развертывание LLM-моделей на локальных GPU;
– Проектировать и эксплуатировать масштабируемые LLM/ML-пайплайны и data-workflows. On-prem инфраструктуру. Prod, R&D, DR контуры;
– Деплоить, мониторить и оптимизировать сервисы LLM/ML-инференса (задержка, пропускная способность, autoscaling, стоимость);
– Строить и поддерживать data-инфраструктуру: ETL/ELT, batch/stream-обработку, слои хранения (SQL/NoSQL, object storage, data lake/warehouse). Выстраивать интеграции разных источников данных с низкой задержкой;
– End-to-end производительность: профилирование узких мест по данным и инференсу, поставка оптимизаций;
– Укреплять надёжность и безопасность: observability/наблюдаемость, алерты, доступы, аудит-трейлы, DR;
– Запускать сервисы с нуля и доводить до продакшена.
Требования:
– 5+ лет в MLOps/Devops;
– 3+ лет опыта работы с LLM/ML в production (обязательно).
– Сильный Python и SQL.
– Практика GPU-инференса: профилирование, квантование, ONNX/TensorRT, Nvidia Triton.
– Опыт с LLM/RAG/мультиагентными фреймворками.
– Опыт с контейнерами и CI/CD. Понимание оркестрации, сетей и on-prem-хранилищ.
– Kafka, ClickHouse, Postgres, Airflow, векторные БД, k8s, DataSphere, LangChain, Kubeflow, Mlflow, Feast.
– Будет преимуществом: опыт с RU-fintech данными с биржи MOEX, новости Интерфакс, Cbonds, Market data, Tradingview.
Условия:
–
Комфортный офис в Москва Сити (гибридный формат работы);
– ДМС с первого дня работы, включающая стоматологию, страхование жизни и возможность подключения родственников;
– Сервис корпоративных скидок Best Benefit;
– Конкурентный уровень заработной платы.