Вакансия: Data Scientist, NLP, Ozon Банк
Описание вакансии
Ozon Банк это подразделение Ozon, где тесно переплетается всё, что связано с финансами и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Главное для нас удобство пользователей. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату.
Сейчас мы ищем middle Data Scientist в команду, которая занимается всеми NLP задачами в компании, в том числе: RAG для различных бизнес-направлений, чат-бот поддержки, speech-to-text, OCR с использованием LLM, задачи кодогенерации а также любые другие запросы от бизнеса, связанные с текстовыми данными. Эти модели напрямую влияют на доходность компании и определяют итоговую прибыль кредитных продуктов. Мы развиваем мощности нашего ЦОД для прикладных и исследовательских задач и самостоятельно прорабатываем и запускаем решения в прод.
Наш стек:
- БД: Vertica, PostgreSQL, Clickhouse
- Разметка: Labelstudio
- Обучение моделей: Pytorch + Accelerate
- Деплой: Tritonserver в k8s
- RAG: QDrant, Elasticsearch, Langchain
Вам предстоит:
- Активно участвовать во всех проектах команды
- Главный фокус - задачи для чат-бота поддержки. На первых этапах использование моделей для помощи операторам (суммаризация, парафраз, RAG), c последующей их полной заменой LLM. Также развиваем STT и TTS направления для обработки звонков пользователей
Ждем от вас:
- Умение внятно излагать мысли и представлять результаты своей работы
- Уверенный Python, умение разбираться в чужом коде
- Понимание основных принципов, алгоритмов и метрик классического ML
- NLP: опыт решения бизнес-задач с использованием классических и трансформерных моделей. Умение понимать, где какую модель лучше использовать и почему
- LLM: понимание принципов работы, а также ограничений в применении тех или иных моделей. Приветствуется наличие навыков prompt engineering а, а также использования structured outputs и function calling а у моделей. Потенциально будем разворачивать агентские системы будет плюсом опыт общения с соответствующими фреймворками, например, smolagents
- Деплой: опыт деплоя трансформерных моделей с использованием какого-либо фреймворка для деплоя (vllm, sglang), понимание того, как работает в таких фрейворках обработка запросов и как ее можно ускорить. Будет плюсом опыт с tritonserver и tensorrt-LLM