Data Scientist (на проект) (удаленная работа)
(вакансия в архиве)

24 апреля 2024

Уровень зарплаты:
от 300 000 до 300 000 руб.
Требуемый опыт работы:
Не указан

Вакансия: Data Scientist (на проект)

Описание вакансии

Outlines Tech это аккредитованная IT-компания. Мы разрабатываем ПО и проекты для корпораций, а также подбираем сотрудников высокого класса.

Среди клиентов банки из ТОП-5 России, ритейл, строительные и логистические компании. Официально трудоустраиваем в штат IT-специалистов для работы на долгосрочных проектах.

Сейчас мы в поиске одной из части нашей команды Data Scientist на проект по разработке LLM на платформе Ai-Run для бизнес-идей Инноваций.

Важно: короткий проект с возможностью пролонгации. Сроки проекта: с 22.04.2024 по 10.06.2024 включительно

Почему мы:

1) Outlines Tech аккредитованная IT-компания. Это значит, что мы подлежим всем вытекающим льготам.

2) Люди на первом месте не на словах, а на деле: отдел заботы курирует команду 24/7.

3) Помимо белого трудоустройства: ежегодная индексация зарплаты, 28 дней отпуска и 5 relax days (бесплатные отгулы). А ещё предоставляем медстраховку со стоматологией, технику, оплачиваем обучение и подписки.

4) Входим в рейтинг лучших работодателей России по версии Forbes и РБК.

5) Вкладываемся в образование: помогаем выступить на конференциях, написать статью в технический блог, выучить английский, вырасти в профессии и сменить стек.

6) Техническая команда состоит из прокаченных специалистов, многие из которых известны в мире IT. Мы обязательно поможем вам развит ься внутренними митингами, а если вы круче поможете нам.

7) У нас драйвовая и заботливая корпоративная культура. Переходите в наш Telegram-канал и убедитесь в этом: @outlines tech. Кстати, там коллеги публикуют лайфхаки по развитию в IT с заботой о себе.

Ваша зона ответственности:

  • Создание готовых приложений для отраслевых и персонализированных задач, разработка системных промптов, fine-tuning моделей, где это потребуется.

  • Обеспечение безопасности пользовательских данных в соответствии с требованиями ИБ

  • Внедрение инструментов для анализа и мониторинга эффективности использования Copilot внутри компании

  • Внедрение инструментария для бизнеса по разработке своих приложений на базе AI

  • Организация мониторинга и настройки алертов на уровне движков инференса моделей

  • Повышение качества ответов LLM

  • Разработка кода и тестов на python, участие в командной разработке, участие в код-ревью

  • Разработка архитектуры систем, использующих машинное обучение

  • Подготовка данных для моделирования (получение, очистка)

  • Расчет результатов АБ-тестов, дизайн АБ-тестов

  • Построение моделей машинного обучения

  • Разворачивание моделей и сервисов в контуре х5 (hadoop/k8s/airflow)

  • Написание запросов на SQL, оптимизация запросов (spark, в частности)

  • Предложение прокси-метрик и функций потерь, связанные с бизнес-метриками

  • Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных.

  • Техническая реализация data-science решений на продуктах департамента.

  • Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных.

  • Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.

Необходимые навыки:

  • Знание алгоритмов и структуры данных. Умение оценивать сложность алгоритмов
  • Понимание ML-алгоритмов, включая SOTA-методы, в своей области.
  • Построение моделей из стандартных компонентов. Понимание шагов жизненного цикла ML-разработки и их взаимодействие в проекте и разработка архитектуры для продукта.
  • Понимание, какие бизнес-метрики для модели нужно мониторить. Умение предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками. Возможность докатить простую модель в пилот имплементировать метод по статье встроить компонент в существующий пайплайн.
  • Знание менее распространенных методов МО (например: байесовские модели/PGM/VBI, RL и прочее).
  • Выстраивание подхода к прогнозированию и понимание ограничения методов, прокси-метрик и необходимости использования новых знание SOTA в отдельных областях MLOps.
  • Умение зафиттить модель и по запросу проверить, жива ли она. Развернуть какое-либо необходимое ПО в кластере и версионирование моделей, данных мониторинг работы моделей, качества данных. Выстраивание инфраструктуры прогнозирования SQL.
  • Знание SQL и опыт написания тестов. Способность разобраться в чужом коде и эффективно его продебажить.

Откликайся скорее порадуй наших рекрутеров!



Посмотрите похожие вакансии

Data Scientist
Компания: INSITECH Development
Зарплата: з.п. не указана
Data scientist/ML engineer (Рекомендательная система)
Компания: Rambler & Co
Зарплата: з.п. не указана
Data Scientist (Computer Vision)
Компания: БиАйЭй-Технолоджиз
Зарплата: з.п. не указана
Ведущий Data Scientist (Python)
Компания: ЭЛВИС-НеоТек
Зарплата: з.п. не указана