Data Scientist NLP Middle/Middle+ (удаленная работа)

13 июня 2024

Уровень зарплаты:
от 180 000 до 180 000 руб.
Требуемый опыт работы:
Не указан

Вакансия: Data Scientist NLP Middle/Middle+

Описание вакансии

Наносемантика ведущий разработчик технологий искусственного интеллекта.

Мы являемся крупнейшим игроком российского рынка ИИ-решений.

Наши компетенции: нейронные сети, голосовые роботы и системы анализа больших данных.

Мы разрабатываем гибридные решения, использующие как нейросетевые архитектуры, так и классические алгоритмы машинного обучения и анализа данных.

В свою дружную команду мы приглашаем специалиста Data Scientist NLP (уровня Middle/Middle+) :

Чем предстоит заниматься:

  • -Разработкой и внедрением решений на основе трансформеров для задач типа Text Classification, Token Classification, Text Generation и классических алгоритмов машинного обучения;
  • Регулярным код-ревью 1 2 джунов и ситуационным наставничеством;
  • Развертыванием моделей машинного обучения в виде сервисов с использованием FastAPI, Docker и инструментов Model Serving;
  • Презентацией промежуточных результатов коллегам и заказчикам;
  • Поиском решений инженерных и исследовательских задач в ходе проектов;
  • Построением и отладкой пайплайнов извлечения и предобработки данных, обучения и инференса моделей;
  • Выполнением необходимых интеграций с внешними сервисами;
  • Разбором статей и реализацией архитектур нейронных сетей, функций потерь и оптимизаторов.

Мы ожидаем:

  • Опыт работы: 2+ лет;
  • Подтвержденный опыт решения задач NLP;
  • Культура организации воспроизводимых экспериментов;
  • Свободное владение Python 3 и навык писать читаемый код;
  • Практический опыт работы с FastAPI, Docker, Git;
  • Уверенное понимание процессов развертывания моделей;
  • Отличные коммуникативные навыки и умение работать в команде;
  • Хорошая математическая база и алгоритмы;
  • Опыт работы с PyTorch (также плюсом будет TensorFlow/Keras);
  • Понимание работы механизма внимания, энкодеров/декодеров, sequence2sequence моделей и хорошее представление о нейросетевых архитектурах BERT, GPT, T5;
  • Понимание и опыт практического применения алгоритмов машинного обучения (sklearn, xgboost и пр.);
  • Базовые навыки работы с библиотеками для обработки текстов (nltk, pymystem, pymorphy, spacy, natasha);
  • Опыт автоматизации обучения моделей с помощью Apache Airflow.

Будет плюсом:

  • Опыт работы с индустриальными системами аннотирования данных и сопровождения группы разметки;
  • Опыт использования Explainable AI на табличных и текстовых данных;
  • Подкованность в русскоязычных датасетах, знание их особенностей и недостатков;
  • Опыт квантизации моделей;
  • GitLab CI/CD и k8s;
  • Участие в соревнованиях по машинному обучению.

    Мы предлагаем:
  • Профессиональный рост и развитие через обучение и поддержку со стороны команды;
  • Возможность работать с высококвалифицированными специалистами;
  • Возможность осваивать новые технологии и повышать уровень своих навыков;
  • Адекватное руководство, отсутствие бюрократии;
  • Оформление по ТК РФ с первого рабочего дня;
  • Полностью официальная заработная плата: оклад по результатам собеседования;
  • ДМС для сотрудников (включая бизнес стоматологию);
  • Испытательный срок - 3 месяца;
  • Соблюдение норм ТК РФ.

Что ждёт интересного:

  • Молодой коллектив, интересная и динамичная работа;
  • Возможность получения льгот (компания имеет it-аккредитацию);
  • Возможности для профессионального и карьерного роста;
  • Возможность посещения профильных мероприятий - конференции и прохождение курсов, необходимые сотруднику для развития.


Посмотрите похожие вакансии

Middle Data Scientist (NLP)
Компания: Гринатом
Зарплата: з.п. не указана
Разработчик NLP (Middle NLP engineer / Data scientist NLP)
Компания: Taiger.com
Зарплата: от 150 000 до 200 000 руб.
Программист Python/Data Scientist (middle / senior)
Компания: Апэрбот
Зарплата: от 120 000 до 300 000 руб.
Middle ML-engineer (Data Scientist)
Компания: АйТи Тех
Зарплата: з.п. не указана