Дата-сайентист (Data Scientist) (удаленная работа)

8 мая 2025

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Дата-сайентист (Data Scientist)

Описание вакансии

Вакансия открыта в компании Газпромнефть-Хантос, оформление по договору ГПХ.

Обязанности:

  • Разработка дата-сетов для обучения моделей на низкоресурсном языке.
  • Оптимизация времени обучения LLM (Large Language Model) с использованием распределенных вычислений.
  • Адаптация готовых моделей под нишевые задачи (ассистент для промышленной безопасности, инструмент анализа данных, GPT поиск по базе данных документов и т.д.).
Требования:

Опыт работы с данными:

  • Создание и подготовка дата-сетов: сбор, очистка, предобработка, аугментация данных (показать примеры решений).
  • Умение работать с разнородными источниками (API, веб-скрейпинг, SQL/NoSQL-базы, открытые репозитории).
  • Понимание специфики NLP: токенизация, лемматизация, обработка контекста, работа с шумом в данных.

Запуск и обучение моделей:

  • Опыт обучения и тонкой настройки языковых моделей (BERT, GPT, T5, RoBERTa, Qwen и т.д.).
  • Знание фреймворков: PyTorch, TensorFlow, Hugging Face Transformers.
  • Умение оптимизировать процесс обучения: распределенные вычисления, использование GPU/TPU, ускорение инференса.
  • Навыки оценки моделей: применение метрик (BLEU, ROUGE, perplexity, accuracy), анализ ошибок.

Языки программирования: Python (обязательно), опыт с библиотеками (pandas, NumPy, scikit-learn, NLTK/spaCy).

Работа с NLP:

  • Знание архитектур трансформеров, механизма внимания.
  • Опыт с задачами: классификация текста, генерация, summarization, NER, машинный перевод.

Инструменты:

  • Git, MLflow, DVC, Airflow.
  • Docker, Kubernetes (для деплоя моделей).
  • Базы данных: SQL (PostgreSQL, MySQL), NoSQL (MongoDB, Elasticsearch).

Мы предлагаем:

  • Оформление по договору ГПХ
  • Достойную твоего профессионального уровня заработную плату (уровень вознаграждения обсуждается индивидуально по результатам интервью)
  • Удаленный формат работы
  • Неограниченный доступ к образовательному контенту на портале знаний от корпоративного университета
  • Подписка на лучшие электронные библиотеки с подборками IT-литературы (и не только)
  • Собственный центр профессионального развития, в котором проводятся комплексные программы обучения hard skills
  • Внутренние демодни, коуч-дни, питчи – то, что поможет продвигать и совершенствовать проекты и собственные идеи
  • Корпоративные скидки для изучения английского языка в малых группах онлайн и офлайн
  • Регулярные карьерные марафоны, индивидуальные карьерные консультации и планы развития


Посмотрите похожие вакансии

Data Scientist/ Дата-сайентист (RAG/LLM/NLP)
Компания: МАГ Девелопмент
Зарплата: з.п. не указана