Junior разметчик данных (AI-проект) (удаленная работа)

5 марта 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Junior разметчик данных (AI-проект)

Описание вакансии

О проекте

Aspirity студия веб- и мобильной разработки из Сибири, специализирующаяся на создании программных решений для международных стартапов и крупных компаний. Среди наших клиентов технологические компании Кремниевой долины (Shoreline, Pinecone), а также лидеры рынков России, Европы и Азии, включая РУСАЛ, NGenix (в составе группы Ростелеком ) и Schibsted.

Мы развиваем направление outstaff-сотрудничества и формируем команды, которые работают в продуктах клиентов, оставаясь частью инженерной культуры Aspirity.

Параллельно мы запускаем внутренний AI-проект систему автоматизации проектирования складских комплексов.
В рамках проекта создаются интеллектуальные ассистенты, которые помогают инженерам работать с технической документацией, знаниями и проектными данными.

Сейчас мы ищем специалиста, который будет участвовать в подготовке и структурировании данных для AI-ассистентов.

Обязанности

Работа с текстовыми и техническими документами:

  • структурирование текстовой информации из различных источников (документы, таблицы, технические описания)

  • подготовка данных для использования в AI-системах и поисковых механизмах (retrieval / knowledge base)

  • разметка и классификация текстовых данных

  • проверка корректности и полноты подготовленных данных

  • участие в подготовке датасетов для работы AI-ассистентов

  • взаимодействие с инженерами данных и ML/AI-разработчиками

  • помощь в организации и улучшении структуры знаний проекта

Требования

  • внимательность и аккуратность при работе с текстовыми данными

  • опыт работы с текстовыми документами, таблицами и большими массивами информации

  • понимание принципов структурирования текстовой информации

Обязательный опыт:

  • опыт текстовой разметки данных для AI / NLP проектов

  • опыт подготовки данных для retrieval-систем (RAG)

  • опыт создания QA-пар (вопрос ответ) на основе текстовых источников

  • опыт чанкинга (разбиения документов на смысловые фрагменты)

  • понимание принципов retrieval / semantic search

  • базовое понимание того, как LLM и RAG-системы используют текстовые данные

Работа с документацией:

  • опыт работы с технической или инженерной документацией
    (регламенты, инструкции, технические описания, спецификации и т.п.)

Инструменты и навыки:

  • уверенное владение Google Docs / Excel / текстовыми редакторами

  • базовое владение Markdown

  • опыт работы с инструментами разметки данных (Label Studio или аналогами)

Будет плюсом

  • опыт подготовки датасетов для RAG / LLM-ассистентов

  • понимание принципов embeddings, vector search, retrieval pipeline

  • опыт проверки и улучшения качества датасетов (валидация QA-пар)

  • опыт работы с инженерными или производственными документами

  • базовые знания NLP и LLM

Мы предлагаем

  • участие в инновационном AI-проекте

  • работу в команде инженеров и AI-разработчиков

  • возможность получить практический опыт в сфере AI / LLM / RAG

  • удалённое сотрудничество

  • поддержку со стороны команды

  • официальное оформление и достойная оплата (уровень обсуждается индивидуально)