5 марта 2026
Aspirity студия веб- и мобильной разработки из Сибири, специализирующаяся на создании программных решений для международных стартапов и крупных компаний. Среди наших клиентов технологические компании Кремниевой долины (Shoreline, Pinecone), а также лидеры рынков России, Европы и Азии, включая РУСАЛ, NGenix (в составе группы Ростелеком ) и Schibsted.
Мы развиваем направление outstaff-сотрудничества и формируем команды, которые работают в продуктах клиентов, оставаясь частью инженерной культуры Aspirity.
Параллельно мы запускаем внутренний AI-проект систему автоматизации проектирования складских комплексов.
В рамках проекта создаются интеллектуальные ассистенты, которые помогают инженерам работать с технической документацией, знаниями и проектными данными.
Сейчас мы ищем специалиста, который будет участвовать в подготовке и структурировании данных для AI-ассистентов.
Обязанности
Работа с текстовыми и техническими документами:
структурирование текстовой информации из различных источников (документы, таблицы, технические описания)
подготовка данных для использования в AI-системах и поисковых механизмах (retrieval / knowledge base)
разметка и классификация текстовых данных
проверка корректности и полноты подготовленных данных
участие в подготовке датасетов для работы AI-ассистентов
взаимодействие с инженерами данных и ML/AI-разработчиками
помощь в организации и улучшении структуры знаний проекта
Требования
внимательность и аккуратность при работе с текстовыми данными
опыт работы с текстовыми документами, таблицами и большими массивами информации
понимание принципов структурирования текстовой информации
Обязательный опыт:
опыт текстовой разметки данных для AI / NLP проектов
опыт подготовки данных для retrieval-систем (RAG)
опыт создания QA-пар (вопрос ответ) на основе текстовых источников
опыт чанкинга (разбиения документов на смысловые фрагменты)
понимание принципов retrieval / semantic search
базовое понимание того, как LLM и RAG-системы используют текстовые данные
Работа с документацией:
опыт работы с технической или инженерной документацией
(регламенты, инструкции, технические описания, спецификации и т.п.)
Инструменты и навыки:
уверенное владение Google Docs / Excel / текстовыми редакторами
базовое владение Markdown
опыт работы с инструментами разметки данных (Label Studio или аналогами)
Будет плюсом
опыт подготовки датасетов для RAG / LLM-ассистентов
понимание принципов embeddings, vector search, retrieval pipeline
опыт проверки и улучшения качества датасетов (валидация QA-пар)
опыт работы с инженерными или производственными документами
базовые знания NLP и LLM
Мы предлагаем
участие в инновационном AI-проекте
работу в команде инженеров и AI-разработчиков
возможность получить практический опыт в сфере AI / LLM / RAG
удалённое сотрудничество
поддержку со стороны команды