Инженер машинного обучения (НЛП) (удаленная работа)

18 марта 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Инженер машинного обучения (НЛП)

Описание вакансии

СиСофт Разработка - ведущий разработчик программного обеспечения для рынка САПР в области машиностроения, промышленного и гражданского строительства, архитектурного проектирования, землеустройства, электронного документооборота, обработки сканированных чертежей, векторизации и гибридного редактирования. Компания входит в реестр производителей отечественного ПО со всеми вытекающими преимуществами.

Мы формируем направление AI / NLP для работы с инженерными и проектными данными и ищем Инженера машинного обучения (NLP / LLM / RAG) .

Обязанности:

  • Разработка и внедрение систем интеллектуального поиска и извлечения информации из инженерной документации (PDF, DOCX, CAD-экспорты, спецификации, проектная документация);
  • Построение и развитие RAG-систем (Retrieval-Augmented Generation) для работы с техническими знаниями и нормативной документацией;
  • Разработка пайплайнов обработки документов:

парсинг,

структурирование,

чанкинг,

построение эмбеддингов,

индексирование (vector DB);

  • Настройка и дообучение LLM (LoRA, instruction-tuning) под задачи инженерного домена;
  • Построение систем семантического поиска, QA, автоматического анализа и суммаризации проектной и нормативной документации;
  • Разработка сервисов на FastAPI / REST API для интеграции ML-моделей в CAD-системы;
  • Оптимизация инференса LLM (квантование, batching, GPU-инференс);
  • Интеграция решений в серверную инфраструктуру (Docker, CI/CD);
  • Разработка методик и стандартов эксплуатации ML-моделей;
  • Участие в пилотных проектах с подключением AI-функциональности к CAD через API и плагины.
Обязательные требования:
  • Высшее техническое или математическое образование;
  • Опыт разработки ML/NLP решений от 2 лет;
  • Уверенное владение Python (production-level код);
  • Опыт работы с:
    • PyTorch / Transformers (HuggingFace),
    • LLM (LLaMA, Mistral, Qwen и др.),
    • Sentence Transformers / эмбеддинги;
  • Опыт построения RAG-систем;
  • Понимание архитектуры:
    • vector databases (Qdrant, Milvus, FAISS),
    • embedding pipelines,
    • retrieval + reranking;
  • Опыт извлечения информации из документов (OCR, layout parsing, таблицы, структуры);
  • Навыки работы с Docker, Git;
  • Опыт использования MLFlow, Weights & Biases или аналогичных систем;
  • Умение документировать архитектуру и решения.

Будет преимуществом:

  • Опыт работы с инженерной или нормативной документацией;
  • Знание форматов CAD (DWG, IFC, Revit-экспорт);
  • Опыт работы с Docling, LangChain, LlamaIndex;
  • Опыт оптимизации LLM (quantization, llama.cpp, vLLM);
  • Понимание принципов MLOps;
  • Опыт внедрения on-premise решений.

Условия:

  • Работа в стабильной, динамично развивающейся, аккредитованной ИТ-компании;
  • Участие в проекте создания отечественной платформы AI-визуализации для архитектуры и инженерных систем;
  • Работа в междисциплинарной команде (ML, CAD, DevOps, дизайн);
  • Возможность профессионального роста и участия в R&D-проекте;
  • Официальная заработная плата, обсуждается на собеседовании;
  • Оформление по ТК РФ с первого рабочего дня;
  • Медицинский полис ДМС расширенного формата за счет компании. Льготные условия оформления ДМС для членов семьи;
  • Интересные задачи и коллектив профессионалов;
  • Возможность карьерного роста;
  • Возможность удаленной работы;
  • Дружный коллектив;
  • Комфортабельные офисы в г. Москва, г. Иваново, г. Нижний Новгород, г. Обнинск.