Data Quality инженер (1С:ERP + Python) (удаленная работа)

1 июня 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Data Quality инженер (1С:ERP + Python)

Описание вакансии

О компании и задаче

Компания ведёт управленческий учёт в кастомизированной 1С:ERP 2.0 (учёт денежных средств, производство, заказы, отгрузки; более 200 отчётов, накопленные данные за 10 лет). Нам нужен штатный специалист, который возьмёт на себя качество и достоверность данных: построит и будет постоянно развивать систему автоматического контроля ошибок, а также станет единым окном для любых аналитических выгрузок и проверок по базе.

Это не разовый проект, а постоянная роль. Система контроля качества данных должна работать ежедневно и развиваться вместе с бизнесом.

Основные задачи

На этапе запуска (первые 1 2 месяца)
  1. Определить СУБД базы (MS SQL / PostgreSQL) и настроить безопасную выгрузку данных (read-only реплика или регулярный экспорт). Рабочая база не изменяется.

  2. Развернуть на сервере компании движок контроля качества данных (имеется готовое ТЗ и рабочий прототип на Python) и подключить его к реальным данным.

  3. Сопоставить таблицы и поля базы с проверками, адаптировать готовые проверки и добавить новые под наши процессы (деньги, производство, заказы, отгрузки).

  4. Поставить ежедневный автозапуск и настроить отчёт о несоответствиях (Excel и/или дашборд) с рассылкой ответственным.

  5. Настроить слой запросов на естественном языке (Text-to-SQL): возможность задать вопрос по базе и получить точную выгрузку.

На постоянной основе
  • Ежедневный контроль работы системы и разбор найденных несоответствий с ответственными отделами.

  • Развитие каталога проверок: новые правила и метрики по мере появления новых типов ошибок и процессов.

  • Выполнение ad-hoc аналитических запросов от руководства и отделов (точные выгрузки, сверки, отчёты).

  • Калибровка системы: снижение ложных срабатываний, приоритизация по критичности.

  • Поддержание и развитие хранилища данных и витрин/дашбордов.

  • Документирование проверок, выгрузок и регламентов реагирования на ошибки.

  • (Перспектива) Подключение поиска по текстовым данным компании через RAG как отдельного инструмента для неструктурированной информации.

Требования

  • Уверенный Python: pandas, numpy; написание поддерживаемого кода.

  • Сильный SQL: сложные запросы, агрегации, соединения (MS SQL и/или PostgreSQL).

  • Опыт извлечения данных из 1С (знание структуры БД 1С) ИЛИ уверенный опыт интеграции данных из учётных систем и готовность быстро разобраться в 1С.

  • Понимание принципов контроля качества данных (Data Quality): проверки целостности, сверки, выявление аномалий.

  • Базовое понимание машинного обучения для поиска аномалий (например, IsolationForest, статистические методы).

  • Опыт автоматизации запусков (cron / Планировщик задач) и работы на сервере (Linux/Windows).

  • Аккуратность к данным и приватности: всё разворачивается локально, данные наружу не передаются.

  • Русский язык рабочая коммуникация и данные на русском

Будет плюсом

  • Опыт BI-дашбордов (Metabase, Apache Superset, Power BI).

  • Опыт Text-to-SQL и работы с LLM (в т. ч. локальными), Claude Code.

  • Опыт RAG / векторного поиска по текстовым данным.

  • Опыт построения хранилищ данных (DWH) и ETL/ELT-процессов.

  • Производственная/торговая предметная область (заказы, отгрузки, себестоимость).

Как мы отбираем

  • Скрининг откликов и ответов на 3 вопроса.

  • Техническое интервью: дадим прочитать наш прототип и ТЗ обсудим, как кандидат предлагает их развивать.

  • Небольшое тестовое: подключить движок к учебной выгрузке и предложить 2 3 новые проверки.

  • Финальное собеседование и оффер.

Условия

  • Удаленный формат работы;

  • Важно! Учет рабочего времени удаленного сотрудника ведется в программе Bitcop