1 июня 2026
О компании и задаче
Компания ведёт управленческий учёт в кастомизированной 1С:ERP 2.0 (учёт денежных средств, производство, заказы, отгрузки; более 200 отчётов, накопленные данные за 10 лет). Нам нужен штатный специалист, который возьмёт на себя качество и достоверность данных: построит и будет постоянно развивать систему автоматического контроля ошибок, а также станет единым окном для любых аналитических выгрузок и проверок по базе.
Это не разовый проект, а постоянная роль. Система контроля качества данных должна работать ежедневно и развиваться вместе с бизнесом.
Основные задачи
На этапе запуска (первые 1 2 месяца)Определить СУБД базы (MS SQL / PostgreSQL) и настроить безопасную выгрузку данных (read-only реплика или регулярный экспорт). Рабочая база не изменяется.
Развернуть на сервере компании движок контроля качества данных (имеется готовое ТЗ и рабочий прототип на Python) и подключить его к реальным данным.
Сопоставить таблицы и поля базы с проверками, адаптировать готовые проверки и добавить новые под наши процессы (деньги, производство, заказы, отгрузки).
Поставить ежедневный автозапуск и настроить отчёт о несоответствиях (Excel и/или дашборд) с рассылкой ответственным.
Настроить слой запросов на естественном языке (Text-to-SQL): возможность задать вопрос по базе и получить точную выгрузку.
Ежедневный контроль работы системы и разбор найденных несоответствий с ответственными отделами.
Развитие каталога проверок: новые правила и метрики по мере появления новых типов ошибок и процессов.
Выполнение ad-hoc аналитических запросов от руководства и отделов (точные выгрузки, сверки, отчёты).
Калибровка системы: снижение ложных срабатываний, приоритизация по критичности.
Поддержание и развитие хранилища данных и витрин/дашбордов.
Документирование проверок, выгрузок и регламентов реагирования на ошибки.
(Перспектива) Подключение поиска по текстовым данным компании через RAG как отдельного инструмента для неструктурированной информации.
Требования
Уверенный Python: pandas, numpy; написание поддерживаемого кода.
Сильный SQL: сложные запросы, агрегации, соединения (MS SQL и/или PostgreSQL).
Опыт извлечения данных из 1С (знание структуры БД 1С) ИЛИ уверенный опыт интеграции данных из учётных систем и готовность быстро разобраться в 1С.
Понимание принципов контроля качества данных (Data Quality): проверки целостности, сверки, выявление аномалий.
Базовое понимание машинного обучения для поиска аномалий (например, IsolationForest, статистические методы).
Опыт автоматизации запусков (cron / Планировщик задач) и работы на сервере (Linux/Windows).
Аккуратность к данным и приватности: всё разворачивается локально, данные наружу не передаются.
Русский язык рабочая коммуникация и данные на русском
Будет плюсом
Опыт BI-дашбордов (Metabase, Apache Superset, Power BI).
Опыт Text-to-SQL и работы с LLM (в т. ч. локальными), Claude Code.
Опыт RAG / векторного поиска по текстовым данным.
Опыт построения хранилищ данных (DWH) и ETL/ELT-процессов.
Производственная/торговая предметная область (заказы, отгрузки, себестоимость).
Как мы отбираем
Скрининг откликов и ответов на 3 вопроса.
Техническое интервью: дадим прочитать наш прототип и ТЗ обсудим, как кандидат предлагает их развивать.
Небольшое тестовое: подключить движок к учебной выгрузке и предложить 2 3 новые проверки.
Финальное собеседование и оффер.
Условия
Удаленный формат работы;