Вакансия: Руководитель отдела разметки данных
Описание вакансии
Мы ищем СтримЛида, который построит нам надежные процессы и технологии, обеспечивающие поставку качественных размеченных данных для ML-алгоритмов нашего Data-департамента и не только. Работа с данными в музыкальном стримминге подразумевает большой пласт специфических задач по автоматической проверке корректности поступающих данных, верификации работы алгоритмов, экспертной массовой разметке данных, оценке качества работы моделей рекомендаций и поиска и т.п.
Задачи:
- Формирование и развитие команды экспертов и специалистов по разным типам контента для постановки задач и организации процессов разметки
- Разработка регламентов и инструкций для крауд-разметки
- Заключение договоров с платформами разметки (аналогов Toloka в RU-сегменте)
- Постановка задач на автоматизацию поставки данных для разметки (верификация алгоритмов, моделей, запросов)
- Обеспечение защищенного доступа крауд-разметчиков к данным
- Автоматизация загрузки размеченных данных в системы
- Создание пула внешних экспертов и систем рейтингования, оформление их на платформы разметки
- Контроль качества разметки статистическими методами и управление рисками
- Улучшение моделей работы с контентом на основе выявленных отклонений
- Контроль соблюдения регламентов сотрудниками
- Планирование и управление бюджетом на разметку
- Обеспечение эффективности разметки (снижение затрат на 1 объект)
Требования: - Опыт организации массовой крауд-разметки (не менее 2 лет)
- Понимание нюансов работы разметчиков и опыт выстраивания процедур контроля качества
- Знания статистического анализа для контроля и верификации качества разметки
- Опыт формирования и управления командой специалистов (от 5 человек)
- Умение выстраивать процессы, писать и контролировать выполнение регламентов
- Плюсом будет опыт постановки задач на интеграции данных
- Плюсом будет опыт организации разметки поисковых корзин или подготовки данных для RLHF