14 ноября 2024
Ищем начинающего Python-разработчика для работы над проектом по оцифровке PDF-документов. Задача доработка и создание обработчиков для различных типов PDF, настройка под конкретные шаблоны документов и решение возникающих задач. Базовые функции уже готовы, поэтому основная работа заключается в адаптации к новым типам документов.
Обязанности:
Доработка и создание новых обработчиков для специфических типов PDF-документов.
Оптимизация кода для повышения универсальности (использование одного обработчика для схожих шаблонов).
Работа с OCR для распознавания текста на документах (например, с использованием Tesseract OCR).
Версионное управление кодом через GitHub: загрузка изменений, ведение истории версий, совместная работа с командой.
Совместное решение технических задач и обсуждение возникающих вопросов на регулярных созвонах.
Требования:
Базовые знания Python и понимание основ ООП.
Желателен опыт работы с библиотеками для работы с PDF и инструментами для распознавания текста.
Навыки работы с Git и GitHub для совместной разработки и управления версиями.
Навыки работы с регулярными выражениями для обработки текста.
Ответственность и стремление развивать свои навыки.
Знание
Условия работы:
Сдельная оплата за каждый новый тип обработанного документа (все обработанные документы, включая схожие типы, оплачиваются по одинаковой ставке).
Удаленная работа и гибкий график
Еженедельные созвоны (2-3 раза), на которых обсуждаем прогресс, делимся инсайтами и совместно решаем задачи.
Что мы предлагаем:
Реальный опыт работы в проекте, где можно развить навыки работы с данными, автоматизацией и обработкой документов.
Перспектива роста до Junior Python Developer и участие в более сложных проектах, включая внедрение алгоритмов машинного обучения.
При интересе к Машинному Обучению - подскажем трек развития и чего не хватает для того чтобы делать реальные проекты.