Задание: Специалист по сканированию и распознаванию. Разбраковка сырых сканов научных журналов (Дистанционная работа)
У меня есть сканы советских научных журналов (по разворотам, 145 номеров, примерно по 80+ разворотов в каждой папке).
Но: в этих папках полно дубликатов, есть пропуски, могут быть и расфокусы. На OCR это пока нельзя, надо чистить и досканивать.
Нужно:
- дубликаты удалить;
- расфокусы и прочий брак удалить
- номера страниц на перескан (пропуски, расфокусы, прочий брак) -- записать в доку, чтобы мы потом их пересканировали.
С вас: 60 гигов на диске, готовность поставить облако mail.ru, прямые руки и зоркие глаза.
Как пользоваться XnView для быстрого отсмотра -- покажу.