Задание: Парсер данных с сайта Коммерсантъ (конкретное объявление + список по ИНН) (Дистанционная работа)
Нужно разработать скрипт (Python / Node.js / другой удобный язык), который умеет:
получать данные с сайта Коммерсантъ - раздел банкротства
Ссылка для примера: https://bankruptcy.kommersant.ru/search/poisk_soobshcheniya_o_bankrotstv
Требуемый функционал:
1) Получение конкретного объявления по его номеру
На вход: номер объявления
На выход: JSON с данными объявления
2) Получение списка объявлений по ИНН
На вход: ИНН (12 или 10 цифр)
На выход: массив объектов JSON
Требования к реализации:
Парсер должен учитывать:
- пагинацию (если результаты по ИНН разбиваются на страницы)
- прохождение капчи
Выходная структура должна быть JSON
Скрипт должен работать без GUI (CLI / API вызов)
Тестовые сценарии:
Ввод номера объявления → вывод корректного JSON
Ввод несуществующего номера → корректная ошибка
Ввод ИНН → вывод списка объявлений
Что ожидается в результате:
- Код скрипта (чистый, комментированный)
- Инструкция по запуску
- Примеры запросов и ответов
- (Опционально) API-обертка