13 марта 2026
Мы создаём Overlay AI систему памяти и навигации для искусственного интеллекта нового поколения. Это не очередная GPT-обёртка. В нашей архитектуре LLM выступает в роли интеллектуального роутера, тогда как основа системы структурированные графы знаний, внешняя память и глубокая семантическая обработка экспертных знаний .
Ищем инженера , которому интересно работать на стыке данных, смыслов и архитектуры ИИ. Ваша основная задача создавать и развивать топливо для нашего ИИ.
Разработка интеллектуальных парсеров под неструктурированные форматы данных с написанием собственных fallback-режимов.
Уверенное владение Python и опыт построения ETL / data-пайплайнов.
Опыт работы с большими объёмами данных и неструктурированными источниками.
Навыки парсинга данных (веб, API, документы) и обработки ошибок.
Понимание принципов обработки текстов и NLP (токенизация, эмбеддинги, chunking).
Практический опыт работы с LLM и RAG-подходами.
Понимание векторного и/или графового поиска, опыт работы с соответствующими БД.
Уверенная работа в Linux-среде, базовые навыки Docker.
Будет плюсом:
Опыт работы с Airflow / LangChain / LlamaIndex или аналогами.
Интерес к архитектуре интеллектуальных систем и работе в небольших командах.
Возможность долгосрочного сотрудничества и роста роли вместе с развитием продукта.
*Чтобы мы поняли, что вы внимательно прочитали вакансию и говорите с нами на одном языке, прикрепите к отклику ответы на 3 коротких вопроса:
1. Опишите свой самый сложный парсер или ETL-пайплайн. Что было на входе, что на выходе, какие проблемы решали (масштаб, грязные данные, обход защит)?
2. Был ли у вас опыт создания графовых (Knowledge Graph) или векторных баз данных / создания обучающих датасетов? Кратко опишите его.
3. Опишите самую сложную железную или инфраструктурную проблему, которую вам приходилось решать (например, падение серверов, проблемы с VRAM при запуске моделей, воскрешение Docker).