17 ноября 2024
Привет! Я Артем Науменко, ex-Head of Infra Skyeng. Я прошел путь от разработчика до архитектора, потом до руководителя инфраструктуры и теперь до CTO. В Skyeng руководил командой из > 50 человек.
Теперь я занялся стартапом в области био технологий с продуктовой командой из 3 человек. Теперь я ищу middle fullstack разработчика (React+PHP) на фуллтайм, чтобы вместе менять будущее медицинских исследований.
Откликайся если:
хочешь прокачаться в архитектуре и ООП
О Unison:
- Мы строим инфраструктуру для создания крупнейших в мире генетических датасетов по редким болезням, используя федерацию данных. Федерация - это виртуальное объединение данных без физического копирования данных. Нормализация данных на лету (и это реально сложно).
- Мы работаем с крупнейшим онкологическим датасетом в мире и некоторыми компаниями, находящимися на переднем крае точной медицины в онкологии с использованием ДНК конкреного пациента (персонализированная медицина).
- Мы привлекли инвестиции лучших венчурных фондов Европы: на 4м, 7м и 8м местах среди по доле единорогов.
О продукте:
- Наша цель одновременно простая и сложная. Хотим чтобы исследователи имели простой доступ к данным для исследований, чтобы получать инсайты быстрее. Таким образом исследователи смогут сосредоточиться на новых методах лечения и новых видах лекарств.
- Суть проекта: сделать возможными исследования генетических данных нескольких биобанков одновременно, при условии что эти данные нельзя копировать (нельзя собрать в одном биобанке, например).
- Суть решения: федеративные исследования. Мы запускаем внутри каждого биобанка процесс, который генерирует анонимизированные данные, полезные для данного исследования, и эти агрегаты уже экспортируем наружу в общее хранилище данных, где исследователь может их анализировать. Кардинально упрощенный пример: исследователь спрашивает "нарисуй мне распределение по пациентов определенного пола и возраста, больных раком легких с диабетом 1-го типа", и система возвращает график, но сами личности этих пациентов не раскрываются. На самом деле все супер сложнее, так как анализ геномов не выражается через SQL.
Кто нам нужен:
- Senior fullstack developer (PHP+react).
- Python будет плюсом (агенты, устанавливаемые в биобанки, на python).
- OOP, SOLID.
- Желательно знание английского B2 и выше, так как все сотрудники вне разработки англоязычные.
Основные челленджи:
- Безопасность. Биобанки - параноики. Все что хоть немного небезопасно они отвергают. Можешь сам подумать как дедублицировать базу пациентов между разными биобанками, без передачи каких либо идентификаторов человека между биобанками.
- Объемы данных. Один геном человека весит 2Gb. Для исследования нужно работать с тысячами геномов одновременно. Речь про гиганские кластеры (HPC), и в разных биобанках кластера разные (где-то k8s, где-то slurm, где-то AWS Batch и т.д.)
- Стандартизация данных. В каждом биобанке своя структура данных и нужно архитектурно поддерживать их совместимость с нашим унифицированным языком запросов UQL.
- Верификация результата. Недостаточно сделать условный генератор графика распределения по возрастам для разных биобанков, нужно еще гарантировать, что это распределение построено правильно. Соответственно нужны тесты на данные и на аггрегаты.
Технологии:
- Web: PHP8, symfony, react, PostgreSQL, Websockets.
- Biobank app: python.
- Nextflow.
- AWS Batch, k8s (EKS).
- Практически нет легаси, нам 2 года
Условия:
- Удаленная работа.
- Договор с UK-компанией.
- Зарплата в $ - обсудим твои ожидания на собеседовании.
- Возможно получение опционов (доли компании)
- Потенциально возможна релокация в Лондон.