Founding ML / Systems Engineer в Helix Accel (удаленная работа)

21 мая 2026

Уровень зарплаты:
з.п. не указана
Требуемый опыт работы:
Не указан

Вакансия: Founding ML / Systems Engineer в Helix Accel

Описание вакансии

О компании

Мы строим интеллектуальный вычислительный слой для биологии.

Современная биоинформатика опирается на мощные, но разрозненные инструменты (Scanpy, Seurat, RAPIDS, Parabricks). При этом:

  • пайплайны фрагментированы
  • решения принимаются вручную
  • методы часто применяются вслепую
  • вычисления не оптимальны по скорости и стоимости

Наша цель изменить это.

Мы создаём систему, которая:

  • анализирует биологические датасеты
  • автоматически выбирает оптимальный пайплайн
  • управляет CPU / GPU / sparse вычислениями
  • измеряет производительность и стоимость
  • проверяет корректность биологического результата

В долгосрочной перспективе это приведёт к созданию нативного вычислительного стека для биологии от софта до облака и специализированного железа.

Роль

Мы ищем технического лида, который возглавит разработку ключевой платформы.

Это роль уровня 0 1. Вам предстоит:

  • спроектировать архитектуру системы
  • определить стратегию оптимизации
  • построить core performance layer
  • сформировать инженерную культуру

Вы будете работать напрямую с фаундером и научным лидом по биологии, превращая сложную техническую идею в реальный продукт для биотеха и фармы.

Что вы будете строить

Краткосрочно (0 6 месяцев)

  • MVP Bio Compute Optimizer:
    • оркестрация CPU vs GPU
    • движок выполнения пайплайнов
    • слой бенчмаркинга и метрик
  • Интеграции с:
    • Scanpy / Seurat
    • RAPIDS / cuML
  • Улучшение:
    • скорости выполнения
    • потребления памяти
    • стоимости вычислений

Среднесрочно (6 18 месяцев)

  • Продвинутый оптимизатор:
    • dataset-aware execution planning
    • работа с разреженными данными (CSR / CSC)
    • approximate алгоритмы (KNN, графы)
  • Распределённые вычисления:
    • multi-GPU
    • кластерные системы
  • Продакшн-система:
    • API
    • облачная платформа
    • enterprise deployment

Долгосрочно

  • Собственные ядра (kernels) для биологических задач
  • Bio Sparse / Bio Graph compute engines
  • Оптимизация под конкретное железо
  • Движение к специализированной вычислительной архитектуре для биологии

Технологический стек и задачи

Вы будете работать с:

  • GPU-программированием (CUDA, Triton, cuML, CuPy)
  • Оптимизацией разреженных матриц (CSR / CSC)
  • Графовыми алгоритмами (KNN, clustering)
  • Оркестрацией пайплайнов
  • Управлением памятью и перемещением данных
  • Распределёнными вычислениями
  • Performance benchmarking

Идеальный кандидат

Обязательно:

  • 5 10+ лет опыта в инженерии
  • Сильное системное мышление
  • Опыт в одной из областей:
    • GPU / HPC
    • ML-инфраструктура
    • высоконагруженные системы
  • Опыт построения performance-critical систем

Плюс:

  • CUDA / Triton
  • ML-инфраструктура (PyTorch, JAX, distributed training)
  • Численные методы / scientific computing
  • Работа с большими данными

Дополнительный плюс:

  • Опыт в биоинформатике / геномике
  • RAPIDS, FAISS, графовые системы
  • Стартап-опыт

Что для нас важнее всего

  • Умение мыслить с первых принципов
  • Чувство узких мест в производительности
  • Комфорт с неопределённостью
  • Способность быстро реализовывать решения

Не подойдёт, если вы:

  • Предпочитаете только исследовательскую работу без продуктовой части
  • Хотите работать по заранее заданному плану
  • Не готовы к условиям ранней стадии стартапа

Почему это интересно

Биология становится одной из самых data-intensive индустрий, но её вычислительный стек сильно отстаёт.

Это возможность:

  • создать новую категорию (Bio Compute Layer)
  • работать на стыке:
    • AI
    • системного программирования
    • life sciences
  • построить инфраструктуру, которая может стать стандартом в индустрии
  • возможность переезда зарубеж

Условия

  • Значимая доля (equity)
  • Зарплата обсуждается после поднятия seed капитала (продвинутое обсуждения с потенциальными инвесторами в США)
  • География гибкая