20 декабря 2025
Мы в поиске Специалиста на проект по исследованию в области ИИ (оптимизация моделей глубокого обучения на edge-платформах).
Задача: участие в разработке техники сжатия моделей и квантования для повышения производительности AI-задач на устройствах с ограниченными ресурсами.
Исследовать и внедрять QAT/PTQ, эффективные алгоритмы инференса с фокусом на латентность, память и энергопотребление.
Работать с PyTorch, ONNX Runtime, TVM для развертывания моделей.
Сотрудничать с hard wa re-инженерами edge NPU.
Исследовать производительность и отслеживать тренды в AI efficiency и acceleration.
Знания и опыт в машинном обучении, оптимизации.
Опыт QAT/PTQ, mixed precision; Python/C++/CUDA/OpenCL; фреймворки (PyTorch/TensorFlow/ONNX/TVM/TensorRT).
Знание аппаратных ускорителей (SIMD/AVX/Tensor Cores) и компиляторных оптимизаций (XLA/MLIR/LLVM).
Умение общаться на английском обязательно.