25 декабря 2024
Понимание механизма дистрибьюции данных на сегмент-инстансах Greenplum, и как исправлять перекосы данных (skews);
Понимание разницы механизмов работы Heap & AOP (append-optimzed) таблиц в Greenplum, включая понимание ограничений колоночного формата хранения данных;
Понимание различий между логическими моделями: звезды, снежинки и DataVault;
Опыт с технологическим стеком: Python, SQL, ETL, Spark.