Data engineer

№ 9469930  ·  5 сентября 2021, 22:31  ·  178 просмотров

Архивная вакансия

Кадровое агентство

JCat

Статус

Вакансия находится в архиве


Условия работы


Город

Москва, м. Площадь Революции   –   на карте

Заработная плата

от 260 000 руб.

График работы

Полный рабочий день

Условия

Мы предлагаем:

- Полностью удаленная работа в динамично растущем подразделении (прирост в 2 раза за 2020-й год) над новыми интересными проектами, связанными с Data Science.

- Минимум бюрократии и legacy-кода.

- Проектная работа (в команде есть data science, data engineers, ETL, Python- и frontend-разработчики, архитекторы, аналитики, тестировщики).

- Возможности профессионального и карьерного роста (регулярные performance review), ротации в смежные специальности.

Обязанности

Чем предстоит заниматься:

- Разработка продакшен-пайплайнов обработки данных в одной из областей:

- Сервисы товарных рекомендаций, data-driven merchandising, персонализация;

- Прогнозные модели и системы автоматизации планирования и управления ассортиментом, ценами и промо.

- Индустриализация прототипов команды Data Science в одной из перечисленных областей.

- Техническое документирование разработок.

- Третья линия поддержки пайплайнов. [#2854381#]


Требования к кандидату *


Образование

Высшее

Опыт работы

От 3 лет

Требования

Что мы ждем от кандидата:

- Реляционные СУБД (PostgreSQL, в идеале еще и Greenplum): проектирование структур таблиц, работа с большими объемами данных (> терабайта), умение писать и оптимизировать сложные SQL-запросы (CTE, подзапросы, джойны, агрегация, оконные функции), хранимые процедуры (функции), умение читать и понимать план запроса.

- Уверенное знание Python 3:

- ООП, магические методы, перегрузка, наследование (super);

- Понимание структур данных (список, словарь, set, отличие базовых операций с ними по степени сложности).

По pandas требуется:

- Уверенное знание API pandas;

- Умение векторизировать вычисления (избегать циклов);

- Оптимизация кода по памяти.

- Опыт написания промышленных пайплайнов обработки данных, содержащих множество шагов, зависимостей и сложную логику.

- Умение разбираться в чужом коде (понимание кода, refactoring, code review).

- Linux (базовый опыт: командная строка, shell, работа с файлами, процессами, мониторинг производительности).

- Опыт работы с системами контроля версий (в идеале - командная разработка в git (GitLab, GitHub), умение работать с git в командной строке, работа с merge request"ами, решение merge conflict"ов).

- Приветствуется понимание принципов CI / CD, знание подходов к проектированию хранилищ данных, а также опыт работы с:

- MPP СУБД (Greenplum, Teradata, Vertica), понимание дистрибуции и партиционирования данных;

- Docker, Kubernetes;

- Инструментами для разработки и оркестрации пайплайнов (Apache Airflow, Luigi);

- Облачными технологиями (в частности, S3);

- дебагом утечек памяти в Python (pandas; на стыке DS и Python);

- PySpark, Dask, Modin.

Технический стек: Greenplum, PostgreSQL, Python (pandas, Modin), GitLab, Linux, Docker, Kubernetes, d.


Старший повар (Ашан Красногорск)

50 000 – 62 000 руб.

Митино

Оператор на телефон ( каждый день)

55 000 – 75 000 руб.

Нагатинская

Швея универсал

от 80 000 руб.

Аэропорт

Няня к девочке 4 года

от 120 000 руб.

Авиамоторная

Менеджер по продажам

от 80 000 руб.

Крымская

Машинист экскаватора

90 000 – 120 000 руб.

Выхино

Водитель на автомобиль работодателя

50 000 – 60 000 руб.

Выставочная

Охранник 4 разряда

70 000 – 75 000 руб.

Новокузнецкая

Курьер

40 000 – 45 000 руб.

Щукинская

Специалист по уборке территории Бизнес-центра (дворник)

60 000 – 70 000 руб.

Тургеневская


* Требования, не связанные с деловыми качествами соискателя (например, пол или возраст), не являются обязательными!