Data engineer

№ 9469930 · 5 сентября 2021, 22:31 · 178 просмотров

Архивная вакансия

Кадровое агентство	JCat
Статус	Вакансия находится в архиве
Условия работы
Город	Москва, м. Площадь Революции – на карте
Заработная плата	от 260 000 руб.
График работы	Полный рабочий день
Условия	Мы предлагаем: - Полностью удаленная работа в динамично растущем подразделении (прирост в 2 раза за 2020-й год) над новыми интересными проектами, связанными с Data Science. - Минимум бюрократии и legacy-кода. - Проектная работа (в команде есть data science, data engineers, ETL, Python- и frontend-разработчики, архитекторы, аналитики, тестировщики). - Возможности профессионального и карьерного роста (регулярные performance review), ротации в смежные специальности.
Обязанности	Чем предстоит заниматься: - Разработка продакшен-пайплайнов обработки данных в одной из областей: - Сервисы товарных рекомендаций, data-driven merchandising, персонализация; - Прогнозные модели и системы автоматизации планирования и управления ассортиментом, ценами и промо. - Индустриализация прототипов команды Data Science в одной из перечисленных областей. - Техническое документирование разработок. - Третья линия поддержки пайплайнов. [#2854381#]
Требования к кандидату *
Образование	Высшее
Опыт работы	От 3 лет
Требования	Что мы ждем от кандидата: - Реляционные СУБД (PostgreSQL, в идеале еще и Greenplum): проектирование структур таблиц, работа с большими объемами данных (> терабайта), умение писать и оптимизировать сложные SQL-запросы (CTE, подзапросы, джойны, агрегация, оконные функции), хранимые процедуры (функции), умение читать и понимать план запроса. - Уверенное знание Python 3: - ООП, магические методы, перегрузка, наследование (super); - Понимание структур данных (список, словарь, set, отличие базовых операций с ними по степени сложности). По pandas требуется: - Уверенное знание API pandas; - Умение векторизировать вычисления (избегать циклов); - Оптимизация кода по памяти. - Опыт написания промышленных пайплайнов обработки данных, содержащих множество шагов, зависимостей и сложную логику. - Умение разбираться в чужом коде (понимание кода, refactoring, code review). - Linux (базовый опыт: командная строка, shell, работа с файлами, процессами, мониторинг производительности). - Опыт работы с системами контроля версий (в идеале - командная разработка в git (GitLab, GitHub), умение работать с git в командной строке, работа с merge request"ами, решение merge conflict"ов). - Приветствуется понимание принципов CI / CD, знание подходов к проектированию хранилищ данных, а также опыт работы с: - MPP СУБД (Greenplum, Teradata, Vertica), понимание дистрибуции и партиционирования данных; - Docker, Kubernetes; - Инструментами для разработки и оркестрации пайплайнов (Apache Airflow, Luigi); - Облачными технологиями (в частности, S3); - дебагом утечек памяти в Python (pandas; на стыке DS и Python); - PySpark, Dask, Modin. Технический стек: Greenplum, PostgreSQL, Python (pandas, Modin), GitLab, Linux, Docker, Kubernetes, d.


Старший повар (Ашан Красногорск)	50 000 – 62 000 руб.	Митино

Оператор на телефон ( каждый день)	55 000 – 75 000 руб.	Нагатинская

Швея универсал	от 80 000 руб.	Аэропорт

Няня к девочке 4 года	от 120 000 руб.	Авиамоторная

Менеджер по продажам	от 80 000 руб.	Крымская

Машинист экскаватора	90 000 – 120 000 руб.	Выхино

Водитель на автомобиль работодателя	50 000 – 60 000 руб.	Выставочная

Охранник 4 разряда	70 000 – 75 000 руб.	Новокузнецкая

Курьер	40 000 – 45 000 руб.	Щукинская

Специалист по уборке территории Бизнес-центра (дворник)	60 000 – 70 000 руб.	Тургеневская

* Требования, не связанные с деловыми качествами соискателя (например, пол или возраст), не являются обязательными!

Data engineer

Условия работы

Требования к кандидату *