Аналитика данных

Весна 2021

Цель курса — Цель курса — изучите в теории на практике инструменты обработки и анализа данных для проведения исследований и визуализации их результатов, проверки гипотез, поиска закономерностей и инсайтов.
 

Описание
Аналитик умеет обрабатывать большие и неоднородные массивы данных, например, тенденции рынка и обратную связь от клиентов. Это позволяет видеть ситуацию в целом, находить новые логические связи, предлагать эффективные финансовые модели и актуальные бизнес-решения.

 
Подробнее
Чему научитесь
Закончив курс, вы сможете:
– Сможете работать с различными источниками данных.
– Получите навыки в написании SQL-запросов различной сложности.
– Разберетесь, как запускать и оценивать сплит-тестирования для принятия важных продуктовых решений.
– Научитесь обрабатывать, исследовать и визуализировать данные с помощью языка программирования Python.
– Сможете применять математическую статистику для проведения описательного и углубленного анализа данных.
Подробнее

Преподаватели

Елена Тимофеева Елена Тимофеева

Продуктовый аналитик в Ситимобил

Программа

занятие Часы в ауд. + сам. работа

Смешанное занятие №1: Обзор курса. Знакомство с базами данных и языком запроса SQL.  

-Теоретические основы работы с базами данных;
-SQL:Базовые операции, функции агрегации, работа с несколькими таблицами, вложенные запросы
 
 
4 ак. ч.

Смешанное занятие №2: Аналитические запросы PostgreSQL  

- Аналитические запросы MySQL
- функции для построения аналитических запросов
Практика:
использование аналитических функций для расчёта продуктовых метрик 
 
4 ак. ч.

Смешанное занятие №3: Знакомство с колоночными базами данных. ClickHouse.  


Знакомство с колоночными базами данных. ClickHouse
- Знакомство с  колоночными базами данных на примере ClickHouse. OLAP
- Тренируемся написании запросов, знакомимся с особенностями синтаксиса и существующими функциями.
4 ак. ч.

Смешанное занятие №4: Ведение в Python  


Введение в Python
Теория:
Установка Python и библиотек. Основные типы данных. Функции.
4 ак. ч.

Смешанное занятие №5: Работа с данными на языке программирования Python  

Работа с данными на языке программирования Python:
получение данных из различных источников,
обработка сырых данных (дубликаты, пропуски, типы данных)
Практика: подключение К БД, работа с файлами, агрегация данных для последующего анализа.
 
4 ак. ч.

Смешанное занятие №6: Визуализация данных  

Работа с данными на яп Python (часть 2): визуализация данных. Знакомство с Tableu
 
4 ак. ч.

Семинар №1: Работа над проектом  

Работа над проектом: Проведение исследовательского анализа данных (получение данных, обработка, визуализация)
4 ак. ч.

Смешанное занятие №7: Математическая статистика: основные статистические показатели и их применение в анализе данных  

Математическая статистика: основные статистические показатели и их применение в анализе данных
Работа над проектом: Проведение анализа данных с применением знаний основ описательной статистики и основных статистических показателей 
4 ак. ч.

Смешанное занятие №8: Математическая статистика: проверка статистических гипотез  

Определение статистической гипотезы, ошибок первого и второго рода, уровня значимости и т.д.
Разбор и написание кода статистических критериев (from scratch и с использованием популярных библиотек для проверки гипотез на python).
 
4 ак. ч.

Смешанное занятие №9: Математическая статистика: проверка статистических гипотез (часть 2)  

Множественное сравнение
Практика: реализация критерия Стьюдента с поправками  Бонферрони и Холма-Бонферрони, критерия Крускала - Уоллиса
 
 
4 ак. ч.

Смешанное занятие №10: Продуктовые метрики, приоритезация и unit-экономика  

4 ак. ч.

Контрольное занятие №1: Защита проектов  

Защита финального проекта
4 ак. ч.

РАСПИСАНИЕ

Полное расписание