Аналитика данных

Весна 2021

Цель курса — Цель курса — изучите в теории на практике инструменты обработки и анализа данных для проведения исследований и визуализации их результатов, проверки гипотез, поиска закономерностей и инсайтов.
 

Описание
Аналитик умеет обрабатывать большие и неоднородные массивы данных, например, тенденции рынка и обратную связь от клиентов. Это позволяет видеть ситуацию в целом, находить новые логические связи, предлагать эффективные финансовые модели и актуальные бизнес-решения.

 
Подробнее
Чему научитесь
Закончив курс, вы сможете:
– Сможете работать с различными источниками данных.
– Получите навыки в написании SQL-запросов различной сложности.
– Разберетесь, как запускать и оценивать сплит-тестирования для принятия важных продуктовых решений.
– Научитесь обрабатывать, исследовать и визуализировать данные с помощью языка программирования Python.
– Сможете применять математическую статистику для проведения описательного и углубленного анализа данных.
Подробнее

Преподаватели

Елена Тимофеева Елена Тимофеева

Продуктовый аналитик в Ситимобил

Сергей Шмитько Сергей Шмитько

None

Программа

занятие Часы в ауд. + сам. работа

Смешанное занятие №1: Обзор курса. Знакомство с базами данных и языком запроса SQL.  
+ ДЗ №1

-Теоретические основы работы с базами данных;
-SQL:Базовые операции, функции агрегации, работа с несколькими таблицами, вложенные запросы
 
 
Домашнее задание №1: Написание SQL-запросов
Написание SQL-запросов (базовые функции). Задание размещено на гугл диске с материалом курса.
4 ак. ч.

Смешанное занятие №2: Аналитические запросы PostgreSQL  
+ ДЗ №2

- Аналитические запросы MySQL
- функции для построения аналитических запросов
Практика:
использование аналитических функций для расчёта продуктовых метрик 
 
Домашнее задание №2: Расчет метрик с помощью SQL - запросов
Рассчитать обозначенные преподателем значения
4 ак. ч.

Смешанное занятие №3: Знакомство с колоночными базами данных. ClickHouse.  
+ ДЗ №3


Знакомство с колоночными базами данных. ClickHouse
- Знакомство с  колоночными базами данных на примере ClickHouse. OLAP
- Тренируемся написании запросов, знакомимся с особенностями синтаксиса и существующими функциями.
Домашнее задание №3: Написание запросов ClickHouse
Знакомство с ClickHouse, отработка функций, изученных на занятии
4 ак. ч.

Смешанное занятие №4: Ведение в Python  


Введение в Python
Теория:
Установка Python и библиотек. Основные типы данных. Функции.
4 ак. ч.

Смешанное занятие №5: Работа с данными на языке программирования Python  
+ ДЗ №4 + ДЗ №5

Работа с данными на языке программирования Python:
получение данных из различных источников,
обработка сырых данных (дубликаты, пропуски, типы данных)
Практика: подключение К БД, работа с файлами, агрегация данных для последующего анализа.
 
Домашнее задание №4: Работа с данными на Python
--
Домашнее задание №5: Дополнительное ДЗ (На доп.,баллы)
- Проведение кластеризации методом отличным от того, что разобрали на лекции;
- Отрисовка метрик по гексагонам
4 ак. ч.

Смешанное занятие №6: Визуализация данных  
+ ДЗ №6

Работа с данными на яп Python (часть 2): визуализация данных. Знакомство с Tableu
 
Домашнее задание №6: Дашборд в Tableu
--
4 ак. ч.

Семинар №1: Работа над проектом  

Работа над проектом: Проведение исследовательского анализа данных (получение данных, обработка, визуализация)
4 ак. ч.

Смешанное занятие №7: Математическая статистика: основные статистические показатели и их применение в анализе данных  

Математическая статистика: основные статистические показатели и их применение в анализе данных
Работа над проектом: Проведение анализа данных с применением знаний основ описательной статистики и основных статистических показателей 
4 ак. ч.

Смешанное занятие №8: Математическая статистика: проверка статистических гипотез  
+ ДЗ №7

Определение статистической гипотезы, ошибок первого и второго рода, уровня значимости и т.д.
Разбор и написание кода статистических критериев (from scratch и с использованием популярных библиотек для проверки гипотез на python).
 
Домашнее задание №7: Реализация проверки гипотезы с помощью заданного преподавателем статистического критерия
--
4 ак. ч.

Смешанное занятие №9: Математическая статистика: проверка статистических гипотез (часть 2)  
+ ДЗ №8

Множественное сравнение
Практика: реализация критерия Стьюдента с поправками  Бонферрони и Холма-Бонферрони, критерия Крускала - Уоллиса
 
 
Домашнее задание №8: Реализация и сравнение поправок Бонферрони и Холма-Бонферрони
--
4 ак. ч.

Смешанное занятие №10: Продуктовые метрики, приоритезация и unit-экономика  

4 ак. ч.

Контрольное занятие №1: Защита проектов  

Защита финального проекта
4 ак. ч.

РАСПИСАНИЕ

Полное расписание