[go: up one dir, main page]

Skip to content

adenshulga/python_data_analysis_2021

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

Факультатив: Практика программирования на Python

Траектория: Анализ Данных

Для установки необходимых библиотек есть два возможных пути:

  1. Устанавливать каждую библиотеку по отдельности через команду медеженера пакетов PIP - pip install. Начиная с Python 3 >= 3.4, PIP уже установлен автоматически. Если по какой-то причине его нет - https://pip.pypa.io/en/stable/installing/

  2. Уставить дистрибутив Anaconda с наиболее популярными библиотеками для анализа данных - https://www.anaconda.com/distribution/ (при установке поставить "галочку" рядом с PATH)

  3. Основное рабочее пространство курса - Jupyter Notebook. Установить (conda/pip): https://jupyter.org/install

  4. Основное средство коммуникации курса - чат в Telegram

Для чего мне этот курс?

В какой бы сфере вам не пришлось работать, умение быстро и качественно анализировать большие объемы информации дает несомненное конкуретное преимущество.

Вот только несколько примеров профессиональных областей для которых анализ больших данных черезвычайно важен:

  1. Поиск (задачи ранжирования поисковой выдачи)
  2. Рекомендательные системы (рекомендации пользователям информации на основе их предпочтений)
  3. Ритейл (динамическое ценообразование, анализ покупок клиентов, управление остатками, гео-задачи на поиск оптимальных мест для открытия торговых точек)
  4. Банкинг (кредитный скоринг, анти-фрод, оптимизация портфеля ценных бумаг, выявление неявных связей между компаниями, оптимизация налично-денежного обращения)
  5. Телеком (прогноз оттока, next best action, оптимизация покрытия сети)
  6. Биоинформатика (предсказание структуры белка)
  7. и многое-многое другое :)

О курсе

  • 12 лекций / мастер-классов
  • 6-9 заданий по мотивам занятий

Программа курса

  1. Табличные данные (Pandas)
  2. Матричные вычисления (Numpy)
  3. Визуализация данных (Matplotlib, Plotly, Dash)
  4. Временные ряды (Pandas)
  5. Гео-данные (Folium, GeoPandas, PySAL)
  6. Текст (NLTK, WordCloud)
  7. Изображения (Skimage, OpenCV, Scipy)
  8. Аудио (Librosa, Scipy)
  9. Графы (NetworkX, Graphviz)
  10. Био-данные (BioPython)
  11. Парсинг данных (BeautifulSoup, Selenium, Scrapy)

Основной фокус курса

Python и данные.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%