Предоставлен файл с сервера. Вам нужно спарсить его содержимое, создать базу данных под данные, вставить данные в базу данных, удаленно подключиться к базе данных и проанализировать данные.
Имеется книжный Интернет-магазин с простой структурой:
index.phtml - главная страница
|--catalog.phtml - сценарий просмотра каталога
|--search.phtml - сценарий поиска
|--addbasket.phtml?id_book=NN - сценарий добавления в корзину книги с номером NN
|--order.phtml - сценарий оформления заказа
Нам предоставили лог-файл с Web-сервера Apache с данными за месяц работы интернет-магазина access.log.
Необходимо выполнить следующее:
- Распарсить данные файла access.log используя python;
- Создать БД, используя СУБД Postgresql;
- Залить распарсенные данные в БД;
- Подключиться к БД через Python;
- Ответить на вопросы из списка ниже:
- Сколько посетителей было на сайте за месяц?
- Сколько в среднем посетителей бывает за час?
- Сколько посетителей сделало заказы?
- Сколько страниц просмотрел посетитель в среднем, максимум, минимум?
- Сколько времени прошло с момента входа на сайт до оформления заказа, в среднем, максимум, минимум?
- Сколько в среднем заказов оформляется за день?
- Имеются ли какие-то взаимозависимые товары, которые покупатель кладет в корзину (например, с уровнем поддержки выше 0.01 и достоверностью выше 0.6)? (Задача поиск ассоциативных правил).