Финансовый университет при правительстве РФ. Группа ИД22-4. Цель работы - создание хранилища данных для систем мониторинга энергопотребления. В качестве исходных данных я взял датасет о потреблении энергии в Нидерландах
- скопируйте репозиторий при помощи git clone.
- скачайте датасет.
curl -L -o ./dutch-energy.zip\ https://www.kaggle.com/api/v1/datasets/download/lucabasa/dutch-energy
- Распакуйте датасет в папку проекта.
- В mysql создайте базу данных я газа.
- создайте файл
.envс содержимым вида:
MYSQL_USER=имя_пользователя
MYSQL_PASSWORD=ваш_пароль
MYSQL_HOST=localhost
MYSQL_DATABASE=gas_db
PSQL_USER=etl_user
PSQL_PASSWORD=your_password
PSQL_HOST=localhost
PSQL_DATABASE=energy_data_vault- Создайте виртуальную среду и установите библиотеки:
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
- Запустите файл
preparation/populate_gas.pyдля заполнения БД mysql с данными о газе. - Запустите файл
preparation/fix_electricity_names.pyдля редактирования неправильно введенных имён в файлах об электричестве. - Для создания БД используйте запустите скрипт
preparation/create_DB.sqlоткройте его в текстовом редакторе и измените пароль для пользователя etl_user в 10 строке, после этого запустите скрипт.
psql -h localhost -U postgres -f preparation/create_DB.sql
- Запустите скрипт для создания таблиц схемы звезда:
psql -h localhost -U postgres -f preparation/create_star.sql
- Запустите скрипты по уровням звезды от бронзового до золотого