Skip to content

Elbrus-DataScience/starter_pack

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 

Repository files navigation

👋 Welcome

Привет, Эльбрусовец!

Поздравляю, ты прошёл(-ла) непростой путь и уже в понедельник начнётся твой путь самурая в Эльбрус Буткемп. Давай разберёмся с тем, что тебе необходимо сделать, чтобы быть во всеоружии к старту обучения:

⚙️ Настройка рабочего окружения

1. 💻 Подготовка операционной системы

Если у тебя MacOS - пропусти этот шаг, дополнительная настройка не требуется

Для наиболее производительной и комфортной работы рекомендуется использовать Unix-подобную операционную систему.

🪟 Для пользователей Windows

Рекомендуемый вариант: Полный переход на Ubuntu Linux
Установка Ubuntu LTS версии в качестве основной операционной системы обеспечит максимальную совместимость, производительность и стабильность при работе с инструментами разработки и Data Science.

Установка Ubuntu:

Инструкций по установке огромное множество. Можно воспользоваться официальной инструкцией или вот этой на русском.

Основная рекомендация по установке заключается в выборе последней Long-term support (LTS) версии. Так вы сможете получить наиболее стабильную систему, проблем при установке библиотек машинного обучения в будущем с такой версией должно быть меньше всего.

Альтернативный вариант: Windows + WSL (Windows Subsystem for Linux)
Если полный переход на Linux для вас затруднителен, можно использовать WSL. Это позволяет запускать Linux окружение прямо в Windows без необходимости перезагрузки или виртуальных машин.

Установка WSL:

  1. Откройте PowerShell или командную строку от имени администратора
  2. Выполните команду:
    wsl --install
    
  3. Перезагрузите компьютер
  4. После перезагрузки Ubuntu установится автоматически

📑 Официальная документация Microsoft по установке WSL

⚠️ Обратите внимание: При использовании WSL возможны некоторые ограничения производительности и совместимости по сравнению с нативной установкой Ubuntu.

📚 Дополнительные материалы

2. 🔀 Git

2.1 📖 Что такое Git?

Это система контроля версий. Вам она понадобится с первого дня работы. Работа с git-командами через терминал - это тот навык, который вам будет полезен. Но сначала будет достаточно уметь применять ряд простых команд и сценариев работы.

2.2 💾 Установка Git

При чистой установке Ubuntu 22.04 git по умолчанию не поставляется, как и для macOS.
Можно проверить это в терминале (сочетание клавиш для Linux Ctrl + Alt + T, на macOS - ищите Terminal (но рекомендуем установить iTerm2 и использовать его) через Spotlight): напишите в новом окне git. Если терминал вам говорит, что такого пакета нет - идём его устанавливать.
Следуйте инструкции для вашей ОС (в случае macOS можно выбрать любой вариант, но Homebrew потребуется вам в будущем).

3. 🐙 GitHub

3.1 📖 Что такое GitHub?

🎥 Видео по GitHub и настройке доступа

GitHub - это система управления версиями с социальной составляющей. В соцсети вы выкладываете фотографии, а тут исходный код. Это ещё и самая большая площадка для opensource проектов. Веб-сервис основан на системе контроля версий Git. Ну и конечно, вы можете сделать свою GitHub страницу своим резюме.

3.2 🔐 Настройка доступа по SSH

Для начала настроим доступ к репозиториям аккаунта.

🐧 Пример для Linux (Ubuntu)

  • откройте терминал (Ctrl + Alt + T) на своём компьютере и выполните ряд команд
    • обновление списков пакетов для обновлений
    • установка пакета ssh
    sudo apt update    
    sudo apt-get install ssh    
    

🍎 Для macOS начинайте отсюда

  • далее мы запустим команды для генерации собственных SSH-ключей (ed25519 - это крипто-схема)
    ssh-keygen -t ed25519 -C "подставь сюда свою почту, на которую регистрировался github и кавычки оставь"
    
    • нажми на Enter три раза (так проще, заполнять ответы/фразы не обязательно)

Теперь в корневой папке твоего компьютера есть скрытая папка .ssh (на Mac Command+Shift+.), внутри лежат два файла id_ed25519 и id_ed25519.pub. Первый - твой приватный ключ устройства, второй - публичный, его мы и будем использовать в качестве ключа на странице добавления публичных ключей в аккаунт GitHub.

  • можно запустить команду чтения содержимого файла cat .ssh/id_ed25519.pub,
  • выделить и скопировать из терминала через сочетание клавиш Ctrl+Shift+C, содержимое публичного ключа (на Mac просто Command+C)
  • копируем всю строку от включительно ssh-ed25519 ... и до ... ваша@почта.com включительно
  • пора скопировать ключ на GitHub
  • название Title можно задать любое, обычно такое, чтобы вам было понятно, о ключе с какого компьютера идёт речь

3.3 ✅ Проверка настройки SSH или твой первый Fork

Когда ваша система уже настроена, получен и подключён SSH-ключ, вам ничего не мешает создать копию этого репозитория у себя в аккаунте. Нужно лишь нажать на кнопку Fork сверху справа на главной странице репозитория - https://github.com/Elbrus-DataScience/starter_pack

Теперь можно перейти на свою страницу с репозиториями https://github.com/USER?tab=repositories, здесь и далее USER – ваш ник в GitHub. Второй вариант - вы кликаете на фото профиля в правом верхнем углу и переходите во вкладку Your profile или Your repositories для доступа к странице аккаунта и репозиториев соответственно.

  • переходим на страницу вашего форка (в поле ввода браузера должно быть https://github.com/USER/starter_pack)
  • здесь нажимаем на зелёную кнопку Code
  • выбираем вкладку SSH
  • копируем ссылку на репозиторий (она должна быть такого вида: git@github.com:USER/starter_pack.git)

3.4 📚 Дополнительные материалы

📑 Инструкция по генерации ключа SSH
📑 Статья про fork на GitHub

4. 🐍 Conda

4.1 📖 Что такое Conda?

Окружения или виртуальные среды - они необходимы для корректной работы. Как правило, для каждого рабочего проекта создаётся своя изолированная среда/окружение, куда устанавливаются необходимые только для этого проекта пакеты/библиотеки, чтобы не возникало конфликтов разных версий библиотек и можно было корректно отслеживать перечень зависимостей для проекта.

В процессе обучения мы будем использовать conda для создания и управления окружениями Python. Это один из вариантов, например, здесь описана работа с окружениями другого инструмента - virtualenv. Можно использовать и его, но поговорим об этом ниже.

4.2 💾 Установка Conda

Conda - менеджер пакетов для Python. Как и pip - который используется по умолчанию.

Мы выбрали минимальную версию установщика conda, так называемую miniforge. Выбор пал на эту версию, т.к. при использовании этого варианта все пакеты работают корректно у всех, в том числе с процессорами Apple silicon. Тем самым воспроизводимость условий будет максимальна.

Для установки необходимо перейти на git репозиторий miniforge и скачать соответствующую версию установщика для своей операционной системы. Затем установить его. Ниже примеры для разных ОС.

🐧 Linux (Ubuntu / WSL)

Если у вас компьютер с процессором x86_64, а это в 99% случаев любой не Apple компьютер, то выбирайте эту версию для скачивания и следуй дальнейшим шагам:

  • скачайте по ссылке Miniforge3-Linux-x86_64, файл сохранится где-то в Downloads или в Загрузки

  • в терминале перейдите в папку, где сохранился файл, и запустите команды

    chmod +x Miniforge3-Linux-x86_64.sh
    sh Miniforge3-Linux-x86_64.sh
    source ~/miniforge3/bin/activate 
    
  • если при перезапуске терминала после установки miniforge нет "префикса" (base) перед именем пользователя, то чтобы всегда запускалась эта среда, можно открыть файл .bashrc и добавить в конце файла строку source ~/miniforge3/bin/activate

  • проверить доступные вам среды можно по команде conda env list, подробнее про управление средами в conda здесь

🍎 macOS

Если компьютер от Apple, необходимо уточнить соответствующую версию для вашего процессора и скачать нужный установщик miniforge
Дальше по аналогии с инструкцией по установке на Linux (меняем Miniforge3-Linux-x86_64.sh на название скачанного файла)

5. 📓 Jupyter notebook/lab

5.1 📖 Что такое Jupyter notebook/lab?

Один из основных инструментов работы, позволяющий разрабатывать и представлять результаты работы в Data Science. Использует интерактивный Python на локальном компьютере. Notebook - это "блокнот", который соединяет код и его визуализацию в ячейках - исполняемых и для разметки.

5.2 💾 Установка Jupyter notebook/lab

  1. Заходим сюда
  2. Выбираем версию либо notebook, либо lab и устанавливаем

📚 Дополнительные материалы

6. 💻 VS Code

6.1 📖 Что такое VS Code?

Visual Studio Code (VS Code) — это редактор кода для разных языков программирования.
В нём можно писать, форматировать и редактировать код на разных языках.
Это будет нашим основным инструментом, где мы будем писать код и делать проекты.

6.2 💾 Установка VS Code

  • Переходим на сайт
  • Скачиваем пакет в зависимости от нужной ОС. Для Linux (Ubuntu/WSL) выбираем пакет .deb
  • Устанавливаем

6.3 ⚙️ Оптимизация работы в VS Code

6.3.1 💾 Автосохранение

Откройте VS Code и пройдите по пути Files -> Auto Save.
Измените значение с «Off» на «afterDelay», задайте промежуток времени — и файлы будут автоматически сохраняться в заданный промежуток.

6.3.2 🔌 Расширения

Jupyter

Расширение позволяет работать с файлами формата .ipynb
ссылка на установку

Python Environment Manager

Расширение предоставляет удобный менеджер просмотра всех созданных окружений в Python
ссылка на установку

📚 Дополнительные материалы

✅ Итог

На этом установка необходимого ПО завершена. Необходимо переходить к инструкциям по настройке VS Code и использованию GitHub

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •