Привет, Эльбрусовец!
Поздравляю, ты прошёл(-ла) непростой путь и уже в понедельник начнётся твой путь самурая в Эльбрус Буткемп. Давай разберёмся с тем, что тебе необходимо сделать, чтобы быть во всеоружии к старту обучения:
1. 💻 Подготовка операционной системы
✅ Если у тебя MacOS - пропусти этот шаг, дополнительная настройка не требуется
Для наиболее производительной и комфортной работы рекомендуется использовать Unix-подобную операционную систему.
Рекомендуемый вариант: Полный переход на Ubuntu Linux
Установка Ubuntu LTS версии в качестве основной операционной системы обеспечит максимальную совместимость, производительность и стабильность при работе с инструментами разработки и Data Science.
Инструкций по установке огромное множество. Можно воспользоваться официальной инструкцией или вот этой на русском.
Основная рекомендация по установке заключается в выборе последней Long-term support (LTS) версии. Так вы сможете получить наиболее стабильную систему, проблем при установке библиотек машинного обучения в будущем с такой версией должно быть меньше всего.
Альтернативный вариант: Windows + WSL (Windows Subsystem for Linux)
Если полный переход на Linux для вас затруднителен, можно использовать WSL. Это позволяет запускать Linux окружение прямо в Windows без необходимости перезагрузки или виртуальных машин.
- Откройте PowerShell или командную строку от имени администратора
- Выполните команду:
wsl --install - Перезагрузите компьютер
- После перезагрузки Ubuntu установится автоматически
📑 Официальная документация Microsoft по установке WSL
2. 🔀 Git
Это система контроля версий. Вам она понадобится с первого дня работы. Работа с git-командами через терминал - это тот навык, который вам будет полезен. Но сначала будет достаточно уметь применять ряд простых команд и сценариев работы.
При чистой установке Ubuntu 22.04 git по умолчанию не поставляется, как и для macOS.
Можно проверить это в терминале (сочетание клавиш для Linux Ctrl + Alt + T, на macOS - ищите Terminal (но рекомендуем установить iTerm2 и использовать его) через Spotlight): напишите в новом окне git. Если терминал вам говорит, что такого пакета нет - идём его устанавливать.
Следуйте инструкции для вашей ОС (в случае macOS можно выбрать любой вариант, но Homebrew потребуется вам в будущем).
3. 🐙 GitHub
🎥 Видео по GitHub и настройке доступа
GitHub - это система управления версиями с социальной составляющей. В соцсети вы выкладываете фотографии, а тут исходный код. Это ещё и самая большая площадка для opensource проектов. Веб-сервис основан на системе контроля версий Git. Ну и конечно, вы можете сделать свою GitHub страницу своим резюме.
Для начала настроим доступ к репозиториям аккаунта.
- откройте терминал (
Ctrl + Alt + T) на своём компьютере и выполните ряд команд- обновление списков пакетов для обновлений
- установка пакета ssh
sudo apt update sudo apt-get install ssh
- далее мы запустим команды для генерации собственных SSH-ключей (ed25519 - это крипто-схема)
ssh-keygen -t ed25519 -C "подставь сюда свою почту, на которую регистрировался github и кавычки оставь"- нажми на Enter три раза (так проще, заполнять ответы/фразы не обязательно)
Теперь в корневой папке твоего компьютера есть скрытая папка .ssh (на Mac Command+Shift+.), внутри лежат два файла id_ed25519 и id_ed25519.pub. Первый - твой приватный ключ устройства, второй - публичный, его мы и будем использовать в качестве ключа на странице добавления публичных ключей в аккаунт GitHub.
- можно запустить команду чтения содержимого файла
cat .ssh/id_ed25519.pub, - выделить и скопировать из терминала через сочетание клавиш
Ctrl+Shift+C, содержимое публичного ключа (на Mac простоCommand+C) - копируем всю строку от включительно
ssh-ed25519 ...и до... ваша@почта.comвключительно - пора скопировать ключ на GitHub
- название
Titleможно задать любое, обычно такое, чтобы вам было понятно, о ключе с какого компьютера идёт речь
Когда ваша система уже настроена, получен и подключён SSH-ключ, вам ничего не мешает создать копию этого репозитория у себя в аккаунте. Нужно лишь нажать на кнопку Fork сверху справа на главной странице репозитория - https://github.com/Elbrus-DataScience/starter_pack
Теперь можно перейти на свою страницу с репозиториями https://github.com/USER?tab=repositories, здесь и далее USER – ваш ник в GitHub. Второй вариант - вы кликаете на фото профиля в правом верхнем углу и переходите во вкладку Your profile или Your repositories для доступа к странице аккаунта и репозиториев соответственно.
- переходим на страницу вашего форка (в поле ввода браузера должно быть
https://github.com/USER/starter_pack) - здесь нажимаем на зелёную кнопку Code
- выбираем вкладку SSH
- копируем ссылку на репозиторий (она должна быть такого вида:
git@github.com:USER/starter_pack.git)
📑 Инструкция по генерации ключа SSH
📑 Статья про fork на GitHub
4. 🐍 Conda
Окружения или виртуальные среды - они необходимы для корректной работы. Как правило, для каждого рабочего проекта создаётся своя изолированная среда/окружение, куда устанавливаются необходимые только для этого проекта пакеты/библиотеки, чтобы не возникало конфликтов разных версий библиотек и можно было корректно отслеживать перечень зависимостей для проекта.
В процессе обучения мы будем использовать conda для создания и управления окружениями Python. Это один из вариантов, например, здесь описана работа с окружениями другого инструмента - virtualenv. Можно использовать и его, но поговорим об этом ниже.
Conda - менеджер пакетов для Python. Как и pip - который используется по умолчанию.
Мы выбрали минимальную версию установщика conda, так называемую miniforge. Выбор пал на эту версию, т.к. при использовании этого варианта все пакеты работают корректно у всех, в том числе с процессорами Apple silicon. Тем самым воспроизводимость условий будет максимальна.
Для установки необходимо перейти на git репозиторий miniforge и скачать соответствующую версию установщика для своей операционной системы. Затем установить его. Ниже примеры для разных ОС.
Если у вас компьютер с процессором x86_64, а это в 99% случаев любой не Apple компьютер, то выбирайте эту версию для скачивания и следуй дальнейшим шагам:
-
скачайте по ссылке Miniforge3-Linux-x86_64, файл сохранится где-то в
Downloadsили вЗагрузки -
в терминале перейдите в папку, где сохранился файл, и запустите команды
chmod +x Miniforge3-Linux-x86_64.sh sh Miniforge3-Linux-x86_64.sh source ~/miniforge3/bin/activate -
если при перезапуске терминала после установки miniforge нет "префикса"
(base)перед именем пользователя, то чтобы всегда запускалась эта среда, можно открыть файл.bashrcи добавить в конце файла строкуsource ~/miniforge3/bin/activate -
проверить доступные вам среды можно по команде
conda env list, подробнее про управление средами в conda здесь
Если компьютер от Apple, необходимо уточнить соответствующую версию для вашего процессора и скачать нужный установщик miniforge
Дальше по аналогии с инструкцией по установке на Linux (меняем Miniforge3-Linux-x86_64.sh на название скачанного файла)
5. 📓 Jupyter notebook/lab
Один из основных инструментов работы, позволяющий разрабатывать и представлять результаты работы в Data Science. Использует интерактивный Python на локальном компьютере. Notebook - это "блокнот", который соединяет код и его визуализацию в ячейках - исполняемых и для разметки.
- Заходим сюда
- Выбираем версию либо notebook, либо lab и устанавливаем
6. 💻 VS Code
Visual Studio Code (VS Code) — это редактор кода для разных языков программирования.
В нём можно писать, форматировать и редактировать код на разных языках.
Это будет нашим основным инструментом, где мы будем писать код и делать проекты.
- Переходим на сайт
- Скачиваем пакет в зависимости от нужной ОС. Для Linux (Ubuntu/WSL) выбираем пакет
.deb - Устанавливаем
Откройте VS Code и пройдите по пути Files -> Auto Save.
Измените значение с «Off» на «afterDelay», задайте промежуток времени — и файлы будут автоматически сохраняться в заданный промежуток.
Jupyter
Расширение позволяет работать с файлами формата
.ipynb
ссылка на установку
Python Environment Manager
Расширение предоставляет удобный менеджер просмотра всех созданных окружений в Python
ссылка на установку
На этом установка необходимого ПО завершена. Необходимо переходить к инструкциям по настройке VS Code и использованию GitHub