ProbabilityTheoryModeling

Сборка и тесты

mkdir -p cmake-build-debug
cd cmake-build-debug
cmake ..
cmake --build .
ctest          # или ./bin/cpp_tests

Задание 1. Конечное вероятностное пространство и σ-алгебра

Реализовать конечное пространство исходов OutcomeSpace.
Реализовать класс Event (событие как подмножество Ω).
Реализовать ProbabilityMeasure, задающую вероятности атомов и событий.
Реализовать дискретную случайную величину DiscreteRandomVariable и вычисление ее математического ожидания.
Опционально: проверить, что набор событий образует σ-алгебру.

Ожидается, что можно:

Создать Ω (например, исходы броска кубика).
Задать события (чётные числа и т.п.).
Посчитать их вероятности и E[X] для простой X.

Задание 2. Распределения и моделирование

Есть базовый интерфейс Distribution с методами:
- Pdf(x) / Cdf(x)
- Sample(rng)
- теоретические Mean, Cariance
Реализовать/использовать распределения:
- Бернулли, биномиальное, геометрическое, Пуассон
- Нормальное, равномерное, экспоненциальное
- Коши, Лапласа (или другое «интересное» распределение)
Класс DistributionExperiment:
- сэмплирует N значений,
- считает выборочные среднее и дисперсию,
- сравнивает с теорией,
- может строить эмпирическую CDF и считать расстояние Колмогорова.

Ожидается, что можно:

Для каждого распределения провести эксперимент.
Убедиться, что выборочные характеристики приближаются к теоретическим.

Задание 3. Закон больших чисел

Класс LawOfLargeNumbersSimulator:
- принимает std::shared_ptr<Distribution>,
- моделирует одну траекторию выборочного среднего $\overline{X}_n = (X_1 + \dots + X_n)/n$ при $n = \text{step}, 2\text{step}, \dots$,
- возвращает вектор записей (n, sample_mean, |sample_mean - theoretical_mean|).

Ожидается, что можно:

Для разных распределений (Ber, Uniform, Exp, Laplace) показать численно, что $|\overline{X}_n - \mu|$ уменьшается при росте n.
Обсудить поведение для распределения, у которого матожидание не определено (Коши).

Задание 4. Цепи Маркова и генерация текста

Класс MarkovChain:
- состояния - строки (std::string),
- инкрементальное обучение по последовательностям состояний,
- хранение счётчиков переходов и оценка P(next | current),
- генерация цепочки заданной длины.
Класс MarkovTextModel:
- два режима токенизации: Character (символы) и Word (слова),
- trainFromText(text) - токенизировать и обучить цепь Маркова,
- generateText(num_tokens, rng, start_token) - сгенерировать текст.
Интеграционный тест:
- обучить word-level модель на «Войне и мире»,
- проверить размер словаря,
- убедиться, что типичные слова попали в модель,
- проверить, что генерация текста работает.

Ожидается, что можно:

Обучить Markov-модель на большом корпусе.
Генерировать текст в стиле корпуса.
Сравнить word- и char-модели.

Краткое резюме:

Задание 1: моделируем конечное Ω, события и вероятности.
Задание 2: реализуем и исследуем разные распределения.
Задание 3: показываем закон больших чисел на численных экспериментах.
Задание 4: строим цепь Маркова и генерируем текст (в т.ч. по «Войне и миру»).

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.github/workflows		.github/workflows
bin		bin
cmake		cmake
lib		lib
tests		tests
.clang-format		.clang-format
.clang-tidy		.clang-tidy
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
LICENSE		LICENSE
PrintOS.cmake		PrintOS.cmake
README.md		README.md
install.sh		install.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

ProbabilityTheoryModeling

Сборка и тесты

Задание 1. Конечное вероятностное пространство и σ-алгебра

Задание 2. Распределения и моделирование

Задание 3. Закон больших чисел

Задание 4. Цепи Маркова и генерация текста

About

Uh oh!

Releases

Packages

Languages

License

Gogobobo11/ProbabilityTheoryModeling

Folders and files

Latest commit

History

Repository files navigation

ProbabilityTheoryModeling

Сборка и тесты

Задание 1. Конечное вероятностное пространство и σ-алгебра

Задание 2. Распределения и моделирование

Задание 3. Закон больших чисел

Задание 4. Цепи Маркова и генерация текста

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages