Проект "Определение уровня английского для фильмов"

Описание проекта:

Необходимо определить, какой уровень английского языка представлен в фильме. Уровень английского языка определяется в соответствии с уровнем Oxford CEFR. Определение уровня осуществляется на основе субтитров к фильму.

Предоставленный датасет содержит 241 фильм с субтитрами и их уровням английского языка.Из соображений безопасности первоначальный датасет и субтитры не были загружены на GitHub.

Поскольку датасет относительно небольшой, было принято решение о его расширении. В конечном счете, объем выборки составил около 500 фильмов. Однако, стоит учесть, что порой оценки экспертов касательно уровня английского языка отдельного фильма могут не совпадать. Тем не менее, взяв во внимание, что на большей выборке модель может нивелировать погрешности, расширенную выборку решено было оставить.

План работы:

Предобработка данных
Выбор метрики
Создание модели
Анализ результатов
Сохранение модели

Решенные задачи:

Создана модель, которая на основе субтитров к фильму определяет уровень английского, необходимого на для его просмотра. Метрики качества моделей были f1-micro и f1-macro, которых удалось достичь 0.7857 и 0.7684 соответственно;
Реализовано веб-приложение, с помощью которого пользователь может загрузить субтитры и получить в ответ уровень английского языка, необходимого для просмотра запрашиваемого фильма.

Изображения веб-приложения:

Используемые библиотеки:

NLTK, Numpy, pandas, PyPDF2, pysrt, re, sklearn

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
Oxford_CEFR_level		Oxford_CEFR_level
movie_app		movie_app
English_notebook.ipynb		English_notebook.ipynb
README.md		README.md
main.pcl		main.pcl
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Проект "Определение уровня английского для фильмов"

Описание проекта:

План работы:

Решенные задачи:

Изображения веб-приложения:

Используемые библиотеки:

About

Releases

Packages

Languages

Midle68/movies_english_level

Folders and files

Latest commit

History

Repository files navigation

Проект "Определение уровня английского для фильмов"

Описание проекта:

План работы:

Решенные задачи:

Изображения веб-приложения:

Используемые библиотеки:

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages