NLP-блок курса "Современный анализ данных" (ФКН НИУ ВШЭ), 2020
Занятие 1: Введение в автоматическую обработку текстов. Частотный анализ. Морфологический анализ.
Занятие 2: Дистрибутивная семантика. Модели word2vec и fastText. Классификация текстов.
Соревнование: https://www.kaggle.com/c/lenta-classification-2020/
Занятие 3: Снижение размерности в NLP. Тематические моделирование. Синтаксический парсинг.
Занятие 4: Языковые модели. Статистические и нейросетевые языковые модели.