Какой из этапов предварительной обработки текстовых данных предполагает приведение текстовых токенов к нормальной форме (с учетом части речи) в целях уменьшения мощности словаря?
- лемматизация
- регуляризация
- стемминг
- токенизация
Для просмотра статистики ответов нужно
войти.