Какой из этапов предварительной обработки текстовых данных предполагает приведение текстовых токенов к нормальной форме (с учетом части речи) в целях уменьшения мощности словаря? лемматизация, регуляризация, стемминг, токенизация