Какие способы векторизации текста могут лучше подойти для задачи классификации сообщений из Twitter?
При использовании N-грамм можно выделять N-граммы сразу нескольких длин (например, 3,4,5-граммы).
Выберите один или несколько вариантов ответа.
- N-граммы символов, бинарный вектор
- N-граммы символов, взвешивание по частоте
- N-граммы токенов, бинарный вектор
- N-граммы токенов, взвешивание по частоте
- Целые токены, бинарный вектор
- Целые токены, взвешивание по частоте
К сожалению, у нас пока нет статистики ответов на данный вопрос,
но мы работаем над этим.