Какие способы векторизации текста могут лучше подойти для задачи классификации сообщений из Twitter?
При использовании N-грамм можно выделять N-граммы сразу нескольких длин (например, 3,4,5-граммы).
Выберите один или несколько вариантов ответа.

  • N-граммы символов, бинарный вектор
  • N-граммы символов, взвешивание по частоте
  • N-граммы токенов, бинарный вектор
  • N-граммы токенов, взвешивание по частоте
  • Целые токены, бинарный вектор
  • Целые токены, взвешивание по частоте

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.