К недостаткам простых методов векторизации (one hot encoding, мешок
слов) относятся:

  • Интуитивная понятность алгоритмов построения векторов
  • Неэффективное использование памяти
  • Потеря информации о смысле слова при переходе к
    цифровому представлению
  • Сложность реализации

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.