Что такое
векторизация текста?

  • Разделение текста на токены, приведение токенов к
    нижнему регистру и удаление стоп-слов
  • Формирование последовательностей на основе текста в
    виде n- грамм
    фиксированной длинны (векторов)
  • Формирование текста на основе его цифрового
    представления в виде векторов чисел
  • Формирования цифрового представления текста в виде
    вектора чисел
Для просмотра статистики ответов нужно войти.