Допустим, Вы разрабатываете поисковую машину и в процессе разработки и отладки оцениваете качество работы алгоритма на некоторых примерах "запрос - текст - оценка сходства":
Запрос
Текст
Оценка сходства
Как прибрать квартиру быстро?
В этой статье мы рассмотрим, как быстро прибрать квартиру.
Высокое сходство
Как прибрать квартиру быстро?
Мошенники быстро решили прибрать к рукам бесхозную квартиру.
Низкое сходство
Какой набор методов обработки текста мог бы обеспечить правильную оценку сходства для приведённых примеров в Вашей поисковой машине?

  • Word Sense Disambiguation, оценка сходства по количеству общих смыслов
  • Лемматизация, оценка сходства по количеству общих слов
  • Синтаксический анализ и лемматизация, оценка сходства по количеству общих слов и словосочетаний
  • Стемминг, оценка сходства по количеству общих слов
Для просмотра статистики ответов нужно залогиниться.