Допустим, Вы разрабатываете поисковую машину и в процессе разработки и отладки оцениваете качество работы алгоритма на некоторых примерах "запрос - текст - оценка сходства":
Запрос
Текст
Оценка сходства
Как прибрать квартиру быстро?
В этой статье мы рассмотрим, как быстро прибрать квартиру.
Высокое сходство
Как прибрать квартиру быстро?
Мошенники быстро решили прибрать к рукам бесхозную квартиру.
Низкое сходство
Какой набор методов обработки текста мог бы обеспечить правильную оценку сходства для приведённых примеров в Вашей поисковой машине?
- Word Sense Disambiguation, оценка сходства по количеству общих смыслов
- Лемматизация, оценка сходства по количеству общих слов
- Синтаксический анализ и лемматизация, оценка сходства по количеству общих слов и словосочетаний
- Стемминг, оценка сходства по количеству общих слов
Для просмотра статистики ответов нужно
залогиниться.