Выберите все задачи лингвистического анализа, которые можно решать в два этапа:
выделение всех кандидатов (это могут быть слова, токены, сущности состоящие из нескольких слов)
обучение классификатора, принимающего пару кандидатов, и предсказывающего класс отношения между ними.
Попробуйте предположить и выбрать все варианты, где такая схема могла бы применяться, даже если в лекциях непосредственно такой вариант не упоминался.

  • POS-теггинг (снятие частеречной неоднозначности, т.е. выбор наиболее правдоподобного сочетания частей речи для токенов в предложении)
  • Извлечение именованных сущностей (англ. Named Entity Recognition: классификация токенов, классы соответствуют видам сущностей)
  • Извлечение отношений между сущностями внутри предложения (построение графа, описывающего отношения между упоминаемыми в предложении объектами)
  • Морфологический анализ (предсказание морфологических характеристик отдельных токенов)
  • Разрешение анафорических связей (англ. anaphora resolution: построение графа, в котором рёбра связывают референта и ссылающиеся на него местоимения или словосочетания; референт - некоторый объект, который может именоваться в тексте разными способами)
  • Семантический анализ (построение графа, описывающего высокоуровневую ситуацию - кто какое действие с чем выполняет, когда, почему и т.п.; в вершинах такого графа обычно находятся отдельные слова или фразы)
  • Синтаксический анализ (построение дерева, описывающего структуру фраз, грамматическое подчинение и согласование слов)

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.