Для решения мультимодальных задач (компьютерное зрение + обработка языка) необходима технология совместной обработки изображения и текста, связанного с ним. Выберите из списка ниже только мультимодальные задачи.

  • Визуальные ответы на текстовые вопросы
  • Генерация изображения по текстовому описанию
  • Генерация текста ответа на естественном языке
  • Генерация текстового описания по изображению
  • Классификация визуальных данных
  • Контроль диалога с доступом к источнику знаний по предмету
  • Поиск изображения по текстовой подписи
  • Представление текста в интерпретируемые машиной данные
  • Преобразование текстовых данных в естественный язык
  • Сегментация изображений

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.