Для решения мультимодальных задач (компьютерное зрение + обработка языка) необходима технология совместной обработки изображения и текста, связанного с ним. Выберите из списка ниже только мультимодальные задачи.
- Визуальные ответы на текстовые вопросы
- Генерация изображения по текстовому описанию
- Генерация текста ответа на естественном языке
- Генерация текстового описания по изображению
- Классификация визуальных данных
- Контроль диалога с доступом к источнику знаний по предмету
- Поиск изображения по текстовой подписи
- Представление текста в интерпретируемые машиной данные
- Преобразование текстовых данных в естественный язык
- Сегментация изображений
К сожалению, у нас пока нет статистики ответов на данный вопрос,
но мы работаем над этим.