Мы хотим натренировать сеть отвечать на вопросы по статьям с Википедии. Будем использовать для обучения датасет SQuAD (Stanford Question Answering Dataset). Какую информацию нужно подавать на вход нейросети во время обучения?
- Вопрос
- Несколько произвольных параграфов текста, не имеющих отношения к вопросу
- Параграф текста, по которому задается вопрос
- Правильный ответ на вопрос
К сожалению, у нас пока нет статистики ответов на данный вопрос,
но мы работаем над этим.