Мы хотим натренировать сеть отвечать на вопросы по статьям с Википедии. Будем использовать для обучения датасет SQuAD (Stanford Question Answering Dataset). Какую информацию нужно подавать на вход нейросети во время обучения?

  • Вопрос
  • Несколько произвольных параграфов текста, не имеющих отношения к вопросу
  • Параграф текста, по которому задается вопрос
  • Правильный ответ на вопрос

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.