В прошлом примере мы делали что-то вроде:
test_loss_history.append(loss(test_preds, y_test).cpu())
На этот раз код выглядит так:
test_loss_history.append(loss(test_preds, y_test).data.cpu())
С учётом того, что всё работало, как вы думаете, что было не так?

  • list заканчивался -- нужно было класть в list, например, каждый 100-й объект
  • мы брали с cpu данные, которые на самом деле были на GPU
  • мы перепутали loss и accuracy
  • объект, который мы клали в list, хранил весь граф вычислений
Для просмотра статистики ответов нужно залогиниться.