В прошлом примере мы делали что-то вроде:
test_loss_history.append(loss(test_preds, y_test).cpu())
На этот раз код выглядит так:
test_loss_history.append(loss(test_preds, y_test).data.cpu())
С учётом того, что всё работало, как вы думаете, что было не так?

list заканчивался -- нужно было класть в list, например, каждый 100-й объект
мы брали с cpu данные, которые на самом деле были на GPU
мы перепутали loss и accuracy
объект, который мы клали в list, хранил весь граф вычислений

Для просмотра статистики ответов нужно войти.