Вычислите, сколько потребуется свёрточных слоёв с прореженными свёртками (dilation>1 в PyTorch) с ядром длины 5, чтобы учесть связь между первым словом в предложении и 30-м (при этом длина текста больше 30и слов!).
Начинать принято с dilation=1 (непрореженные свёртки) и увеличивать на каждом шаге в 2 раза: Dilation[layer]=2layerDilation[layer]=2layerDilation[layer]=2^{layer}, layer - номер слоя, начиная с 0.

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.