>>1.00<<>>1.00<<Видео проигрыватель загружается.Воспроизвести видеоВоспроизвестиБез звукаТекущее время 0:00/Продолжительность 1:20Загрузка: 0.00%0:00Тип потока ОНЛАЙНSeek to live, currently behind liveОНЛАЙНОставшееся время -1:20 1xСкорость воспроизведения2x1.75x1.5x1.25x1x, выбрано0.75x0.5xГлавыГлавыОписанияОтключить описания, выбраноСубтитрынастройки субтитров, откроется диалог настройки субтитровСубтитры выкл., выбраноЗвуковая дорожкаPicture-in-PictureПолноэкранный режимThis is a modal window.Начало диалоговго окна. Кнопка Escape закроет или отменит окноТекстColorБелыйЧерныйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйФонColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйПрозрачныйОкноColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачныйПолупрозрачныйПрозрачностьРазмер шрифта50%75%100%125%150%175%200%300%400%Стиль края текстаНичегоПоднятыйПониженныйОдинаковыйТеньШрифтПропорциональный без засечекМоноширинный без засечекПропорциональный с засечкамиМоноширинный с засечкамиСлучайныйПисьменныйМалые прописныеСбросить сбросить все найстройки по умолчаниюГотовоЗакрыть модальное окноКонец диалогового окна.
В этом видео мы поговорили о задаче преобразования последовательностей. В англоязычной литературе такие задачи обычно называют термином seq2seq. Это очень популярная задача, которая, в первую очередь, находит применение в машинном переводе в, диалоговых системах, в суммаризации (упрощённом пересказе) и многих других. В общем виде, архитектура состоит из энкодера и декодера. Однако, чтобы информация от энкодера лучше передавалась в декодер и вся схема лучше обучалась, часто между энкодером и декодером добавляют механизм внимания. В разное время были предложены разные архитектуры для энкодера и декодера, основанные на рекуррентных нейросетях, на свёрточных, а также на механизме внутреннего внимания (то есть, трансформер). Для декодирования последовательностей часто используется алгоритм лучевого поиска, который позволяет найти баланс между полностью жадным решением и полным перебором. Для того, чтобы модель генерировала разнообразные ответы, необходимо ограничивать её уверенность. Для этого используются разнообразные регуляризаторы или альтернативные функции потерь.

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.