Видео проигрыватель загружается.Воспроизвести видеоВоспроизвестиБез звукаТекущее время 0:00/Продолжительность 1:25Загрузка: 0.00%0:00Тип потока ОНЛАЙНSeek to live, currently behind liveОНЛАЙНОставшееся время -1:25 1xСкорость воспроизведения2x1.75x1.5x1.25x1x, выбрано0.75x0.5xГлавыГлавыОписанияОтключить описания, выбраноСубтитрынастройки субтитров, откроется диалог настройки субтитровСубтитры выкл., выбраноЗвуковая дорожкаPicture-in-PictureПолноэкранный режимThis is a modal window.Начало диалоговго окна. Кнопка Escape закроет или отменит окноТекстColorБелыйЧерныйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйФонColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйПрозрачныйОкноColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачныйПолупрозрачныйПрозрачностьРазмер шрифта50%75%100%125%150%175%200%300%400%Стиль края текстаНичегоПоднятыйПониженныйОдинаковыйТеньШрифтПропорциональный без засечекМоноширинный без засечекПропорциональный с засечкамиМоноширинный с засечкамиСлучайныйПисьменныйМалые прописныеСбросить сбросить все найстройки по умолчаниюГотовоЗакрыть модальное окноКонец диалогового окна.
В этом семинаре мы сделали несколько важных вещей. Во-первых, мы познакомились с одной из самых базовых моделей текста — методом мешка слов, а также, с одной из базовых моделей машинного обучения — логистической регрессией. Мы взяли эти две вещи и соединили для того, чтобы решить задачу тематической классификации текстов. Но, кроме того, мы рассмотрели все этапы подготовки текстов для того, чтобы подавать их в нейросети. А также рассмотрели некоторые универсальные компоненты, которые можно использовать для разных задач — не только для тематической классификации и даже не только для текстов. К таким базовым компонентам (или примитивам) можно отнести токенизацию, построение словаря, фильтрацию словаря, построение матрицы, использование pytorch Dataset, основной цикл обучения и валидации, выбор лучшей модели в процессе обучения и оценку качества. В следующих лекциях и семинарах мы будем использовать всю эту базу для того, чтобы решать более интересные задачи и использовать более интересные архитектуры. До новых встреч!

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.