Видео проигрыватель загружается.Воспроизвести видеоВоспроизвестиБез звукаТекущее время 0:00/Продолжительность 1:58Загрузка: 0.00%0:00Тип потока ОНЛАЙНSeek to live, currently behind liveОНЛАЙНОставшееся время -1:58 1xСкорость воспроизведения2x1.75x1.5x1.25x1x, выбрано0.75x0.5xГлавыГлавыОписанияОтключить описания, выбраноСубтитрынастройки субтитров, откроется диалог настройки субтитровСубтитры выкл., выбраноЗвуковая дорожкаPicture-in-PictureПолноэкранный режимThis is a modal window.Начало диалоговго окна. Кнопка Escape закроет или отменит окноТекстColorБелыйЧерныйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйФонColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйПрозрачныйОкноColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачныйПолупрозрачныйПрозрачностьРазмер шрифта50%75%100%125%150%175%200%300%400%Стиль края текстаНичегоПоднятыйПониженныйОдинаковыйТеньШрифтПропорциональный без засечекМоноширинный без засечекПропорциональный с засечкамиМоноширинный с засечкамиСлучайныйПисьменныйМалые прописныеСбросить сбросить все найстройки по умолчаниюГотовоЗакрыть модальное окноКонец диалогового окна.
Перейдём к оценке качества модели, которая использует наши свёртки. Видим, что она достигает f-меры 0.91, таким образом мы видим, что мы свёртки реализовали правильно, модели работает, всё отлично. Давайте подытожим. В этом семинаре мы рассмотрели, как можно применять свёрточные нейросети для обработки текстов. Мы описали базовую архитектуру — свёрточный ResNet, а также применили её в разных ситуациях для анализа контекста символов и для анализа контекста токенов. Демонстрировали мы работу свёрточной нейросети на задаче предсказания частей речи токенов. Эта задача относится к области лингвистического анализа, то есть анализа структуры текстов. Основная сложность в этой задаче, обычно, заключается в том, чтобы правильно определять часть речи для омонимов, то есть для слов, которые пишутся одинаково, но, на самом деле, имеют разные части речи. Другая сложность заключается в том, чтобы правильно определять части речи для неизвестных слов, то есть каких-нибудь неологизмов или специальной редкой лексики (научной, например). В результате семинара мы увидели, что учёт контекста токенов действительно важен в определённых случаях, хотя, чаще всего, часть речи можно определить, просто посмотрев на само слово. Модели, которые мы обучили в этом семинаре — достаточно неплохие, хотя промышленные POS тэггеры работают с гораздо более высоким качеством (на уровне 0.97 f-мер). Кроме того, мы реализовали свёрточный модуль своими руками и убедились в том, что он работает. На этом на сегодня всё. Пока!
К сожалению, у нас пока нет статистики ответов на данный вопрос,
но мы работаем над этим.