>>1.00<<>>1.00<<Видео проигрыватель загружается.Воспроизвести видеоВоспроизвестиБез звукаТекущее время 0:00/Продолжительность 1:30Загрузка: 0.00%0:00Тип потока ОНЛАЙНSeek to live, currently behind liveОНЛАЙНОставшееся время -1:30 1xСкорость воспроизведения2x1.75x1.5x1.25x1x, выбрано0.75x0.5xГлавыГлавыОписанияОтключить описания, выбраноСубтитрынастройки субтитров, откроется диалог настройки субтитровСубтитры выкл., выбраноЗвуковая дорожкаPicture-in-PictureПолноэкранный режимThis is a modal window.Начало диалоговго окна. Кнопка Escape закроет или отменит окноТекстColorБелыйЧерныйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйФонColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйПрозрачныйОкноColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачныйПолупрозрачныйПрозрачностьРазмер шрифта50%75%100%125%150%175%200%300%400%Стиль края текстаНичегоПоднятыйПониженныйОдинаковыйТеньШрифтПропорциональный без засечекМоноширинный без засечекПропорциональный с засечкамиМоноширинный с засечкамиСлучайныйПисьменныйМалые прописныеСбросить сбросить все найстройки по умолчаниюГотовоЗакрыть модальное окноКонец диалогового окна.
Когда есть размеченная выборка или статистика посещений пользователя, есть возможность что-то обучить (например, градиентный бустинг или нейросеть). Сейчас постепенно набирают обороты попытки создать более человеческий интерфейс — например, человек может не задавать поисковый запрос как набор ключевых слов, вместо этого — писать текст на ему известном языке, задавать вопрос на естественном языке[1]. Например, "кто победил на прошлом чемпионате мира по футболу"? И система должна выдать непосредственно ответ на этот вопрос: например, "Франция". Для решения этой задачи нам нужна коллекция текстов, в которых мы будем искать ответы, а также желательно иметь обучающую выборку, то есть набор пар "вопрос" и "текст, вместе с отметками — где в этом тексте находится ответ".[2] Современные алгоритмы предназначены для поиска дословных ответов, то есть они не делают логический вывод. Если ответ встречается в тексте — они его выделяют, если нужно немного подумать — то лучше ничего не выделять. Мэйнстрим в этой области — нейросети.[4,5] Для них сейчас есть достаточно большие размеченные корпуса. Однако не стоит забывать и про классические методы[3] — глубокий лингвистический анализ и алгоритмы сопоставления графов. В ряде случаев они позволяют получить сопоставимое качество без обучающей выборки.
[1] Chen, Danqi, et al. "Reading Wikipedia to Answer Open-Domain Questions." Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2017.
[2] Rajpurkar, Pranav, et al. "SQuAD: 100,000+ Questions for Machine Comprehension of Text." Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. 2016.
[3] Gliozzo, Alfio, et al. "Semantic technologies in IBM watson." Proceedings of the fourth workshop on teaching NLP and CL. 2013.
[4] Shelmanov, A. O., et al. "Semantic-syntactic analysis for question answering and definition extraction." Scientific and Technical Information Processing 44.6 (2017): 412-423.
[5] Ferrucci, David, et al. "Building Watson: An overview of the DeepQA project." AI magazine 31.3 (2010): 59-79.
К сожалению, у нас пока нет статистики ответов на данный вопрос,
но мы работаем над этим.