Видео проигрыватель загружается.Воспроизвести видеоВоспроизвестиБез звукаТекущее время 0:00/Продолжительность 1:32Загрузка: 0.00%0:00Тип потока ОНЛАЙНSeek to live, currently behind liveОНЛАЙНОставшееся время -1:32 1xСкорость воспроизведения2x1.75x1.5x1.25x1x, выбрано0.75x0.5xГлавыГлавыОписанияОтключить описания, выбраноСубтитрынастройки субтитров, откроется диалог настройки субтитровСубтитры выкл., выбраноЗвуковая дорожкаPicture-in-PictureПолноэкранный режимThis is a modal window.Начало диалоговго окна. Кнопка Escape закроет или отменит окноТекстColorБелыйЧерныйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйФонColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйПрозрачныйОкноColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачныйПолупрозрачныйПрозрачностьРазмер шрифта50%75%100%125%150%175%200%300%400%Стиль края текстаНичегоПоднятыйПониженныйОдинаковыйТеньШрифтПропорциональный без засечекМоноширинный без засечекПропорциональный с засечкамиМоноширинный с засечкамиСлучайныйПисьменныйМалые прописныеСбросить сбросить все найстройки по умолчаниюГотовоЗакрыть модальное окноКонец диалогового окна.
Для того, чтобы компьютерная поддержка принятия решений работала и вообще имела смысл, необходимо составлять достаточно полные и актуальные базы фактов. Так уж сложилось, что в некоторых предметных областях значительная часть информации по-прежнему не публикуется в виде, пригодном для удобной обработки компьютерами, а публикуется, например, просто в текстах — например, новости. На помощь приходят методы извлечения структурированной информации. На вход методам даётся, в первую очередь, структура той информации, которую надо извлечь, а именно — набор полей и набор связей между ними. Это как схема базы данных. А также дан набор текстов, в которых факты точно содержатся, но представлены в неструктурированном виде. Пример такой области — это новости, или медицинские карты, в которых врач простым текстом описывает, что происходит, какое лечение, и так далее.[1] Соответственно, методы извлечения информации заполняют поля значениями, найденными в тексте.[2] Нам здесь подходят методы извлечения именованных сущностей и связей между ними — о них мы немножко говорили в разделе про лингвистический анализ. В основе таких методов часто лежат системы правил, сопоставление со словарями, лингвистический анализ, а также нейросети, но только когда есть достаточно большие размеченные коллекции текстов — от тысячи примеров на каждую сущность.[3,4,5,6,7,8,9,10]
[1] Peng, Fuchun, and Andrew McCallum. "Information extraction from research papers using conditional random fields." Information processing & management 42.4 (2006): 963-979.
[2] Surdeanu, Mihai, et al. "Stanford's distantly-supervised slot-filling system." (2011).
[3] Kelly, Liadh, et al. "Overview of the share/clef ehealth evaluation lab 2014." International Conference of the Cross-Language Evaluation Forum for European Languages. Springer, Cham, 2014.
[4] Mann, Gideon S., and David Yarowsky. "Multi-field information extraction and cross-document fusion." Proceedings of the 43rd annual meeting on association for computational linguistics. Association for Computational Linguistics, 2005.
[5] Ratner, Alexander J., et al. "Snorkel: Fast training set generation for information extraction." Proceedings of the 2017 ACM International Conference on Management of Data. ACM, 2017.
[6] Dernoncourt, Franck, Ji Young Lee, and Peter Szolovits. "NeuroNER: an easy-to-use program for named-entity recognition based on neural networks." Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing: System Demonstrations. 2017.
[7] Dalvi, Bhavana, et al. "IKE-an interactive tool for knowledge extraction." Proceedings of the 5th Workshop on Automated Knowledge Base Construction. 2016.
[8] Banko, Michele, et al. "Open information extraction from the web." Ijcai. Vol. 7. 2007
[9] Huang, Zhiheng, Wei Xu, and Kai Yu. "Bidirectional LSTM-CRF models for sequence tagging." arXiv preprint arXiv:1508.01991 (2015).
[10] Arkhipov, Mikhail Y., and Mikhail S. Burtsev. "Application of a hybrid Bi-LSTM-CRF Model to the task of Russian named entity recognition." Conference on Artificial Intelligence and Natural Language. Springer, Cham, 2017.
К сожалению, у нас пока нет статистики ответов на данный вопрос,
но мы работаем над этим.