>>1.00<<>>1.00<<Видео проигрыватель загружается.Воспроизвести видеоВоспроизвестиБез звукаТекущее время 0:00/Продолжительность 1:42Загрузка: 0.00%0:00Тип потока ОНЛАЙНSeek to live, currently behind liveОНЛАЙНОставшееся время -1:42 1xСкорость воспроизведения2x1.75x1.5x1.25x1x, выбрано0.75x0.5xГлавыГлавыОписанияОтключить описания, выбраноСубтитрынастройки субтитров, откроется диалог настройки субтитровСубтитры выкл., выбраноЗвуковая дорожкаPicture-in-PictureПолноэкранный режимThis is a modal window.Начало диалоговго окна. Кнопка Escape закроет или отменит окноТекстColorБелыйЧерныйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйФонColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачностьПолупрозрачныйПрозрачныйОкноColorЧерныйБелыйКрасныйЗеленыйСинийЖелтыйПурпурныйГолубойTransparencyПрозрачныйПолупрозрачныйПрозрачностьРазмер шрифта50%75%100%125%150%175%200%300%400%Стиль края текстаНичегоПоднятыйПониженныйОдинаковыйТеньШрифтПропорциональный без засечекМоноширинный без засечекПропорциональный с засечкамиМоноширинный с засечкамиСлучайныйПисьменныйМалые прописныеСбросить сбросить все найстройки по умолчаниюГотовоЗакрыть модальное окноКонец диалогового окна.
Давайте теперь рассмотрим многоклассовую задачу, когда нужно предсказывать одну метку из нескольких.[1] "c" — это количество различных классов, и оно больше 2. Логистическая регрессия подходит и для такого случая, но нам потребуется пара небольших изменений. Напомню — раньше формула была следующей. Во-первых, у нас теперь не вектор весов, а прямоугольная матрица. Количество строк в этой матрице соответствует количеству классов, а количество столбцов — количеству входных признаков. Во-вторых, на выходе модели у нас уже не одно число, а вектор. Этот вектор описывает распределение вероятностей принадлежности объекта "x" к одному из "c" классов. Чтобы получить на выходе распределение вероятностей, нам уже нужна другая функция активации. Обычно в таких случаях используют "софтмакс". Это вектор-функция, преобразующая вектор вещественных чисел из произвольного диапазона в вектор чисел от нуля до единицы, сумма которых всегда равна единице. Таким образом, значение этого вектора всегда удовлетворяет определению распределения вероятностей. Функцию потерь необходимо также немного поменять. Так как классы у нас взаимоисключающие, достаточно накладывать штраф только для ложно-отрицательных предсказаний. Когда yiy_iyi — единица, а y^i\hat y_iy^i близок к нулю, соответствующее слагаемое будет большим.
[1] Метод наибольшего правдоподобия - откуда можно вывести формулу BCE: https://en.wikipedia.org/wiki/Maximum_likelihood_estimation

К сожалению, у нас пока нет статистики ответов на данный вопрос, но мы работаем над этим.