Что такое стохастический градиентный спуск (SGD- Stochastic Gradient Descent)?

  • использует выборки (всего m) во всех наборах данных для обновления параметра веса на основе значения градиента в текущей точке.
  • случайным образом выбирает образец в наборе данных для обновления параметра веса на основе значения градиента в текущей точке.
  • сочетает в себе функции BGD и SGD и выбирает градиенты n выборок в наборе данных для обновления параметра веса.
Для просмотра статистики ответов нужно войти.