Что такое прогнозируемая вероятность?

08.09.2021

Вы, наверное, задаетесь вопросом, чем предсказанная вероятностьотличается от нормальной вероятности. В конце концов, именно поэтому вы здесь. Ну, это связано с тем, как рассчитывается вероятность и что означают результаты. Что ж, прогнозируемая вероятность - это, по сути, в своей самой основной форме вероятность события, которая рассчитывается на основе доступных данных.

Основные прогнозы

На начальных этапах прогнозирования вероятности вы используете простые вероятности нескольких событий, происходящих в некоторой комбинации.

Взаимоисключающие события

Какова вероятность выпадения двух последовательных шестерок при использовании правильного кубика? В этом случае мы используем тот факт, что бросок справедливого кубика является взаимоисключающим событием.

Вероятность выпадения одной шестерки - 0,16. Следовательно, вероятность выпадения двух шестерок является произведением индивидуальных вероятностей.

Зависимые события

Вычисления для зависимых событий аналогичны расчетам для взаимоисключающих событий. Конечно, мы должны учитывать, как одно событие влияет на следующее.

Какова вероятность вытащить две из стандартной колоды карт без замены? Во-первых, вероятность вытянуть первого ферзя равна

Но вероятность вытянуть второго ферзя другая, потому что теперь осталось только три ферзя и 51 карта.

P (второй Q) = 3 ÷ 51 = 0,059

Вероятность по-прежнему является произведением двух вероятностей.

P (Q, Q) = 0,077 х 0,059 = 0,0045

Вероятность и регресс

До сих пор мы обсуждали вероятность возникновения единичных событий. Однако что, если вы хотите выяснить вероятность возникновения более сложных дополнительных событий? Например, вероятность бросить школу на основе социально-демографической информации, посещаемости и успеваемости. В этом случае у нас есть несколько индикаторов и дополнительных событий.

Один из способов расчета прогнозируемой вероятности таких бинарных событий (выпадение или невыпадение) - использование логистической регрессии. В отличие от обычной регрессии, результат вычисляет прогнозируемую вероятность возникновения взаимоисключающего события на основе нескольких внешних факторов.

Уравнение логистической регрессии:

Вы можете заметить, что логистические регрессии включают коэффициенты регрессии в качестве надстрочного индекса значения e . Это означает, что коэффициенты влияют на вероятность. Влияние на вероятность коэффициенты представляют собой шансы, а не простые числовые отношения.

Тот факт, что коэффициенты представляют собой отношения шансов, особенно полезен в свете того факта, что логистическая регрессия предсказывает вероятности, а не конкретный результат.

Вывод

Прогнозируемые вероятности довольно просты. Это вероятности, которые рассчитываются на основе существующих вероятностей, хотя метод зависит от природы задействованных вероятностей. Например, взаимоисключающие и дополнительные события предсказывают вероятность как произведение вероятностей событий, вероятность зависимых и дополнительных событий должна вычисляться как последовательность. Кроме того, логистическая регрессия - это метод прогнозирования вероятностей, основанный на более сложном взаимодействии переменных, хотя само уравнение регрессии представляет собой шансы, а не традиционные отношения наклона.

В целом, я с нетерпением жду ваших вопросов ниже. Удачной статистики!

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!