Интерпретация шансов и соотношений шансов

08.09.2021

Отношения шансов и шансов являются важной мерой абсолютной / относительной вероятности того, что событие, представляющее интерес, произойдет, но их интерпретацию иногда немного сложно освоить. В этом коротком сообщении я опишу эти концепции (надеюсь) ясно.

От вероятности к разногласиям

Наша отправная точка - использование вероятности для выражения вероятности возникновения интересующего события. Таким образом, вероятность 0,1 или 10% риска означает, что вероятность того, что событие произойдет, составляет 1 из 10. Обычный способ мышления о вероятности состоит в том, что если бы мы могли повторить рассматриваемый эксперимент или процесс большое количество раз, доля экспериментов, в которых происходит событие, должна быть близка к вероятности (например, 0,1).

Вероятность возникновения интересующего события определяется как коэффициент = p / (1-p), где p - вероятность того, что событие произойдет. Таким образом, если p = 0,1, шансы равны 0,1 / 0,9 = 0,111 (повторяющиеся). Таким образом, здесь вероятность (0,1) и шансы (0,111) очень похожи. В самом деле, когда p мало, вероятность и шансы будут аналогичными. Это потому, что, когда p мало, 1-p приблизительно равно 1, так что p / (1-p) приблизительно равно p.

Но когда p не мало, вероятность и шансы, как правило, будут совершенно другими. Например, если p = 0,5, у нас есть коэффициент = 0,5 / 0,5 = 1. По мере увеличения p шансы становятся все больше и больше. Например, при p = 0,99 коэффициент = 0,99 / 0,01 = 99.

Дробные шансы и азартные игры

В частности, в мире азартных игр шансы иногда выражаются в виде дробей, чтобы облегчить умственные вычисления. Например, коэффициент 9: 1 против, обозначенный как «девять к одному против» и записанный как 9/1 или 9: 1, означает, что интересующее событие произойдет один раз на каждые 9 раз, когда событие не произойдет. То есть при 10 повторениях / повторениях мы ожидаем, что интересующее событие произойдет один раз, а событие не произойдет еще 9 раз. Использование коэффициентов для выражения вероятностей полезно в азартных играх, потому что оно позволяет легко подсчитать, сколько вы выиграете - с коэффициентом 9/1 вы выиграете 9 при ставке 1 (при условии, что ваша ставка будет хорошей!).

Отношения шансов

В мировой статистике отношения шансов часто используются для выражения относительной вероятности того, что событие произойдет в двух разных условиях. Например, в контексте клинического испытания, сравнивающего существующее лечение с новым лечением, мы можем сравнить шансы получить плохой результат, если пациент принимает новое лечение, с шансами получить плохой исход, если пациент принимает существующее лечение.

Предположим, что вероятность плохого исхода составляет 0,2, если пациент принимает существующее лечение, но что она снижается до 0,1, если он принимает новое лечение. Вероятность плохого исхода при существующем лечении составляет 0,2 / 0,8 = 0,25, в то время как вероятность неудачного исхода при использовании нового лечения составляет 0,1 / 0,9 = 0,111 (повторяется). Тогда отношение шансов при сравнении нового лечения со старым лечением представляет собой просто соответствующее отношение шансов: (0,1 / 0,9) / (0,2 / 0,8) = 0,111 / 0,25 = 0,444 (повторяющееся). Это означает, что вероятность плохого исхода, если пациент принимает новое лечение, составляет 0,444 шансов на плохой исход, если он принимает существующее лечение. Шансы (и, следовательно, вероятность) плохого исхода снижаются при принятии нового лечения. Мы также могли бы выразить сокращение, сказав, что шансы уменьшаются примерно на 56%, так как шансы уменьшаются в 0,444 раза.

Почему отношения шансов, а не отношения риска / вероятности?

Люди часто (я думаю, это вполне понятно) находят шансы, а следовательно, и отношение шансов, которые трудно интуитивно интерпретировать. Альтернативой является расчет отношений риска или вероятности. В примере клинического испытания коэффициент риска (вероятность прочтения) - это просто отношение вероятности плохого исхода при новом лечении к вероятности при существующем лечении, то есть 0,1 / 0,2 = 0,5. Это означает, что риск плохого исхода при новом лечении вдвое меньше, чем при существующем лечении, или, в качестве альтернативы, риск снижается вдвое. Интуитивно понять соотношение рисков намного проще. Итак, почему мы используем в статистике отношения шансов и разногласий?

Логистическая регрессия

Часто мы хотим сделать больше, чем просто сравнить две группы с точки зрения вероятности / риска / вероятности исхода. В частности, нас часто интересует подгонка статистических моделей, которые описывают, как вероятность возникновения интересующего события зависит от ряда ковариат или предикторов. Такие модели могут быть включены в семейство обобщенных линейных моделей. Самая популярная модель - логистическая регрессия, в которой используется функция логит-связи. Такой выбор функции связи означает, что параметры подобранной модели представляют собой логарифмические отношения шансов, которые в программном обеспечении обычно возведены в степень и представлены как отношения шансов. Функция логит-ссылки используется потому, что для двоичного результата это так называемая функция канонической ссылки, которая, не вдаваясь в подробности, означает, что она имеет определенные благоприятные свойства. Следовательно, при подборе моделей для бинарных результатовесли мы используем метод логистической регрессии по умолчанию, оцениваемые нами параметры являются отношениями шансов.

Альтернативой логистической регрессии является использование модели регрессии связи журнала, которая приводит к параметрам отношения рисков (log). К сожалению, исторически они страдали от числовых проблем при попытке подогнать их под данные (см. Статью по этому поводу). Однако существует также более фундаментальная проблема с регрессией связи журнала, поскольку связь журнала означает, что определенные комбинации значений ковариант могут привести к подобранным вероятностям за пределами диапазона (0,1).

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!