Получение скорректированных коэффициентов распространенности из моделей логистической регрессии в перекрестных исследованиях

08.09.2021

Obtendo razões de random prevalentes de modelos de regressão logística em estudos transversais

La obtención de las prevalencias ajustadas a partir de los modelos de regresión logística en los estudios transversales

    Programa de Computação Científica, Fundação Oswaldo Cruz, Рио-де-Жанейро, Бразилия
    Instituto de Pesquisa Clínica Evandro Chagas, Fundação Oswaldo Cruz, Рио-де-Жанейро, Бразилия
    Departamento de Matemática e Estatística, Федеральный университет до Эстаду-ду-Рио-де-Жанейро, Рио-де-Жанейро, Бразилия

Аннотации

В последние десятилетия использование коэффициента эпидемиологической распространенности (PR) вместо отношения шансов обсуждалось в качестве меры связи в перекрестных исследованиях. В данной статье рассматриваются основные трудности использования статистических моделей для расчета PR: проблемы сходимости, доступность инструментов и несоответствующие предположения. Мы реализуем прямой подход к оценке PR из моделей бинарной регрессии на основе двух методов, предложенных Wilcosky & Chambless, и сравниваем с разными методами. Мы использовали три примера и сравнили грубую и скорректированную оценку PR с оценками, полученными с помощью лог-биномиальной регрессии Пуассона и отношения шансов распространенности (POR). PR, полученные с помощью прямого подхода, привели к значениям, достаточно близким к значениям, полученным с помощью лог-бинома и Пуассона,в то время как POR переоценил PR. Реализованная здесь модель показала следующие преимущества: отсутствие численной нестабильности; предполагает адекватное распределение вероятностей и доступен через статистический пакет R.

Коэффициент распространенности; Логистические модели; Поперечные исследования

Nas últimas décadas, tem sido discutido o uso da razão de prevalência (RP) ao invés da razão de random como a medida de associação a ser Estimada em estudos transversais. Discute-se as Principais Dificuldades no uso de modelos estatísticos para o cálculo da RP: problemas de convergência, disponibilidade de ferramentas e pressupostos não aprectados. O Objetivo deste estudo - это реализация для оценки RP com base em modelos logísticos binários baseados em dois métodos propostos por Wilcosky & Chamblers, e compare com outros métodos. Utilizou-se três exemplos e compare as Estimativas bruta e ajustada da RP obtidas pela função com as Estimativas obtidas pelos modelos log-binomial, Poisson e razão de random prevalente (RCP).Поскольку RP даёт значение proposta resultaram em valores próximos aos obtidos pelos modelos log-binomial e Poisson, ea RCP superestimou a RP. О способе, который реализован в настоящее время, используется в качестве преимуществ: нет данных о нестабильности числа; принять на себя распределение вероятностей адекватного; E está disponível no programa estatístico R.

; Razão de Prevalências; Modelos Logísticos; Estudos Transversais

En las últimas décadas, se ha discutido el uso de la razón de prevalencia (RP), en lugar del odds ratio como medida de asociación que se Estima en estudios transversales. Se analizan las Principales Dificultades en el uso de modelos estadísticos para el cálculo de la RP: issuesas de convergencia, disponibilidad de herramientas y supuestos no apropiados. El Objetivo es realizar un enfoque directo para Estimar la RP desde modelos logísticos binarios, basados ​​en dos métodos propuestos por Wilcosky y Chamblers y compararlos con otros métodos. Используйте 3 примера и сравните его с оценками, основанными на оценке и корректировке RP с оценками, полученными по лог-биномиальному, коэффициенту Пуассона и преваленсии (ОВП). Los RP obtenidos del enfoque directo dieron como resultado valores cercanos a los obtenidos mediante el log-binomial y de Poisson,mientras que la RCP sobreestimó la RP. Модель, которая используется в настоящее время, имеет важное значение: отсутствует числовое представление, имеется вероятность распространения и имеется доступное программное обеспечение в свободном доступе R.

Разон де Преваленсиас; Modelos Logísticos; Estudios Transversales

Вступление

За последние несколько десятилетий несколько авторов 1,2,3,4,5,6,7 1. Axelson O, Fredriksson M, Ekberg K. Использование соотношения распространенности и отношения шансов распространенности в качестве меры риска в поперечном разрезе. исследования. Оккуп Энвирон Мед 1994; 51: 574. попытались определить наиболее подходящую меру ассоциации для использования в поперечных исследованиях. Все согласны с тем, что отношение шансов распространенности (POR) является лишь хорошим приближением к коэффициенту распространенности (PR), когда интересующее событие является редким 8 8. Кляйнбаум Д.Г., Куппер Л.Л., Моргенштерн Х. Эпидемиологические исследования: принципы и количественные методы. Хобокен: Джон Уайли и сыновья; 1982 г. Логистическая регрессия - самая популярная статистическая модель, используемая для оценки POR, благодаря простоте интерпретации и вычислительной реализации. Однако, когда выбор меры ассоциации - PR,и интересующее событие не редкость, эта модель дает плохие оценки. В таких случаях несколько авторов предложили альтернативы моделям логистической регрессии для оценки истинного PR.

Lee & Chia 9 9. Ли Дж., Чиа К. Оценка коэффициентов распространенности для перекрестных данных: пример профессиональной эпидемиологии. Br J Ind Med 1993; 50: 861-2. были первыми авторами, которые использовали модели Кокса с модификацией Бреслоу (модель Бреслоу-Кокса) для оценки коэффициентов распространенности, но в исследовании стандартные ошибки и, следовательно, доверительные интервалы не были рассчитаны правильно. Поправка на стандартные ошибки, полученные с помощью моделей Кокса, уже была предложена 10 10. Lin D, Wei LJ. Надежный вывод для модели пропорциональных рисков Кокса. J Am Stat Assoc 1989; 84: 1074-8. , но не рассматривались. Баррос и Хираката 5 5. Баррос А.Дж., Хираката В.Н. Альтернативы логистической регрессии в поперечных исследованиях: эмпирическое сравнение моделей, которые непосредственно оценивают коэффициент распространенности. BMC Med Res Methodol 2003; 3:21.использовали тот факт, что модели Бреслоу-Кокса и Пуассона оценивают одинаковые эффекты 11 11. Клейтон Д., Хиллс М. Статистические модели в эпидемиологии. Оксфорд: издательство Оксфордского университета; 1993 г. и использовал модели регрессии Пуассона с устойчивой дисперсией для оценки PR. Zou 12 12. Zou G. Модифицированный подход регрессии Пуассона к проспективным исследованиям с бинарными данными. Am J Epidemiol 2004; 159: 702-6. опубликовали результаты моделирования, демонстрирующие надежность модели Пуассона с устойчивой дисперсией для оценки PR в таблицах 2 на 2. Основная проблема с использованием модели Пуассона для оценки PR заключается в неправильном использовании определенного распределения вероятностей подсчета для описания дихотомической переменной ответа (наличие или отсутствие результата).Оксфорд: издательство Оксфордского университета; 1993 г. и использовал модели регрессии Пуассона с устойчивой дисперсией для оценки PR. Zou 12 12. Zou G. Модифицированный подход регрессии Пуассона к проспективным исследованиям с бинарными данными. Am J Epidemiol 2004; 159: 702-6. опубликовали результаты моделирования, демонстрирующие надежность модели Пуассона с устойчивой дисперсией для оценки PR в таблицах 2 на 2. Основная проблема с использованием модели Пуассона для оценки PR заключается в неправильном использовании определенного распределения вероятностей подсчета для описания дихотомической переменной ответа (наличие или отсутствие результата).Оксфорд: издательство Оксфордского университета; 1993 г. и использовал модели регрессии Пуассона с устойчивой дисперсией для оценки PR. Zou 12 12. Zou G. Модифицированный подход регрессии Пуассона к проспективным исследованиям с бинарными данными. Am J Epidemiol 2004; 159: 702-6. опубликовали результаты моделирования, демонстрирующие надежность модели Пуассона с устойчивой дисперсией для оценки PR в таблицах 2 на 2. Основная проблема с использованием модели Пуассона для оценки PR заключается в неправильном использовании определенного распределения вероятностей подсчета для описания дихотомической переменной ответа (наличие или отсутствие результата).опубликовали результаты моделирования, демонстрирующие надежность модели Пуассона с устойчивой дисперсией для оценки PR в таблицах 2 на 2. Основная проблема с использованием модели Пуассона для оценки PR заключается в неправильном использовании определенного распределения вероятностей подсчета для описания дихотомической переменной ответа (наличие или отсутствие результата).опубликовали результаты моделирования, демонстрирующие надежность модели Пуассона с устойчивой дисперсией для оценки PR в таблицах 2 на 2. Основная проблема с использованием модели Пуассона для оценки PR заключается в неправильном использовании определенного распределения вероятностей подсчета для описания дихотомической переменной ответа (наличие или отсутствие результата).

Сков и др. 4 4. Сков Т., Дедденс Дж., Петерсен М., Эндаль Л. Соотношения распространенности: оценка и проверка гипотез. Int J Epidemiol 1998; 27: 91-5. использовали обобщенную линейную модель с биномиальным распределением и лог-связью (лог-биномиальная модель) для прямой оценки PR 13. 13. Вахолдер С. Биномиальная регрессия в GLIM: оценка соотношений рисков и различий в рисках. Am J Epidemiol 1986; 123: 174-84. . Хотя эта модель позволяет напрямую оценивать PR и предполагает распределение вероятностей, которое согласуется с типом переменной отклика, отсутствие сходимости при наличии непрерывных переменных остается проблемой. Чтобы решить эту проблему, Deddens et al. 6 6. Дедденс Дж. А., Петерсен М. Р., Лей X. Оценка коэффициентов распространенности, когда PROC GENMOD не сходится. В: Материалы 28-й ежегодной международной конференции SAS Users Group. Кэри:SAS Institute Inc .; 2003. с. 270-328. представил метод COPY для поиска приближения к MLE, когда лог-биномиальная модель не может сходиться. Из-за проблемы сходимости лог-биномиальной модели Schouten et al. 14 14. Schouten E, Dekker J, Kok F, Cessie S, van Houwelingen H, Pool J, et al. Оценка соотношения риска и соотношения частоты в случае когортного дизайна: артериальная гипертензия и сердечно-сосудистая смертность. Stat Med 1993; 12: 1733-45. предложил простую обработку данных, которая позволяет использовать логистическую регрессию для получения PR. Он заключается в изменении набора данных путем дублирования строк, в которых происходит событие, и замены результата с события на не-событие 14,15,16 14. Скоутен Э., Деккер Дж., Кок Ф., Сесси С., ван Хаувелинген Х., Пул Дж. , и другие. Оценка соотношения рисков и соотношения ставок в планах случай-когорта:артериальная гипертензия и сердечно-сосудистая смертность. Stat Med 1993; 12: 1733-45. .

Другой подход - предложен Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. , используя условный и маргинальный методы 18 18. Lane PW, Nelder JA. Ковариационный анализ и стандартизация как примеры прогнозирования. Биометрия 1982; 38: 613-21. - включает прямую корректировку эпидемиологических показателей посредством бинарной регрессии. Преимущество этих методов состоит в том, что они предполагают распределение вероятностей для переменной с биномиальным откликом, соответствующее природе наблюдаемой переменной отклика в поперечных исследованиях. Мы находим одну статью 19 19. Souza CL, Carvalho FM, Araújo TM, Reis EJFB, Lima VMC, Porto LA. Fatores associados a patologias de pregas vocais em Professores. Преподобный Сауде Публика 2011; 45: 914-21.который использует метод Wilcosky & Chambless 17 для оценки PR, но не упоминает программную реализацию. Недавно команда R Core разработала программный пакет на языке R (пакет R версии 1.2; The R Foundation for Statistical Computing, Вена, Австрия; http://www.r-project.org) для оценки предельных и условных PR и доверительных интервалов с помощью бутстрап и дельта методы, но они еще не опубликовали научную статью, объясняющую детали этого пакета и различия между методами, которые он использует для оценки PR.org) для оценки предельных и условных PR и доверительных интервалов с помощью методов начальной загрузки и дельты, но они еще не опубликовали научную статью, объясняющую детали этого пакета и различия между методами, которые он использует для оценки PR.org) для оценки предельных и условных PR и доверительных интервалов с помощью методов начальной загрузки и дельты, но они еще не опубликовали научную статью, объясняющую детали этого пакета и различия между методами, которые он использует для оценки PR.

В этой статье мы используем прямой подход для оценки коэффициента распространенности из моделей бинарной регрессии на основе методов, предложенных Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. , и мы сравниваем результаты с результатами, полученными с помощью различных методов, представленных в литературе. Для иллюстрации нашего исследования используются три разных набора данных.

Методы

На основе подхода, предложенного Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. мы используем реальные и смоделированные данные для сравнения оценок PR, полученных маржинальным и условным методами. Эти оценки также сравниваются с оценками, полученными с помощью биномиальных, лог-биномиальных и робастных моделей Пуассона / Кокса.

Используя логистическую модель, легко оценить вероятность возникновения заболевания (указанная распространенность в трансверсальных исследованиях) с поправкой на две или более переменных. Предположим, например, что у вас есть информация о статусе диабета (1: да / 0: нет), возрасте (постоянно) и статусе ожирения (1: да / 0: нет) определенной популяции. Имея эту информацию, можно получить скорректированную вероятность диабета с помощью следующего уравнения:

где P - вероятность того, что ДИАБЕТ = 1, β 0 , β 1 , β 2 - коэффициенты регрессии, оцененные по данным. Обратите внимание, что exp (β 2 ) оценивает отношение шансов диабета у людей с ожирением по сравнению с людьми без ожирения с поправкой на возраст. Однако, если мы заинтересованы в получении оценочного PR для диабета, скорректированного по возрасту, у людей с ожирением и без ожирения, мы можем действовать двумя способами, как описано ниже:

1) Маргинальный метод: в каждой страте переменной ЖИРНОСТЬ (да или нет) распространенность диабета рассчитывается для каждого значения возраста, включенного в набор данных, с использованием уравнения 1. PR - это соотношение между средним значением распространенности в каждой страте. Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. назовите эту оценку коэффициентом предельной распространенности (MPR);

2) Условный метод: в каждом слое переменной ОЖИРЕНИЕ распространенность диабета рассчитывается с использованием уравнения 1, устанавливая возраст как среднее значение, полученное из набора данных. Таким образом, можно рассчитать соотношение двух распространенностей. Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. называют эту оценку условным коэффициентом распространенности (CPR).

В модели линейной регрессии оба метода оценивают одно и то же значение. Однако в модели логистической регрессии мы наблюдали значительные различия между оценками двух методов, когда p близко к нулю или единице.

Согласно Lee & Chia 9 9. Ли Дж., Чиа К. Оценка коэффициентов распространенности для перекрестных данных: пример из профессиональной эпидемиологии. Br J Ind Med 1993; 50: 861-2. , маржинальный метод обеспечивает внутренне скорректированную меру, делая недействительными любые сравнения с внешними значениями PR. С другой стороны, с условным методом можно использовать значения по умолчанию в качестве средних значений ковариат, что позволяет проводить сравнения с другими популяционными исследованиями, в которых использовались те же значения по умолчанию. Более подробную информацию о маржинальных и условных методах можно найти в Lee 20 20. Ли Дж. Ковариационная корректировка ставок на основе модели множественной логистической регрессии. J Chronic Dis 1981; 34: 415-26. и Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей.J Chronic Dis 1985; 38: 849-56. .

Асимптотические доверительные интервалы для отношений условной и предельной распространенности были предложены Flanders & Rhodes 21 21. Flanders WD, Rhodes PH. Доверительные интервалы большой выборки для стандартизированных по регрессии рисков, соотношений рисков и различий рисков. J Chronic Dis 1987; 40: 697-704. . Авторы также представили сценарий SAS (SAS Inc., Кэри, США) для оценки и расчета интервалов отношения условной и предельной распространенности. Насколько нам известно, на сегодняшний день это была единственная реализация этих мер.

Методы оценки коэффициента распространенности проиллюстрированы в трех различных базах данных, каждая из которых содержит двоичный результат Y, двоичный результат воздействия X и, по крайней мере, одну контрольную переменную Z.

Приложение 1: первая база данных была игрушечным примером с 1000 смоделированными наблюдениями и одной непрерывной контрольной переменной. В этом примере мы смоделировали 1000 бинарных исходов с двоичным воздействием, X, и непрерывной смешивающей переменной, Z. Воздействие было выбрано из распределения Бернулли с вероятностью 0,5, смешивающая переменная была выбрана из нормального распределения со средним нулем и единицей измерения. дисперсия. Результат был выбран из распределения Бернулли с такими вероятностями, что: исходная распространенность составляла 20%; коэффициент условной распространенности для X при Z = 0 был равен 2; а коэффициент условной распространенности для X при Z = 1 был равен 1,919 (коэффициент регрессии β 2 = 0,20). Было несколько возможных значений коэффициента условной распространенности для X в зависимости от Z.

Приложение 2: вторая база данных относится к когорте из 1273 живорожденных в 1993 году в городе Пелотас, Риу-Гранди-ду-Сул, Бразилия, и исследована с целью увязать социально-демографические факторы и репродуктивное здоровье, проинформированные ответственной женщиной, с питанием. состояние их детей после 4-5 лет 5 5. Баррос А.Дж., Хираката В.Н. Альтернативы логистической регрессии в поперечных исследованиях: эмпирическое сравнение моделей, которые непосредственно оценивают коэффициент распространенности. BMC Med Res Methodol 2003; 3:21. . Анализ рассматривал недостаточную массу тела у детей 4-5 лет (с распространенностью 4,1%) как интересующий результат, Y; предыдущая госпитализация как экспозиция, X; и вес при рождении (нормальный или низкий вес при рождении) в качестве контрольной переменной Z. Для этого приложения, поскольку все переменные являются двоичными,мы смогли рассчитать коэффициент распространенности, используя метод Мантеля-Хензеля, который здесь считается золотым стандартом.

Приложение 3: третья база данных проанализировала 703 сексуально активных, ВИЧ-инфицированных женщины, лечившихся в период с 1996 по 2007 год в Рио-де-Жанейро, Бразилия, без гистерэктомии в анамнезе. Данные были собраны для оценки факторов, связанных с плоскоклеточными интраэпителиальными поражениями высокой степени (HSIL), поражениями, которые могут перерасти в рак шейки матки 22 22. Луз П., Веласк Л., Фридман Р., Руссомано Ф., Андраде А., Морейра Р. , и другие. Цитологические аномалии шейки матки и факторы, связанные с плоскоклеточными интраэпителиальными поражениями высокой степени у ВИЧ-инфицированных женщин из Рио-де-Жанейро, Бразилия. Int J STD AIDS 2012; 23: 12-7. . В анализ были включены пять переменных, относящихся к ВИЧ-инфицированным женщинам: наличие ВПЧ было переменной воздействия, X; исходом было наличие цитологических аномалий шейки матки, Y; а контрольными переменными Z был возраст,количество беременностей и время с момента последнего гинекологического осмотра. Переменные X и Y были двоичными переменными, а остальные - непрерывными. Распространенность исхода составила 4,1%.

Скорректированные коэффициенты распространенности и отношения шансов распространенности были оценены несколькими различными методами. Коэффициенты распространенности оценивались с помощью робастных моделей Пуассона и лог-биномиальных моделей, а также условных и маргинальных методов, предложенных Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. . POR также рассчитывался с использованием обычной модели логистической регрессии.

Различные методы получения коэффициентов распространенности были закодированы в R (Фонд R для статистических вычислений, Вена, Австрия; http://www.r-project.org). Функция R для оценки отношений условной и предельной распространенности, предложенная Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. , доступен (рисунок 1).

Результаты

Приложение 1: пример игрушки

В таблице 1 представлены оценки, полученные с помощью различных методов, для коэффициента распространенности переменной X. Истинный коэффициент распространенности зависит от Z, который соответствует стандартному нормальному распределению. Следовательно, истинный коэффициент условной распространенности колеблется от 1,71 до 2,25 для Z от -1,96 до 1,96. Общий коэффициент распространенности (1,477) недооценивает этот диапазон истинного коэффициента распространенности, тогда как грубое и скорректированное отношение шансов распространенности (2,528 и 2,537) завышают истинный диапазон (хотя их доверительные интервалы частично совпадают с истинным диапазоном) (Таблица 1 ). Все скорректированные коэффициенты распространенности очень похожи и дают разумные оценки (Таблица 1). Оценки различаются только вторым или третьим десятичными знаками с наименьшим оценочным значением в лог-биномиальной модели и наибольшим в условном соотношении распространенности.

Приложение 2: недостаточный вес у детей 4-5 лет в Пелотасе.

В таблице 2 представлен скорректированный коэффициент распространенности возникновения недостаточной массы тела у детей в возрасте 4–5 лет (исход) в результате предыдущей госпитализации (воздействия), контролируемой массой тела при рождении (нормальная или низкая масса тела при рождении).

Несмотря на низкую распространенность результата (4,1%), наблюдалась разница в 0,169 между грубым PR (2,902) и необработанным POR (3,071) для предыдущей госпитализации. Согласно приблизительному PR, среди детей, которые ранее были госпитализированы, была более распространена недостаточная масса тела по сравнению с детьми, не госпитализированными ранее. Скорректированные коэффициенты распространенности лог-биномиального, робастного Пуассона, предельного коэффициента распространенности и метода Мантеля-Хензеля дали аналогичные оценки (2,481, 2,479, 2,460 и 2,483, соответственно). Самыми крупными скорректированными оценками были POR (2,641) и коэффициент условной распространенности (2,532).

Приложение 3: цитологические аномалии шейки матки у ВИЧ-инфицированных женщин.

В таблице 3 показано влияние ВПЧ высокого риска (экспозиции) на возникновение цитологических аномалий шейки матки у ВИЧ-инфицированных женщин с учетом возраста, количества беременностей и времени, прошедшего с момента последнего гинекологического осмотра. Несмотря на низкую распространенность, сырой POR (7,909) отличался от сырого PR (7,360) на 0,6. У женщин с ВПЧ высокого риска было на 640% больше цитологических аномалий. Скорректированный POR был наивысшим расчетным значением (7,990). Скорректированные коэффициенты распространенности, полученные с помощью лог-биномиального надежного подхода Пуассона и коэффициента предельной распространенности, были очень похожими. Метод условной распространенности привел к соотношению на 46% выше, чем полученное с помощью других скорректированных методов.

Обсуждение

В последние годы ряд авторов исследовали трудности с получением коэффициентов распространенности в поперечных исследованиях. Некоторые авторы используют стратегии для косвенного расчета PR с использованием моделей Бреслоу-Кокса и Пуассона (с устойчивой дисперсией и без нее), в то время как другие интерпретируют отношение шансов распространенности, полученное в моделях логистической регрессии, как отношение распространенности.

Lee & Chia 9 9. Ли Дж., Чиа К. Оценка коэффициентов распространенности для перекрестных данных: пример профессиональной эпидемиологии. Br J Ind Med 1993; 50: 861-2. были первыми авторами, которые обсудили предложенные методы оценки PR. До этого в большинстве перекрестных исследований в области здравоохранения использовалась оценка модели логистической регрессии (POR), поскольку она имеет то преимущество, что она позволяет вносить поправки на искажающие или модифицирующие эффекты других переменных. Однако, когда результат преобладает, POR является плохой оценкой коэффициента распространенности, превышая PR до 27 раз 23 23. Ли Дж. Отношение шансов или относительный риск для перекрестных данных ?. Int J Epidemiol 1994; 23: 201-3. .

Что касается оценки скорректированного коэффициента распространенности, в наших примерах лог-биномиальная модель, надежная модель Пуассона и коэффициент предельной распространенности дали аналогичные оценки. Коэффициент условной распространенности (CPR) отличался от других оценок, но все же был меньше скорректированного POR. CPR, предложенный Wacholder 13 13. Wacholder S. Биномиальная регрессия в GLIM: оценка соотношений рисков и различий рисков. Am J Epidemiol 1986; 123: 174-84. - коэффициент распространенности, зависящий от средних значений ковариат, однако можно поставить условие на любое значение смешивающих переменных (сценарий с более высоким или низким риском). Например, распространенность цитологических аномалий шейки матки у 703 ВИЧ-инфицированных женщин (Приложение 3) была оценена для тех женщин, которые имели ВПЧ высокого риска (X = 1), на основе их соответствующих значений для возраста,количество беременностей, время с момента последнего гинекологического осмотра (переменные Z) и среднее значение распространенности. Аналогичные расчеты были выполнены для тех женщин, которым не был поставлен диагноз ВПЧ высокого риска (X = 0). Более подробная информация об условных и маргинальных методах хорошо описана в Wacholder 13 и Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. .Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. .Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. .

Основное преимущество лог-биномиальных и робастных моделей Пуассона состоит в том, что они уже реализованы в наиболее популярных статистических пакетах. Недостатком лог-бинома является отсутствие правильной функции связи, что приводит к численной нестабильности в процессе оценки и приводит к проблемам сходимости. Метод COPY 6 6. Дедденс Дж. А., Петерсен М. Р., Лей X. Оценка коэффициентов распространенности, когда PROC GENMOD не сходится. В: Материалы 28-й ежегодной международной конференции SAS Users Group. Кэри: SAS Institute Inc .; 2003. с. 270-328. был предложен для достижения конвергенции с лог-биномиальной моделью, но этот метод доступен только в SAS, который является проприетарным программным обеспечением. Робастная модель Пуассона предполагает, что все события в базе данных произошли одновременно. Кроме того,Использование распределения Пуассона не подходит для моделирования двоичного результата 6. Однако важно подчеркнуть, что вероятность модели Пуассона использовалась только для получения уравнения оценки, а не для моделирования переменной двоичного отклика. Schouten et al. 14 14. Schouten E, Dekker J, Kok F, Cessie S, van Houwelingen H, Pool J, et al. Оценка соотношения риска и соотношения частоты в случае когортного дизайна: артериальная гипертензия и сердечно-сосудистая смертность. Stat Med 1993; 12: 1733-45. Этот подход может быть легко реализован в любом статистическом пакете, но при изменении базы данных он вносит дополнительную неопределенность, которую следует надлежащим образом рассматривать. Подход, использованный Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38:849-56. в отличие от лог-биномиальной модели не имеет проблем сходимости.

Одним из ограничений наших результатов является отсутствие «золотого стандарта» для выбора наилучшего метода, особенно при наличии непрерывной объясняющей переменной. В Приложении 2, где все независимые переменные были двоичными, в качестве «золотого стандарта» использовался метод Мантеля-Хензеля. Для этого приложения мы обнаружили, что коэффициент распространенности, оцененный с помощью лог-биномиальной модели, робастной модели Пуассона и коэффициента предельной распространенности, показал оценки, аналогичные тем, которые были получены с помощью метода Мантеля-Хензеля. Таким образом, мы заключаем, что в данном приложении применяется эквивалентность применяемых моделей. В этой статье мы не исследовали робастные методы, основанные на оценке квази-правдоподобия 15 15. Ламли Т., Кронмал Р., Ма С. Регрессия относительного риска в медицинских исследованиях: модели, контрасты, оценки и алгоритмы. Серия рабочих документов UW по биостатистике.(Рабочий документ 293). http://biostats.bepress.com/uwbiostat/paper293 (по состоянию на 20 июля 2013 г.).

http://biostats.bepress.com/uwbiostat/pa. .

Таким образом, мы рекомендуем использовать прямой подход, предложенный Wilcosky & Chambless 17 17. Wilcosky TC, Chambless LE. Сравнение прямой корректировки и корректировки регрессии эпидемиологических показателей. J Chronic Dis 1985; 38: 849-56. поскольку он подходит для двоичного ответа при использовании переменной биномиальной модели, у него нет проблем сходимости, и теперь он доступен в виде пакета для статистического программного обеспечения с открытым исходным кодом R. Оценки предельного коэффициента распространенности аналогичны оценкам других методов , а коэффициент условной распространенности показывает коэффициент распространенности для среднего человека в базе данных. Если вас интересует конкретный набор управляющих переменных, достаточно указать только значения этих переменных. Авторы разрабатывают пакет R с подходом Wilcosky & Chambless,который будет доступен вместе с этой статьей.

Авторы

LS Bastos участвовал в составлении функции R, редактировании литературы и написании статьи. RVC Oliveira и LS Velasque совместно работали над редактированием литературы и написанием статьи.

Благодарности

Авторы хотели бы поблагодарить исследователей Клаудио Стручинера и Франсиско Инасио Бастоса за их ценные предложения и Дэниела Стоукса за английский обзор.

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!