rmsOverview: Обзор пакета rms

08.09.2021

rms - это пакет, который прилагается к книге "Стратегии моделирования регрессии". rms выполняет регрессионное моделирование, тестирование, оценку, проверку, графику, прогнозирование и набор, сохраняя расширенные атрибуты дизайна модели в подгонке. rms - это переписанная версия пакета Design с улучшенной графикой и очень небольшим дублированием кода в пакете Survival.

Пакет представляет собой набор из около 180 функций, которые помогают и упрощают моделирование, особенно для биостатистических и эпидемиологических приложений. Он также содержит функции для бинарных и порядковых моделей логистической регрессии и модель множественной регрессии Бакли-Джеймса для ответов с цензурой справа и реализует штрафную оценку максимального правдоподобия для логистических и обычных линейных моделей. rms работает практически с любой регрессионной моделью, но она была специально написана для работы с логистической регрессией, регрессией Кокса, моделями ускоренного времени отказа, обычными линейными моделями, моделью Бакли-Джеймса, обобщенными квадратами аренды для продольных данных (с использованием пакета nlme), обобщенные линейные модели и квантильная регрессия (с использованием пакета Quantreg). rms требует установки пакета Hmisc.Обратите внимание, что Hmisc имеет несколько функций, полезных для анализа данных (особенно сокращения данных и вменения).

Приведенные ниже предыдущие ссылки, относящиеся к пакету Design, относятся к rms.

Аргументы

Статистические методы реализованы

Обычные модели линейной регрессии

Бинарные и порядковые логистические модели (модели пропорциональных шансов и коэффициентов продолжения, пробит, логарифм, дополнительный логарифм, включая порядковые модели кумулятивной вероятности для непрерывного Y, эффективная обработка тысяч различных значений Y с использованием методов полного правдоподобия)

Байесовские модели бинарной и порядковой регрессии, модель частичных пропорциональных шансов и случайные эффекты

Параметрические модели выживаемости в классе ускоренного времени отказа

Модель линейной регрессии Бакли-Джеймса по методу наименьших квадратов с возможной цензурой справа

Обобщенная линейная модель

Обобщенный метод наименьших квадратов

Проверка модели начальной загрузки для получения объективных оценок производительности модели без необходимости отдельной проверочной выборки

Автоматические тесты Вальда всех эффектов в модели, которые не зависят от параметризации (например, тесты нелинейности основных эффектов, когда переменная не взаимодействует с другими переменными, тесты нелинейности эффектов взаимодействия, тесты на то, важен ли предиктор, либо как основной эффект или как модификатор эффекта)

Графическое изображение оценок модели (графики эффектов, графики отношения шансов / рисков, номограммы, которые позволяют получать прогнозы модели вручную, даже если в модели присутствуют нелинейные эффекты и взаимодействия)

Различные сглаженные графики остатков, включая несколько новых графиков остатков для проверки допущений порядковой логистической модели

Составление S функций для оценки линейного предиктора (\ (X \ hat \)), функция риска, функция выживаемости, функции квантилей аналитически из подобранной модели

Верстка подобранной модели с помощью LaTeX

Оценка робастной ковариационной матрицы (Huber или бутстрап)

Сплайны кубической регрессии с линейными хвостовыми ограничениями (естественные сплайны)

Взаимодействия не должны быть двояко нелинейными

Штрафная оценка максимального правдоподобия для моделей обычной линейной регрессии и логистической регрессии. Различные части модели могут подвергаться наказанию в разной степени, например, вы можете наказывать взаимодействие или нелинейные эффекты больше, чем основные эффекты или линейные эффекты.

Оценка отношения рисков или шансов при наличии нолинейности и взаимодействия

Анализ чувствительности для неизмеряемого двоичного конфаундера в двоичной логистической модели

Мотивация

rms была мотивирована следующими потребностями:

необходимо автоматически распечатать интересные тесты Вальда, которые могут быть построены на основе дизайна

тесты линейности по каждому предиктору

тесты линейности взаимодействий

объединенные тесты взаимодействия (например, все взаимодействия, связанные с расой)

объединенные тесты эффектов с эффектами более высокого порядка

тест основного эффекта не имеет смысла, когда эффект во взаимодействии

объединенный тест основного эффекта + эффект взаимодействия значим

тест взаимодействия 2-го порядка + любое взаимодействие 3-го порядка, содержащее эти факторы, имеет смысл

необходимо сохранить параметры преобразования с учетом

пример: расположение узлов для сплайновых функций

они «запоминаются» при получении прогнозов, в отличие от стандартных S или R

для категориальных предикторов сохраните уровни, чтобы для прогнозов создавались одни и те же фиктивные переменные; проверьте, что все уровни в прогнозах отсутствия данных присутствовали, когда модель была подогнана

необходимость в единообразном повторном добавлении наблюдений, удаленных из-за НК, при использовании прогнозирования без новых данных или при использовании остатка

нужно легко построить регрессионный эффект любого предиктора

Пример: возраст представлен линейным сплайном с узлами в 40 и 60 лет. Построить график влияния возраста на логарифмические шансы заболевания, приспосабливая взаимодействующие факторы к легко определяемым константам.

варьировать 2 предиктора: график x1 по оси x, отдельные кривые для дискретного x2 или трехмерный перспективный график для непрерывного x2

если предиктор представлен в модели как функция, графики должны быть относительно исходной переменной: f

log (холестерин) + возраст) график (Predict (f, cholesterol)) # холестерин по оси x, диапазон по умолчанию ggplot (Predict (f, cholesterol)) # то же самое с использованием ggplot2 plotp (Predict (f, cholesterol)) # то же самое напрямую используя сюжетно

необходимо хранить сводку распределения предикторов с подгонкой

пределы построения (по умолчанию: 10-е наименьшее, 10-е наибольшее значение или% -тили)

пределы эффекта (по умолчанию: 0,25 и 0,75 квантилей для непрерывных переменных).

значения корректировки для других предикторов (по умолчанию: медиана для непрерывных предикторов, наиболее частый уровень для категориальных)

дискретные числовые предикторы: пример списка возможных значений: x = 0,1,2,3,5 ->по умолчанию не строить прогноз при x = 4

значения относятся к самой внутренней переменной, например холестерин, а не к логарифму (хол.)

позволяет оценивать / строить графики спустя долгое время после удаления исходного набора данных

для моделей Кокса базовая выживаемость также сохраняется с подгонкой, поэтому исходные данные не требуются для получения прогнозируемых кривых выживаемости.

необходимо автоматически печатать оценки эффектов при наличии нелинейности и взаимодействия

Пример: возраст является квадратичным, взаимодействие с эффектом пола по умолчанию - это отношение рисков между квартилями (для модели Кокса), для пола = референтный уровень.

контролируемые пользователем эффекты: сводка (соответствие, возраст = c (30,50), пол = "женский") ->отношения шансов для логистической модели, относительное время выживания для моделей выживаемости с ускоренным временем отказа

эффекты для всех переменных (например, отношения шансов) могут быть нанесены на график с помощью столбцов с несколькими уровнями достоверности

необходимость в более красивых и лаконичных названиях эффектов в распечатках, особенно для расширенных нелинейных терминов и условий взаимодействия

используйте имя самой внутренней переменной для определения предикторов

например, для pmin (x ^ 2-3,10) обратитесь к фактору с допустимым S-именем x

нужно понимать, что перехват - не всегда простая концепция

некоторые модели (например, Cox) не имеют перехвата

некоторые модели (например, порядковая логистика) имеют несколько перехватов

необходимость автоматической высококачественной печати подобранной математической модели (с определенными фиктивными переменными, упрощенными членами сплайнов регрессии, «факторизацией» взаимодействий). Основное внимание уделяется сплайнам регрессии вместо непараметрических сглаживающих устройств или сглаживающих сплайнов, так что явные формулы для подгонки могут быть получены для использования вне S. rms также может составлять S-функции для аналитической оценки \ (X \ beta \) из подобранной модели. как составить код SAS для этого.

необходимость автоматического рисования номограммы для представления подобранной модели

необходимость автоматической начальной проверки подобранной модели с помощью только одной команды S (в отношении калибровки и дискриминации)

необходимость в робастной (сэндвич-сэндвич Huber) оценке ковариационной матрицы и уметь выполнять весь другой анализ (например, графики, CL) с использованием скорректированных ковариаций

необходимость в надежной (бутстраповой) оценке ковариационной матрицы, которую легко использовать в других анализах без изменений

потребность в сэндвич-матрицах Huber и бутстраповских ковариационных матрицах, скорректированных для кластерной выборки

необходимость в регулярном сообщении о том, сколько наблюдений было удалено из-за пропущенных значений для каждого предиктора (см. na.delete в Hmisc)

необходимость в дополнительном отчете описательной статистики для Y, стратифицированного по отсутствующему статусу каждого X (см. na.detail.response)

потребность в красивых, аннотированных кривых выживаемости с использованием одних и тех же команд для параметрических моделей и моделей Кокса.

необходимость в порядковой логистической модели (модель пропорциональных шансов, модель коэффициента продолжения)

необходимость оценки и тестирования общих контрастов без необходимости осознавать кодирование переменных или порядок параметров

Функции фитинга, совместимые со среднеквадратичным значением

Среднеквадратичное значение будет работать с широким спектром функций настройки, но оно предназначено специально для следующих целей:

Функция Цель Связанные S
Функции
олы Линейная модель обыкновенных наименьших квадратов lm
lrm Бинарная и порядковая логистическая регрессия glm
модель cr.setup
орм Модель порядковой регрессии lrm
брм Байесовская двоичная и порядковая регрессия \
psm Параметрическое ускоренное время отказа Survreg
модель выживания
cph Регрессия пропорциональных рисков Кокса кокс
npsurv Непараметрические оценки выживаемости Survfit.formula
Ъ Метод наименьших квадратов, подвергнутый цензуре Бакли-Джеймса Survreg
линейная модель
Glm Версия glm для использования с rms glm
Gls Версия gls для использования с rms gls
Rq Версия rq для использования с rms rq

Методы в rms

Следующие общие функции работают с посадками с действующими среднеквадратичными значениями:

Функция Цель Связанный
Функции
Распечатать Распечатать параметры и статистику соответствия
Coef Подходящие коэффициенты регрессии
формула Формула, используемая в подгонке
спецификации Подробные характеристики посадки
Робков Оценки робастной ковариационной матрицы
бутков Оценки ковариационной матрицы начальной загрузки
резюме Резюме эффектов предикторов
plot.summary Сюжет непрерывно затемненной уверенности
полосы для результатов сводки
анова Тесты Вальда наиболее значимых гипотез
контраст Общие контрасты, CL, тесты
plot.anova Изобразите результаты Anova графически точечная диаграмма
Предсказывать Частичные предикторные эффекты предсказывать
сюжет. Постройте эффекты предиктора, используя решетчатую графику предсказывать
ggplot Аналогично предыдущему, но с использованием ggplot2 заговор
Аналогично приведенному выше, но с использованием сюжета участок 3-D график эффектов различных двух
непрерывные предикторы
изображение, пот, контур гендата Создать фрейм данных с помощью предиктора
expand.grid комбинации (опционально в интерактивном режиме)
предсказывать Получите прогнозируемые значения или матрицу дизайна
Fastbw Быстрая обратная понижающая переменная
шаг отбор
остатки Остатки, статистика влияния от подгонки
(или остаток)
which.influence Какие наблюдения чрезмерно
остатки влиятельный
Sensuc Чувствительность одного бинарного предиктора в
модели lrm и cph до неизмеренного
двоичный конфаундер
латекс LaTeX представление подогнанных
модель или анова или сводная таблица
Функция Аналитическое представление S-функции
Function.transcan подобранной регрессионной модели (\ (X \ beta \))
опасность Аналитическое представление S-функции
rcspline.restate встроенной функции опасностей (для psm)
Выживание Аналитическое представление S-функции
подобранная функция выживаемости (для psm, cph)
Квантиль Аналитическое представление S-функции
подобранная функция для квантилей
время выживания (для psm, cph)
номограмма Рисует номограмму подобранной модели.
латекс, сюжет, ggplot, plotp Survest Оценить вероятность выживания
выжить (для psm, cph)
сюжет Постройте кривые выживаемости (psm, cph, npsurv)
plot.survfit подтверждать Проверить индексы соответствия модели с помощью
val.prob повторная выборка
откалибровать Оценить калибровочную кривую для модели
с использованием передискретизации
vif Коэффициенты отклонения инфляции для подгонки
нарезид Принесите элементы, соответствующие отсутствующему
данные обратно в прогнозы и остатки
напринт Распечатать сводку пропущенных значений
пятикратная гонка Найдите оптимальное наказание за оштрафованные MLE
Effective.df Вывести эффективный df для каждого типа
переменная в модели, для штрафной подгонки или
результат пятиконечной дистанции
rm.impute Приписать данные повторных измерений
трансканировать, неслучайный отсев
fit.mult.impute Функция Цель

Предпосылки для примеров

Следующие программы демонстрируют, как части пакета rms работают вместе. (Обычно) одноразовый вызов функции datadist требует прохождения всего фрейма данных для хранения сводок распределения для потенциальных переменных-предикторов. Эти сводки содержат (по умолчанию) квантили 0,25 и 0,75 непрерывных переменных (для оценки эффектов, таких как отношения шансов), 10-е наименьшее и 10-е наибольшее значения (или квантили 0,1 и 0,9 для малых \ ​​(n \)) для построения диапазонов для расчетных кривых и общего диапазона. Для дискретных числовых переменных (имеющих \ (\ leq 10 \) уникальные значения) также сохраняется список уникальных значений. Такие сводки используются функциями summary.rms, Predict и nomogram.rms. Вы можете сэкономить время и отложить запуск списка данных. В этом случае сводка распределения не сохраняется с подходящим объектом,но его можно собрать перед запуском summary, plot, ggplot или plotp.

d

x1 * x2) anova (f) fastbw (f) Predict (f, x2) predict (f, newdata)

В разделе « Примеры» есть три подробных примера с использованием функции подбора, предназначенной для использования с rms, lrm (модель логистической регрессии). В подробном примере 1мы создаем 3 переменных-предиктора и два бинарных ответа для 500 субъектов. Для первого бинарного ответа, dz, истинная модель включает только пол и возраст, и между ними существует нелинейное взаимодействие, потому что логарифмические шансы представляют собой усеченную линейную зависимость возраста для женщин и квадратичную функцию для мужчин. Для второго бинарного результата, dz.bp, истинная популяционная модель также включает систолическое артериальное давление (sys.bp) через усеченную линейную зависимость. Во-первых, непараметрическая оценка отношений выполняется с помощью функции plsmo пакета Hmisc, которая использует lowess с отключенным обнаружением выбросов для двоичных ответов. Затем параметрическое моделирование выполняется с использованием ограниченных кубических сплайнов. Это моделирование не предполагает, что мы знаем истинные преобразования возраста или системы.bp, но эти преобразования являются плавными (что на самом деле не так в популяции).

Для подробного примера 2, предположим, что категориальная переменная Treat имеет значения "a", "b" и "c", порядковая переменная num.diseases имеет значения 0,1,2,3,4, и что существуют две непрерывные переменные: age и холестерин. Возраст соответствует ограниченному кубическому сплайну, в то время как холестерин трансформируется с использованием журнала трансформации (холестерин - 10). Холестерин отсутствует у трех субъектов, и мы рассчитываем их, используя общий средний холестерин. Мы хотим разрешить взаимодействие между лечением и холестерином. Следующая S-программа будет соответствовать логистической модели, проверять все эффекты в дизайне, оценивать эффекты и строить графики предполагаемых преобразований. Подгонка для num.diseases действительно рассматривает переменную как пятиуровневую категориальную переменную. Единственная разница в том, что 3 dfТест на линейность проводится для оценки возможности повторного моделирования переменной «asis». Здесь мы также показываем операторы для присоединения пакета rms и сохранения предикторных характеристик из списка данных.

Подробный пример 3показывает некоторые возможности анализа выживаемости среднеквадратичных значений, связанных с моделью пропорциональных рисков Кокса. Мы моделируем данные для 2000 субъектов с двумя предикторами, возрастом и полом. В модели истинной популяции логарифмическая функция риска линейна по возрасту, и возрастное \ (\ times \) и половое взаимодействие отсутствует. В приведенном ниже анализе мы не используем возрастную линейность. rms использует многие функции выживания Терри Терно, встроенные в S.

Ниже приведена типичная последовательность шагов, которая будет использоваться со среднеквадратичным значением в сочетании с функцией трансканирования Hmisc для выполнения единого вменения всех НК в предикторах (множественное вменение было бы лучше, но было бы труднее выполнить в контексте валидации модели начальной загрузки. ), подогнать под модель, выполнить шаг назад, чтобы уменьшить количество предикторов в модели (со всеми серьезными проблемами, которые это может повлечь за собой), и использовать бутстрап для проверки этой пошаговой модели, повторяя выбор переменных для каждой повторной выборки. Здесь мы делаем сокращенный шаг, так как вменение не повторяется в бутстрапе.

В дальнейшем у нас (нетипично) есть только 3 кандидата в предикторы. На практике убедитесь, что функции проверки и калибровки работают с подгонкой модели, которая содержит все предикторы, которые были задействованы в предыдущих анализах, в которых использовалась переменная ответа. Здесь вменение необходимо, потому что в противном случае обратное понижение приведет к удалению наблюдений, отсутствующих в любой переменной-кандидате.

Обратите внимание, что вам нужно будет определить x1, x2, x3, y для запуска следующего кода.

x1 + x2 + x3, imputed = TRUE) impute (xt) # вменяет любые NA в x1, x2, x3 # Теперь поместите исходную полную модель на заполненные данные f

x1 + rcs (x2,4) + x3, x = TRUE, y = TRUE) # x, y разрешает загрузку. fastbw (f) # выводит модель stepdown (с использованием правила остановки по умолчанию) validate (f, B = 100, bw = TRUE) # повторяет fastbw 100 раз cal

Общие проблемы, которых следует избегать

Нет такой формулы, как у

возраст + возраст ^ 2. В S вам нужно связать связанные переменные с помощью функции, которая создает матрицу, например pol или rcs. Это позволяет вычислить оценки эффекта (например, отношения рисков), а также выполнить несколько тестов связи df.

Не используйте poly или strata в формулах, используемых в среднеквадратичных значениях. Вместо этого используйте pol и strat.

Практически никогда не кодируйте свои собственные фиктивные переменные или переменные взаимодействия в S. Пусть S делает это автоматически. В противном случае анова не сможет выполнять свою работу.

Практически никогда не трансформируйте предикторы вне формулы модели, так как тогда графики предсказанных значений по сравнению со значениями предикторов и другие отображения не будут построены в исходном масштабе. Вместо этого используйте что-нибудь вроде y

log (cell.count + 1), что позволит отображать cell.count на осях \ (x \) -. Вы можете стать красивее, например, y

rcs (log (cell.count + 1), 4), чтобы соответствовать ограниченному кубическому сплайну с 4 узлами в log (cell.count + 1). Для более сложных преобразований выполните что-то вроде f fit1

f (cell.count)) fit2

Не помещайте $ внутри имен переменных, используемых в формулах. Либо прикрепите фреймы данных, либо используйте data =.

Не забудьте использовать datadist. Постарайтесь использовать его в верхней части своей программы, чтобы все подходящие модели могли автоматически использовать преимущества его распределительных сводок для предикторов.

Не проверяйте и не калибруйте модели, которые были сокращены путем отбрасывания «незначительных» предикторов. При правильной начальной загрузке или перекрестной проверке все шаги по выбору переменных должны повторяться для каждой повторной выборки. Следовательно, проверьте или откалибруйте модели, которые содержат все возможные предикторы, и, если вы должны сократить модели, укажите параметр bw = TRUE для проверки или калибровки.

Отказ от «незначительных» предикторов разрушает большую часть обычных статистических выводов для регрессионных моделей (доверительные границы, стандартные ошибки, \ (P \) - значения, \ (\ chi ^ 2 \), обычные индексы производительности модели), а также приводит к в моделях, у которых будет худшая предиктивная дискриминация.

Доступ к пакету

Опубликованные приложения среднеквадратичных и регрессионных сплайнов

Spanos A, Harrell FE, Durack DT (1989): Дифференциальный диагноз острого менингита: анализ прогностической ценности первоначальных наблюдений. JAMA 2700-2707.

Ohman EM, Armstrong PW, Christenson RH, et al . (1996): Уровни сердечного тропонина Т для стратификации риска острой ишемии миокарда. Новый Eng J Med 335: 1333-1341.

Калибровочная кривая начальной загрузки для параметрической модели выживаемости:

Knaus WA, Harrell FE, Fisher CJ, Wagner DP и др . (1993): Клиническая оценка новых лекарств от сепсиса: дизайн проспективного исследования, основанный на анализе выживаемости. JAMA 270: 1233-1241.

Сплайны, взаимодействие со шлицами, алгебраическая форма подогнанной модели из latex.rms

Кнаус В.А., Харрелл Ф.Е., Линн Дж. И др. (1995): Прогностическая модель SUPPORT: объективные оценки выживаемости тяжелобольных госпитализированных взрослых. Анналы внутренней медицины 122: 191-203.

Сплайны, диаграмма отношения шансов из подобранной модели с нелинейными условиями и условиями взаимодействия, использование трансканирования для вменения

Ли К.Л., Вудлиф Л.Х., Тополь Э.Дж., Уивер У.Д., Бетриу А. Кол-Дж., Саймунс М., Эйлуорд П., Ван де Верф Ф., Калифф Р.М. Предикторы 30-дневной смертности в эпоху реперфузии при остром инфаркте миокарда: результаты международного исследования с участием 41 021 пациента. Циркуляция 1995; 91: 1659-1668.

Сплайны, внешняя проверка логистических моделей, правила прогнозирования с использованием точечных таблиц

Steyerberg EW, Hargrove YV, et al (2001): Гистология остаточной массы при раке яичка: разработка и проверка правила клинического прогноза. Статистика в медицине 2001; 20: 3847-3859.

van Gorp MJ, Steyerberg EW и др. (2003): Правило клинического прогноза 30-дневной смертности при замене конвексно-вогнутого клапана Бьорка-Шили. J. Клиническая эпидемиология 2003; 56: 1006-1012.

Подбор модели, проверка начальной загрузки, вменение отсутствующих значений

Krijnen P, van Jaarsveld BC, Steyerberg EW, Man in 't Veld AJ, Schalekamp, ​​MADH, Habbema JDF (1998): правило клинического прогнозирования стеноза почечной артерии. Анналы внутренней медицины 129: 705-711.

Подгонка модели, шлицы, валидация бутстрапа, номограммы

Каттан М.В., Истхэм Дж. А., Стэплтон AMF, Уиллер TM, Скардино PT. Предоперационная номограмма рецидива заболевания после радикальной простатэктомии по поводу рака простаты. J Natl Ca Inst 1998; 90 (10): 766-771.

Каттан, М.В., Уилер TM, Скардино, PT. Послеоперационная номограмма рецидива заболевания после радикальной простатэктомии по поводу рака простаты. J Clin Oncol 1999; 17 (5): 1499-1507

Каттан М.В., Зелефский М.Дж., Купелян П.А., Скардино П.Т., Фукс З., Лейбель С.А. Номограмма перед лечением для прогнозирования результатов трехмерной конформной лучевой терапии при раке простаты. J Clin Oncol 2000; 18 (19): 3252-3259.

Истхэм Дж. А., Мэй Р., Робертсон Дж. Л., Сартор О., Каттан М. В.. Разработка номограммы, которая прогнозирует вероятность положительного результата биопсии простаты у мужчин с аномальным пальцевым ректальным исследованием и специфическим антигеном простаты от 0 до 4 нг / мл. Урология . (Под давлением).

Каттан М.В., Хеллер Г., Бреннан М.Ф. Номограмма конкурирующего риска для случая смерти от саркомы после местного рецидива. Stat in Med 2003; 22; 3515-3525.

Оценка максимального правдоподобия, сплайны регрессии, веб-сайт для получения прогнозируемых значений

Smits M, Dippel DWJ, Steyerberg EW и др. Прогнозирование внутричерепных травм при компьютерной томографии у пациентов с незначительной травмой головы: правило прогноза CHIP. Ann Int Med 2007; 146: 397-405.

Номограмма с вероятностью 2- и 5-летней выживаемости и медианным временем выживаемости (но будьте осторожны при использовании однофакторного скрининга)

Кларк Т.Г., Стюарт М.Э., Альтман Д.Г., Смит Дж.Ф. Прогностическая модель рака яичников. Br J Cancer 2001; 85: 944-52.

Исчерпывающий пример параметрического моделирования выживаемости с обширной номограммой, графиком отношения времени, графиком анова, кривыми выживаемости, созданными с помощью графика выживания, калибровочной кривой начальной загрузки

Тено Дж. М., Харрелл Ф. Э., Кнаус В. А. и др. Прогнозирование выживаемости для пожилых госпитализированных пациентов: модель выживания HELP. J Am Geriatrics Soc 2000; 48: S16-S24.

Подбор модели, вменение и несколько номограмм, представленных в табличной форме

Хасдай Д., Холмс Д. Р. и др. Кардиогенный шок, осложняющий острый инфаркт миокарда: предикторы смерти. Am Heart J 1999; 138: 21-31.

Порядковая логистическая модель с графиком начальной калибровки

Wu AW, Yasui U, Alzola CF et al . Прогнозирование результатов функционального статуса госпитализированных пациентов в возрасте 80 лет и старше. J Am Geriatric Society 2000; 48: S6-S15.

Моделирование предрасположенности при оценке медицинского диагноза, точечная диаграмма анова

Weiss JP, Gruver C, et al. Заказ эхокардиограммы для оценки функции левого желудочка: уровень знаний, необходимый для эффективного использования. J Am Soc Echocardiography 2000; 13: 124-130.

Моделирование с использованием среднеквадратичного значения для изучения свойств различных стратегий моделирования

Штейерберг Э. У., Эйкеманс MJC, Habbema JDF. Пошаговый выбор в небольших наборах данных: имитационное исследование систематической ошибки в логистическом регрессионном анализе. J Clin Epi 1999; 52: 935-942.

Steyerberg WE, Eijekans MJC, Harrell FE, Habbema JDF. Прогностическое моделирование с логистическим регрессионным анализом: в поисках разумной стратегии в небольших наборах данных. Med Decision Making 2001; 21: 45-56.

Статистические методы и справочные материалы, связанные с среднеквадратичным значением, наряду с тематическими исследованиями, которые включают код среднеквадратичного значения, по которому проводился анализ

Harrell FE, Lee KL, Mark DB (1996): Прогностические модели с несколькими переменными: вопросы разработки моделей, оценки допущений и адекватности, измерения и уменьшения ошибок. Стат в Med 15: 361-387.

Харрелл Ф. Э., Марголис П. А., Гоув С., Мейсон К. Э., Малхолланд Е. К. и др. (1998): Разработка модели клинического прогнозирования для порядкового исхода: Многоцентровое исследование ARI Всемирной организации здравоохранения клинических признаков и этиологических агентов пневмонии, сепсиса и менингита у детей раннего возраста. Статистика в Med 17: 909-944.

Бендер Р., Беннер А. (2000): Расчет моделей порядковой регрессии в SAS и S-Plus. Биометрический J 42: 677-699.

Отчеты об ошибках

Автор готов помочь с проблемами. Отправьте электронное письмо на адрес fh@fharrell.com. Чтобы сообщить об ошибке, сделайте следующее:

Если ошибка возникает при запуске функции на подходящем объекте (например, anova), прикрепите к заметке текстовую версию дампа подходящего объекта. Если вы использовали datadist, но не раньше, чем было создано соответствие, также отправьте объект, созданный datadist. Пример: save (myfit, "/ tmp / myfit.rda") создаст двоичный файл сохранения R, который можно прикрепить к электронному письму.

Если ошибка возникает во время подбора модели (например, с lrm, ols, psm, cph), отправьте оператор, вызывающий ошибку, с сохраненной версией фрейма данных, используемого при подборе. Если этот фрейм данных очень большой, уменьшите его до небольшого подмножества, которое по-прежнему вызывает ошибку.

Уведомление об авторских правах

ОБЩИЙ ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ Эта программа является бесплатным программным обеспечением; вы можете распространять и / или изменять его в соответствии с условиями Стандартной общественной лицензии GNU, опубликованной Free Software Foundation; либо версия 2, либо (по вашему выбору) любая более поздняя версия.

Эта программа распространяется в надежде, что она будет полезной, но БЕЗ КАКИХ-ЛИБО ГАРАНТИЙ; даже без подразумеваемой гарантии ТОВАРНОЙ ПРИГОДНОСТИ или ПРИГОДНОСТИ ДЛЯ КОНКРЕТНОЙ ЦЕЛИ. Подробнее см. Стандартную общественную лицензию GNU. Вкратце: вы можете использовать этот код как хотите, при условии, что вы не взимаете за него деньги, удаляете это уведомление или привлекаете кого-либо к ответственности за его результаты. Также укажите источник и сообщите об изменениях автору.

Если это программное обеспечение используется, если работа представлена ​​для публикации, просьба сослаться на нее, используя, например,: Harrell FE (2009): среднеквадратичное значение: S-функции для биостатистического / эпидемиологического моделирования, тестирования, оценки, проверки, графики и прогнозирования. Программы доступны по адресу https://hbiostat.org/R/rms/. Не забудьте сослаться на другие используемые пакеты, а также на сам R.

Подробности

Чтобы воспользоваться функциями автоматического набора, у вас должен быть установлен LaTeX или один из его вариантов.

Некоторые аспекты среднеквадратичного значения (например, латекс) не будут работать правильно, если используются параметры (контрасты =), отличные от c («contr.treatment», «contr.poly»).

rms опирается на множество функций анализа выживаемости, написанных Терри Терно из Mayo Clinic. Внешние интерфейсы были написаны для некоторых функций Терно, а другие функции были немного изменены.

Сергей Иващенко

08.09.2021

Подписывайтесь на наши социальные сети!