Основен Други Анализ на данните за времето до събитието

Анализ на данните за времето до събитието

Общ преглед

Софтуер

Описание

Уебсайтове

Четения

Курсове

Общ преглед

Тази страница описва накратко поредица от въпроси, които трябва да бъдат взети предвид при анализирането на данни за времето до събитие, и предоставя анотиран списък с ресурси за повече информация.

Описание

Какво е уникалното в данните за времето до събитие (TTE)?

Данните за времето до събитие (TTE) са уникални, защото резултатът от интерес е не само дали е настъпило събитие, но и кога е настъпило това събитие. Традиционните методи на логистична и линейна регресия не са подходящи, за да могат да включват както събитие, така и времеви аспекти като резултат в модела. Традиционните методи за регресия също не са оборудвани за обработка на цензура, специален тип липсващи данни, който се появява при анализи от време до събитие, когато субектите не изпитват събитието, което ги интересува по време на проследяването. При наличието на цензура истинското време до събитието се подценява. Разработени са специални техники за данни за ТТЕ, които ще бъдат разгледани по-долу, за да се използва частичната информация за всеки обект с цензурирани данни и да се предоставят обективни оценки на оцеляването. Тези техники включват данни от множество времеви точки за субектите и могат да се използват за директно изчисляване на скорости, времеви съотношения и коефициенти на риск.

Кои са важните методологични съображения за данните за времето до събитие?

Има 4 основни методологични съображения при анализа на времето до събитието или данните за оцеляване. Важно е да имате ясна дефиниция на целевото събитие, времевия произход, времевата скала и да опишете как участниците ще излязат от проучването. След като те са добре дефинирани, анализът става по-прав. Обикновено има едно целево събитие, но има разширения на анализи за оцеляване, които позволяват множество събития или повтарящи се събития.

Какъв е произходът на времето?

Началото на времето е моментът, в който започва времето за проследяване. Данните за TTE могат да използват различен произход от време, който до голяма степен се определя от дизайна на изследването, като всеки има свързани ползи и недостатъци. Примерите включват изходно време или изходна възраст. Произходът на времето може да се определи и чрез определяща характеристика, като начало на експозиция или диагноза. Това често е естествен избор, ако резултатът е свързан с тази характеристика. Други примери включват раждане и календарна година. За кохортните изследвания времевият мащаб е най-често времето за проучване.

Има ли друг вариант за времеви мащаб, различен от времето на обучение?

Възрастта е друг често използван времеви мащаб, където базовата възраст е произходът на времето и хората излизат при тяхното събитие или цензурираща възраст. Моделите с възрастта като времева скала могат да се коригират за календарни ефекти. Някои автори препоръчват като времева скала да се използва възрастта, а не времето за проучване, тъй като може да предостави по-малко пристрастни оценки.

Какво е цензура?

Едно от предизвикателствата, специфични за анализа на оцеляването, е, че само някои индивиди ще са преживели събитието до края на проучването и следователно времената на оцеляване ще бъдат неизвестни за подгрупа от изследваната група. Това явление се нарича цензура и може да възникне по следните начини: участникът в изследването все още не е преживял съответния резултат, като рецидив или смърт, до края на проучването; участникът в изследването е загубен за проследяване по време на периода на проучване; или участникът в изследването преживява различно събитие, което прави по-нататъшното проследяване невъзможно. Такива цензурирани интервални времена подценяват истинското, но неизвестно време до събитието. За повечето аналитични подходи цензурата се приема за произволна или неинформативна.

Има три основни типа цензуриране, дясно, ляво и интервално. Ако събитията се случат след края на проучването, тогава данните са цензурирани отдясно. Данните, цензурирани вляво, възникват, когато събитието се наблюдава, но точното време на събитието е неизвестно. Данните, цензурирани по интервал, се появяват, когато събитието се наблюдава, но участниците влизат и излизат от наблюдението, така че точното време на събитието не е известно. Повечето аналитични методи за оцеляване са предназначени за десни цензурирани наблюдения, но са налични методи за интервални и ляво цензурирани данни.

Какъв е въпросът за интереса?

Изборът на аналитичен инструмент трябва да се ръководи от изследователския въпрос, който представлява интерес. С данните за TTE изследователският въпрос може да приеме няколко форми, което влияе върху това коя функция за оцеляване е най-подходяща за изследователския въпрос. Три различни типа изследователски въпроси, които могат да представляват интерес за данните за ТТЕ, включват:

  1. Каква част от хората ще останат свободни от събитието след определено време?

  2. Каква част от хората ще имат събитието след определено време?

  3. Какъв е рискът от събитието в определен момент от времето сред тези, които са оцелели до този момент?

Всеки от тези въпроси съответства на различен тип функция, използвана при анализа на оцеляването:

  1. Функция за оцеляване, S (t): вероятността индивидът да оцелее след време t [Pr (T> t)]

  2. Функция за плътност на вероятността, F (t) или функцията за кумулативна честота, R (t): вероятността индивидът да има време за оцеляване по-малко или равно на t [Pr (T≤t)]

  3. Функция за опасност, h (t): моментният потенциал от преживяване на събитие в момент t, при условие че е оцелял до този момент

  4. Кумулативна функция на опасност, H (t): интегралът на функцията за опасност от време 0 до време t, което е равно на площта под кривата h (t) между време 0 и време t

Ако една от тези функции е известна, другите функции могат да бъдат изчислени, като се използват следните формули:

S (t) = 1 - F (t) Функцията за оцеляване и функцията на плътността на вероятността се равняват на 1

h (t) = f (t) / S (t) Моментната опасност е равна на безусловната вероятност от

преживяване на събитието в момент t, мащабирано от фракцията жива в момент t

H (t) = -log [S (t)] Кумулативната функция на опасност е равна на отрицателния дневник на оцеляването

функция

S (t) = e –H (t) Функцията за оцеляване е равна на степенувания отрицателен кумулативен риск

функция

Тези преобразувания се използват често в методите за анализ на оцеляването, както ще бъде разгледано по-долу. Обикновено увеличаването на h (t), моментната опасност, ще доведе до увеличаване на H (t), кумулативната опасност, което се превръща в намаляване на S (t), функцията за оцеляване.

Какви предположения трябва да се направят, за да се използват стандартни техники за данни от времето до събитие?

Основното предположение при анализа на данните за ТТЕ е неинформативното цензуриране: лица, които са цензурирани, имат същата вероятност да преживеят последващо събитие като индивидите, които остават в проучването. Информационната цензура е аналогична на липсващите данни, които не се пренебрегват, което ще отклони анализа. Няма окончателен начин да се провери дали цензурата е неинформативна, макар че изследването на моделите на цензуриране може да покаже дали предположението за неинформативна цензура е разумно. Ако се подозира информационна цензура, могат да се използват анализи на чувствителността, като най-добрия и най-лошия сценарий, за да се направи опит за количествено определяне на ефекта, който информационната цензура има върху анализа.

Друго предположение при анализ на данните за ТТЕ е, че има достатъчно време за проследяване и брой събития за адекватна статистическа мощност. Това трябва да се има предвид във фазата на проектиране на изследването, тъй като повечето анализи на оцеляването се основават на кохортни проучвания.

Заслужава да се споменат допълнителни опростяващи предположения, тъй като те често се правят в прегледите на анализа на оцеляването. Въпреки че тези предположения опростяват моделите за оцеляване, не е необходимо да се извършват анализи с данни за ТТЕ. Разширени техники могат да се използват, ако тези предположения са нарушени:

  • Няма кохортен ефект върху оцеляването: за кохорта с дълъг период на набиране, приемете, че хората, които се присъединяват рано, имат същите вероятности за оцеляване като тези, които се присъединяват късно

  • Правилно цензуриране само в данните

  • Събитията са независими едно от друго

Какви видове подходи могат да се използват за анализ на оцеляването?

Има три основни подхода за анализ на данните за ТТЕ: непараметричен, полупараметричен и параметричен подход. Изборът на кой подход да се използва трябва да се ръководи от изследователския въпрос, който представлява интерес. Често в един и същ анализ могат да бъдат използвани по подходящ начин повече от един подход.

Какви са непараметричните подходи към анализа на оцеляването и кога са подходящи?

Непараметричните подходи не разчитат на предположения за формата или формата на параметрите в основната съвкупност. При анализа на оцеляването се използват непараметрични подходи за описване на данните чрез оценка на функцията за оцеляване, S (t), заедно с медианата и квартилите на времето за оцеляване. Тези описателни статистически данни не могат да бъдат изчислени директно от данните поради цензуриране, което подценява истинското време на оцеляване при цензурираните субекти, което води до изкривени оценки на средната стойност, медианата и други описания. Непараметричните подходи често се използват като първата стъпка в анализа за генериране на обективни описателни статистически данни и често се използват заедно с полупараметрични или параметрични подходи.

Оценка на Каплан-Майер

Най-често срещаният непараметричен подход в литературата е оценителят на Каплан-Майер (или границата на продукта). Оценяването на Каплан-Майер работи, като разделя оценката на S (t) на поредица от стъпки / интервали въз основа на наблюдаваните времена на събитията. Наблюденията допринасят за оценката на S (t), докато се случи събитието или докато не бъдат цензурирани. За всеки интервал се изчислява вероятността за оцеляване до края на интервала, като се има предвид, че субектите са изложени на риск в началото на интервала (това обикновено се отбелязва като pj = (nj - dj) / nj). Очакваното S (t) за всяка стойност на t се равнява на произведението от оцеляването на всеки интервал до и включително t. Основните предположения на този метод, в допълнение към неинформативната цензура, е, че цензурата възниква след неуспехи и че няма кохортен ефект върху оцеляването, така че субектите имат еднаква вероятност за оцеляване, независимо кога са попаднали в проучване.

Очакваното S (t) от метода на Каплан-Майер може да бъде нанесено като стъпкова функция с времето по оста X. Този парцел е добър начин за визуализиране на преживяването на кохортата и може да се използва и за оценка на медианата (когато S (t) ≤0,5) или на квартили от времето за оцеляване. Тези описателни статистически данни могат също да бъдат изчислени директно с помощта на оценителя на Каплан-Майер. 95% доверителни интервали (CI) за S (t) разчитат на трансформации на S (t), за да се гарантира, че 95% CI е в рамките на 0 и 1. Най-често срещаният метод в литературата е оценителят на Greenwood.

Оценител на таблицата на живота

Оценителят на таблицата на живота на функцията за оцеляване е един от най-ранните примери за прилагани статистически методи, който се използва повече от 100 години за описване на смъртността в големи популации. Оценителят на таблицата на живота е подобен на метода на Каплан-Майер, с изключение на това, че интервалите се основават на календарното време вместо наблюдаваните събития. Тъй като методите на таблицата на живота се базират на тези календарни интервали, а не на базата на отделни събития / цензуриращи времена, тези методи използват средния размер на риска, зададен за интервал, за да се изчисли S (t) и трябва да се приеме, че цензурирането е настъпило еднакво през календарния интервал от време. Поради тази причина оценителят на таблицата на живота не е толкова точен, колкото оценяването на Kaplan-Meier, но резултатите ще бъдат подобни при много големи проби.

Оценител на Нелсън-Аален

Друга алтернатива на Каплан-Майер е оценката на Нелсън-Аален, която се основава на използването на подхода на процеса на преброяване за оценка на кумулативната функция на опасност, H (t). Тогава оценката на H (t) може да се използва за оценка на S (t). Оценките на S (t), получени с помощта на този метод, винаги ще бъдат по-големи от оценката на K-M, но разликата ще бъде малка между двата метода в големи извадки.

Могат ли да се използват непараметрични подходи за едномерни или многовариативни анализи?

Непараметричните подходи като оценката на Каплан-Майер могат да се използват за провеждане на непроменливи анализи за категорични фактори от интерес. Факторите трябва да бъдат категорични (или в природата, или в непрекъсната променлива, разделена на категории), тъй като функцията за оцеляване, S (t), се изчислява за всяко ниво на категориалната променлива и след това се сравнява между тези групи. Очакваното S (t) за всяка група може да бъде нанесено и визуално сравнено.

Тестовете, базирани на ранга, могат да се използват и за статистическо тестване на разликата между кривите на оцеляване. Тези тестове сравняват наблюдавания и очаквания брой събития във всяка точка от време по групи, под нулевата хипотеза, че функциите за оцеляване са равни за групите. Има няколко версии на тези тестове, базирани на ранга, които се различават по тежестта, дадена на всеки момент от времето при изчисляването на статистиката на теста. Две от най-често срещаните тестове, базирани на ранг, наблюдавани в литературата, са тестовете за логаритмичен ранг, които дават еднаква тежест на всяка времева точка, и тестът на Уилкоксън, който претегля всяка времева точка според броя на рисковите субекти. Въз основа на това тегло, тестът на Wilcoxon е по-чувствителен към разликите между кривите в началото на проследяването, когато повече лица са изложени на риск. Други тестове, като теста на Пето-Прентис, използват тежести между тези на логаритма и тестовете на Уилкоксън. Тестовете, базирани на ранга, подлежат на допълнителното предположение, че цензурата е независима от групата и всички са ограничени от малко сила за откриване на разликите между групите, когато кривите на оцеляване се пресичат. Въпреки че тези тестове осигуряват р-стойност на разликата между кривите, те не могат да се използват за оценка на размерите на ефекта (р-стойността на теста за логаритмичен ранг обаче е еквивалентна на р-стойността за категоричен фактор от интерес в еднопроменлив Cox модел).

Непараметричните модели са ограничени, тъй като не предоставят оценки на ефекта и като цяло не могат да се използват за оценка на ефекта от множество фактори от интерес (многопроменливи модели). Поради тази причина непараметричните подходи често се използват заедно с полу- или напълно параметрични модели в епидемиологията, където обикновено се използват мултипроменливи модели за контрол на объркващите фактори.

Могат ли да се регулират кривите на Каплан-Майер?

Често срещан е митът, че кривите на Каплан-Майер не могат да бъдат коригирани и това често се цитира като причина да се използва параметричен модел, който може да генерира коригирани с ковариации криви на оцеляване. Разработен е метод за създаване на коригирани криви на оцеляване, като се използва обратно тегло на вероятността (IPW). В случай на само един ковариант, IPW могат да бъдат непараметрично оценени и са еквивалентни на директна стандартизация на кривите на оцеляване за изследваната популация. В случай на множество ковариати, полу- или напълно параметрични модели трябва да се използват за оценка на теглата, които след това се използват за създаване на криви на оцеляване, коригирани с множество ковариати. Предимства на този метод са, че той не е обект на предположението за пропорционални опасности, той може да се използва за вариращи във времето ковариати и може да се използва и за непрекъснати ковариати.

Защо се нуждаем от параметрични подходи за анализ на данни от времето до събитие?

Непараметричен подход към анализа на данните за ТТЕ се използва за просто описание на данните за оцеляване по отношение на разследвания фактор. Моделите, използващи този подход, също се наричат ​​универсални модели. По-често следователите се интересуват от връзката между няколко ковариати и времето до събитието. Използването на полу- и напълно параметрични модели позволява времето за събитие да бъде анализирано по отношение на много фактори едновременно и предоставя оценки на силата на ефекта за всеки съставен фактор.

Какво е полупараметричен подход и защо се използва толкова често?

диаграма на нашето правителство

Пропорционалният модел на Кокс е най-често използваният многовариативен подход за анализ на данните за оцеляване в медицинските изследвания. По същество това е модел на регресия от време до събитие, който описва връзката между честотата на събитията, изразена чрез функцията за опасност, и набор от ковариати. Моделът на Кокс е написан по следния начин:

функция на опасност, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

Счита се за полупараметричен подход, тъй като моделът съдържа непараметричен компонент и параметричен компонент. Непараметричният компонент е базовата опасност, h0 (t). Това е стойността на опасността, когато всички ковариати са равни на 0, което подчертава значението на центрирането на ковариатите в модела за интерпретируемост. Не бъркайте базовата опасност да бъде опасността в момент 0. Функцията за базова линия на опасност се изчислява непараметрично и затова, за разлика от повечето други статистически модели, времената за оцеляване не се предполага, че следват определено статистическо разпределение и формата на базовата линия опасността е произволна. Не е необходимо да се изчислява основната функция на опасност, за да се направят изводи за относителната опасност или съотношението на риска. Тази функция прави модела на Кокс по-стабилен от параметричните подходи, тъй като не е уязвим за погрешно уточняване на базовата опасност.

Параметричният компонент се състои от ковариантния вектор. Ковариантният вектор умножава базовия риск със същото количество, независимо от времето, така че ефектът от който и да е ковариатен е един и същ по всяко време по време на проследяването и това е основата за предположението за пропорционалните опасности.

Какво е предположението за пропорционалните опасности?

Приемането на пропорционалните опасности е жизненоважно за използването и интерпретацията на модел на Кокс.

При това предположение съществува постоянна връзка между резултата или зависимата променлива и ковариативния вектор. Последствията от това предположение са, че функциите на риск за всеки двама индивида са пропорционални във всеки момент от времето и съотношението на риска не се променя във времето. С други думи, ако даден индивид има риск от смърт в някакъв начален момент от време, който е два пъти по-висок от този на друг индивид, тогава при всички по-късни моменти рискът от смърт остава два пъти по-висок. Това предположение предполага, че кривите на опасност за групите трябва да бъдат пропорционални и не трябва да се пресичат. Тъй като това предположение е толкова важно, то определено трябва да бъде тествано.

Как проверявате предположението за пропорционалните опасности?

Съществуват разнообразни техники, както графични, така и базирани на тестове, за оценка на валидността на предположението за пропорционални опасности. Едната техника е просто да начертаете кривите на оцеляването на Каплан-Майер, ако сравнявате две групи без ковариати. Ако кривите се пресичат, допускането за пропорционални опасности може да бъде нарушено. Важно предупреждение към този подход трябва да се има предвид при малки проучвания. Възможно е да има голям брой грешки, свързани с оценката на кривите на оцеляване за изследвания с малък размер на извадката, поради което кривите могат да се пресичат, дори когато е изпълнено предположението за пропорционалните опасности. Допълнителният лог-лог график е по-надежден тест, който нанася логаритъма на отрицателния логаритъм на оценената функция на оцелелите спрямо логаритъма на времето за оцеляване. Ако опасностите са пропорционални между групите, този график ще даде паралелни криви. Друг често срещан метод за тестване на предположението за пропорционалните опасности е да се включи срок за взаимодействие във времето, за да се определи дали HR се променя във времето, тъй като времето често е виновникът за непропорционалността на опасностите. Доказателството, че срокът на взаимодействие между групата и времето не е нула, е доказателство за пропорционални опасности.

Какво ще стане, ако предположението за пропорционалните опасности не е валидно?

Ако установите, че предположението PH не отговаря, не е задължително да се откажете от използването на модела Cox. Има опции за подобряване на непропорционалността в модела. Например, можете да включите други ковариати в модела, или нови ковариати, нелинейни термини за съществуващи ковариати или взаимодействия между ковариати. Или можете да стратифицирате анализа върху една или повече променливи. Това изчислява модел, при който базовият риск може да бъде различен в рамките на всяка прослойка, но ковариативните ефекти са равни в различните слоеве. Другите опции включват разделяне на времето на категории и използване на индикаторни променливи, за да се позволи съотношението на риска да варира във времето и промяна на променливата на времето за анализ (напр. От изминало време към възраст или обратно).

Как проверявате полупараметричния модел?

В допълнение към проверката за нарушения на предположението за пропорционалност, има и други аспекти на пригодността на модела, които трябва да бъдат разгледани. Статистика, подобна на тази, използвана при линейна и логистична регресия, може да се приложи за изпълнение на тези задачи за модели на Кокс с някои разлики, но основните идеи са еднакви и в трите настройки. Важно е да се провери линейността на ковариативния вектор, което може да се направи чрез изследване на остатъците, точно както правим при линейната регресия. Остатъците в данните за TTE обаче не са толкова ясни, колкото при линейна регресия, отчасти защото стойността на резултата е неизвестна за някои от данните и остатъците често са изкривени. Няколко различни вида остатъци са разработени, за да се оцени моделът на Кокс, подходящ за данни за TTE. Примерите включват Martingale и Schoenfeld, наред с други. Можете също така да разгледате остатъците, за да идентифицирате силно влиятелни и лошо приспособени наблюдения. Съществуват и тестове за добро състояние, които са специфични за моделите на Кокс, като теста на Gronnesby и Borgan и прогностичния индекс на Hosmer и Lemeshow. Можете също да използвате AIC за сравнение на различни модели, въпреки че използването на R2 е проблематично.

Защо да използваме параметричен подход?

Едно от основните предимства на полупараметричните модели е, че не е необходимо да се посочва базовата опасност, за да се изчислят коефициентите на риск, които описват разликите в относителната опасност между групите. Възможно е обаче оценката на основната опасност да представлява интерес. В този случай е необходим параметричен подход. При параметричните подходи се посочват както функцията на опасност, така и ефектът на ковариатите. Функцията за опасност се изчислява въз основа на предполагаемо разпределение в основната популация.

Предимствата на използването на параметричен подход за анализ на оцеляването са:

  • Параметричните подходи са по-информативни от не- и полупараметричните подходи. В допълнение към изчисляването на относителните оценки на ефекта, те могат също да се използват за прогнозиране на времето за оцеляване, степента на опасност и средното и средното време на оцеляване. Те могат също така да се използват за прогнозиране на абсолютен риск във времето и за начертаване на криви на оцеляване, коригирани с ковариации.

  • Когато параметричната форма е зададена правилно, параметричните модели имат по-голяма мощност от полупараметричните модели. Те са и по-ефективни, което води до по-малки стандартни грешки и по-точни оценки.

  • Параметричните подходи разчитат на пълната максимална вероятност за оценка на параметрите.

  • Остатъците от параметрични модели приемат познатата форма на разликата в наблюдаваното спрямо очакваното.

Основният недостатък на използването на параметричен подход е, че се разчита на предположението, че основното разпределение на популацията е точно определено. Параметричните модели не са надеждни за неправилно определяне, поради което полупараметричните модели са по-често срещани в литературата и са по-малко рискови за използване, когато има несигурност относно основното разпределение на популацията.

Как избирате параметричната форма?

Изборът на подходящата параметрична форма е най-трудната част от параметричния анализ на оцеляването. Спецификацията на параметричната форма трябва да се ръководи от хипотезата на изследването, заедно с предварителни знания и биологична правдоподобност на формата на изходната опасност. Например, ако е известно, че рискът от смърт се увеличава драстично веднага след операцията и след това намалява и се изравнява, би било неподходящо да се посочи експоненциалното разпределение, което приема постоянна опасност във времето. Данните могат да се използват, за да се оцени дали посоченият формуляр изглежда отговаря на данните, но тези методи, управлявани от данни, трябва да допълват, а не да заменят селекциите, управлявани от хипотези.

Каква е разликата между модела с пропорционални опасности и модела с ускорено време на повреда?

Въпреки че моделът на пропорционалните опасности на Кокс е полупараметричен, моделите на пропорционалните опасности също могат да бъдат параметрични. Параметричните пропорционални модели на опасности могат да бъдат написани като:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

където базовият риск, h0 (t), зависи само от времето, t, но не и от X, а λ е специфична за единицата функция на ковариатите, която не зависи от t, която мащабира функцията за опасност на базовата линия нагоре или надолу. λ не може да бъде отрицателно. В този модел степента на опасност е мултипликативна функция на базовата опасност и коефициентите на опасност могат да се интерпретират по същия начин, както в полупараметричния модел на пропорционални опасности.

Моделите за ускорено отказ (AFT) са клас параметрични модели за оцеляване, които могат да бъдат линеаризирани чрез вземане на естествения дневник на модела на времето за оцеляване. Най-простият пример за AFT модел е експоненциалният модел, който се записва като:

ln (T) = β0 + β1X1 +…. + βpXp + ε *

Основната разлика между моделите AFT и моделите PH е, че моделите AFT предполагат, че ефектите на ковариатите са мултипликативни по времева скала, докато моделите Cox използват скала на опасност, както е показано по-горе. Оценките на параметрите от AFT моделите се интерпретират като ефекти върху времевата скала, които могат или да ускорят, или да забавят времето за оцеляване. Exp (β)> 1 от AFT модел означава, че факторът ускорява времето за оцеляване или води до по-дълго оцеляване. Опит (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Някои разпределения на грешки могат да бъдат написани и интерпретирани както като PH, така и като AFT модели (т.е. експоненциални, Weibull), други са само PH (т.е. Gompertz) или само AFT модели (т.е. log-logistic), а други не са нито PH, нито AFT модели. (т.е. монтиране на сплайн).

Какви форми могат да приемат параметричните модели?

Функцията за опасност може да приеме всякаква форма, стига h (t)> 0 за всички стойности на t. Докато основното съображение за параметричната форма трябва да бъде предварително познаване на формата на изходната опасност, всяко разпределение има своите предимства и недостатъци. Някои от най-често срещаните формуляри ще бъдат обяснени накратко, с повече информация в списъка с ресурси.

Експоненциално разпределение

Експоненциалното разпределение приема, че h (t) зависи само от коефициентите на модела и ковариатите и е постоянно във времето. Основното предимство на този модел е, че той е едновременно модел на пропорционални опасности и ускорен модел на време на повреда, така че оценките на ефекта могат да се интерпретират като коефициенти на риск или времеви съотношения. Основният недостатък на този модел е, че често е неправдоподобно да се приема постоянна опасност във времето.

Разпределение на Weibull

Разпределението на Weibull е подобно на експоненциалното разпределение. Докато експоненциалното разпределение приема постоянна опасност, разпределението на Weibull приема монотонен риск, който може да се увеличава или намалява, но не и двете. Той има два параметъра. Параметърът на формата (σ) контролира дали опасността се увеличава (σ1) (в експоненциалното разпределение този параметър е зададен на 1). Параметърът на мащаба, (1 / σ) exp (-β0 / σ), определя мащаба на това увеличение / намаляване. Тъй като разпределението на Weibull се опростява до експоненциално разпределение, когато σ = 1, нулевата хипотеза, че σ = 1, може да бъде тествана с помощта на тест на Wald. Основното предимство на този модел е, че той е едновременно PH и AFT модел, така че могат да бъдат изчислени както коефициенти на риск, така и времеви коефициенти. Отново основният недостатък е, че допускането за монотонност на основния риск може да бъде неправдоподобно в някои случаи.

Разпределение на Gompertz

Разпределението на Gompertz е PH модел, който е равен на log-Weibull разпределението, така че дневникът на функцията за опасност е линеен в t. Това разпределение има експоненциално нарастващ процент на неуспехи и често е подходящ за актюерски данни, тъй като рискът от смъртност също се увеличава експоненциално с течение на времето.

Логистично-логистично разпространение

Логистично-логистичното разпределение е AFT модел с термин за грешка, който следва стандартното логистично разпределение. Той може да побере немонотонни опасности и обикновено се вписва най-добре, когато основната опасност се повиши до пик и след това падне, което може да бъде правдоподобно за някои заболявания като туберкулоза. Логистично-логистичното разпределение не е PH модел, но е модел на пропорционални коефициенти. Това означава, че той е обект на предположението за пропорционални коефициенти, но предимството е, че коефициентите на наклон могат да се интерпретират като времеви отношения, а също и като коефициенти на коефициенти. Съотношението на шансовете от 2 от параметричен логистичен модел, например, би се интерпретирало като шанс за оцеляване след време t при субекти с x = 1 е два пъти по-голям от шансовете за субекти с x = 0.

Генерализирано разпределение на гама (GG)

Генерализираното разпределение на гама (GG) всъщност е семейство от разпределения, което съдържа почти всички най-често използвани разпределения, включително експоненциалното, Weibull, log normal и гама разпределението. Това позволява сравнения между различните разпределения. Фамилията GG включва и четирите най-често срещани типа функции за опасност, което прави разпределението на GG особено полезно, тъй като формата на функцията за опасност може да помогне за оптимизиране на избора на модел.

Подход за сплайни

Тъй като единственото общо ограничение на спецификацията на основната функция за опасност е, чеh (t)> 0 за всички стойности на t, сплайните могат да се използват за максимална гъвкавост при моделиране на формата на основната опасност. Ограничените кубични сплайни са един метод, който наскоро се препоръчва в литературата за параметричен анализ на оцеляването, тъй като този метод позволява гъвкавост във формата, но ограничава функцията да бъде линейна в краищата, където данните са оскъдни. Сплайновете могат да се използват за подобряване на оценката и също са изгодни за екстраполация, тъй като те максимално пригодят към наблюдаваните данни. Ако са правилно посочени, оценките на ефекта от модели, подходящи за използване на сплайни, не трябва да бъдат предубедени. Подобно на други регресионни анализи, предизвикателствата при поставянето на сплайни могат да включват избор на броя и местоположението на възлите и проблеми с прекаленото монтиране.

Как изследвате пригодността на параметричния модел?

Най-важният компонент за оценка на пригодността на параметричния модел е да се провери дали данните поддържат определената параметрична форма. Това може да бъде оценено визуално чрез графично изчисление на кумулативната опасност, базирана на модела, спрямо прогнозната функция на кумулативния риск на Каплан-Майер. Ако посочената форма е вярна, графиката трябва да премине през началото с наклон 1. Тестът за добро състояние на годни на Grønnesby-Borgan може също да се използва за това дали наблюдаваният брой събития е значително различен от очаквания брой събития в групи, диференцирани по рискови оценки. Този тест е силно чувствителен към броя на избраните групи и има тенденция да отхвърля нулевата хипотеза за адекватно прилягане твърде либерално, ако са избрани много групи, особено в малки масиви от данни. Тестът не разполага с мощност за откриване на нарушения на модела, ако са избрани твърде малко групи. Поради тази причина изглежда неподходящо да се разчита само на тест за добро състояние, за да се определи дали посочената параметрична форма е разумна.

AIC може да се използва и за сравняване на модели, изпълнявани с различни параметрични форми, като най-ниският AIC показва най-доброто прилягане. AIC не може да се използва за сравняване на параметрични и полупараметрични модели, тъй като параметричните модели се основават на наблюдавани времена на събитията, а полупараметричните модели се основават на реда на времената на събитията. Отново, тези инструменти трябва да се използват, за да се провери дали определената форма отговаря на данните, но правдоподобността на посочената основна опасност все още е най-важният аспект при избора на параметрична форма.

След като определената параметрична форма бъде определена така, че да отговаря добре на данните, методи, подобни на тези, описани по-рано за полупропорционални модели на опасност, могат да се използват за избор между различни модели, като остатъчни графики и тестове за добро състояние.

Какво ще стане, ако предикторите се променят с течение на времето?

В моделните изявления, написани по-горе, сме приели, че експозициите са постоянни в хода на последващите действия. Експозициите със стойности, които се променят с течение на времето, или вариращи във времето ковариати, могат да бъдат включени в моделите за оцеляване чрез промяна на единицата на анализа от индивида към периода от време, когато експозицията е постоянна. Това разделя времето-време на отделните индивиди на интервали, които всеки човек допринася за набора от рискове, изложени и неекспонирани за този ковариат. Основното предположение за включване на вариращ във времето ковариант по този начин е, че ефектът от вариращия във времето ковариант не зависи от времето.

За модел на пропорционална опасност на Кокс включването на вариращ във времето ковариат ще бъде под формата на: h (t) = h0 (t) e ^ β1x1 (t). Променливите във времето ковариати също могат да бъдат включени в параметричните модели, макар че е малко по-сложно и трудно за интерпретиране. Параметричните модели могат също да моделират вариращи във времето ковариати, като използват сплайни за по-голяма гъвкавост.

Обикновено вариращи във времето ковариати трябва да се използват, когато се предположи, че опасността зависи повече от по-късните стойности на ковариата, отколкото от стойността на ковариата на изходно ниво. Предизвикателствата, които възникват при вариращите във времето ковариати, липсват данни за ковариатите в различни моменти от време и потенциална пристрастност в оценката на риска, ако вариращият във времето ковариатор всъщност е медиатор.

Какво представлява конкурентният анализ на рисковете?

Традиционните методи за анализ на оцеляването предполагат, че се случва само един вид събитие от интерес. Съществуват обаче по-усъвършенствани методи, които позволяват разследването на няколко вида събития в едно и също проучване, като смърт от множество причини. За тези проучвания се използва анализ на конкурентни рискове, при които продължителността на преживяемостта завършва с първото от няколко събития. Необходими са специални методи, тъй като анализът на времето за всяко събитие поотделно може да бъде пристрастен. По-конкретно в този контекст методът на KM има тенденция да надценява дела на субектите, преживяващи събития. Анализът на конкурентните рискове използва метода на кумулативната честота, при който общата вероятност за събитие по всяко време е сумата от специфичните за събитието вероятности. Моделите обикновено се прилагат чрез въвеждане на всеки участник в изследването няколко пъти - по един за всеки тип събитие. За всеки участник в изследването времето до всяко събитие се цензурира към момента, в който пациентът е преживял първото събитие. За повече информация, моля, вижте страницата advancedepidemiology.org на конкуриращи се рискове .

Какво представляват немощните модели и защо са полезни за корелирани данни?

Корелирани данни за оцеляването могат да възникнат поради повтарящи се събития, преживени от даден индивид или когато наблюденията са групирани в групи. Поради липса на знания или поради осъществимост, някои ковариати, свързани със събитието, което представлява интерес, може да не бъдат измерени. Моделите на нестабилност отчитат хетерогенността, причинена от неизмерени ковариати чрез добавяне на случайни ефекти, които действат мултипликативно върху функцията на опасност. Моделите на крехкост са по същество разширения на модела на Кокс с добавяне на случайни ефекти. Въпреки че има различни класификационни схеми и номенклатура, използвани за описване на тези модели, четири често срещани типа модели на нестабилност включват споделена, вложена, съвместна и добавена нестабилност.

Има ли други подходи за анализ на данни за повтарящи се събития?

Данните за повтарящи се събития са свързани, тъй като множество събития могат да възникнат в рамките на една и съща тема. Докато моделите на нестабилност са един от методите за отчитане на тази корелация в анализите на повтарящи се събития, по-прост подход, който също може да отчете тази корелация, е използването на стабилни стандартни грешки (SE). С добавянето на стабилни SE, анализът на повтарящи се събития може да се направи като просто разширение или на полупараметрични, или на параметрични модели.

Макар и лесни за изпълнение, има множество начини за моделиране на данни за повтарящи се събития, като се използват стабилни SE. Тези подходи се различават по начина, по който определят набора от рискове за всеки рецидив. По този начин те отговарят на малко по-различни учебни въпроси, така че изборът на кой подход за моделиране да се използва трябва да се основава на хипотезата на изследването и валидността на предположенията за моделиране.

Процесът на броене или подходът на Andersen-Gill към моделирането на повтарящи се събития предполага, че всяко повторение е независимо събитие и не взема под внимание реда и вида на събитието. В този модел времето за проследяване на всеки обект започва в началото на изследването и се разделя на сегменти, определени от събития (рецидиви). Субектите допринасят за риска, определен за събитие, стига да са под наблюдение по това време (без цензура). Тези модели са лесни за приспособяване като модел на Кокс с добавяне на силен оценител на SE, а коефициентите на риск се тълкуват като ефект на ковариата върху степента на рецидив през последващия период. Този модел обаче би бил неподходящ, ако предположението за независимост не е разумно.

Условните подходи предполагат, че субектът не е изложен на риск за последващо събитие, докато не настъпи предшестващо събитие, и следователно вземат предвид реда на събитията. Те са подходящи, като се използва стратифициран модел с номер на събитието (или брой на повторението, в този случай) като променлива на слоевете и включително стабилни SE. Има два различни условни подхода, които използват различни времеви скали и следователно имат различни набори от рискове. Подходът с условна вероятност използва времето от началото на изследването за определяне на интервалите от време и е подходящ, когато интересът е в пълния ход на процеса на повтарящото се събитие. Подходът за интервал от време по същество нулира часовника за всяко повторение, като използва времето от предишното събитие, за да дефинира интервали от време, и е по-подходящ, когато специфичните оценки на ефекта (или повторение) представляват интерес.

И накрая, маргиналните подходи (известни също като WLW - подход на Wei, Lin и Weissfeld) считат всяко събитие за отделен процес, така че субектите са изложени на риск за всички събития от началото на проследяването, независимо дали са преживели предшестващо събитие. Този модел е подходящ, когато се смята, че събитията са резултат от различни основни процеси, така че субектът може да изпита 3-то събитие, например, без да преживее 1-вото. Въпреки че това предположение изглежда неправдоподобно с някои видове данни, като рецидиви на рак, то може да се използва за моделиране на рецидиви на наранявания за определен период от време, когато субектите могат да получат различни видове наранявания през периода, които нямат естествен ред. Маргиналните модели също могат да бъдат пригодени, като се използват стратифицирани модели със здрави SE.

Четения

Този проект имаше за цел да опише методологичните и аналитични решения, с които човек може да се сблъска, когато работи с данни от времето до събитие, но в никакъв случай не е изчерпателен. По-долу са дадени ресурси, за да се задълбочите в тези теми.

Учебници и глави

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Регресивни методи в биостатистиката, 2-ри Ню Йорк, Ню Йорк: Springer.

  • Уводен текст към линейни, логистични, модели за оцеляване и повтарящи се мерки, най-подходящ за тези, които искат основна отправна точка.

  • Главата за анализ на оцеляването предоставя добър преглед, но не и дълбочина. Примерите са базирани на STATA.

Hosmer DW, Lemeshow S, май S. (2008) Приложен анализ на оцеляването: Регресионно моделиране на данни от времето до събитие, 2-ро изд. Хобокен, Ню Джърси: John Wiley & Sons, Inc.

  • Задълбочен преглед на непараметричните, полупараметричните и параметричните модели на Кокс, най-подходящ за тези, които са запознати в други области на статистиката. Разширените техники не са разгледани задълбочено, но са предоставени препратки към други специализирани учебници.

Kleinbaum DG, Klein M (2012). Анализ на оцеляването: Самообучаващ се текст, 3-то изд. Ню Йорк, Ню Йорк: Springer Science + Business Media, LLC

  • Отличен уводен текст

Klein JP, Moeschberger ML (2005). Анализ на оцеляването: техники за цензурирани и пресечени данни, 2-ро изд. Ню Йорк, Ню Йорк: Springer Science + Business Media, LLC

  • предназначена за аспиранти, тази книга предоставя много практически примери

Therneau TM, Grambsch PM (2000). Моделиране на данните за оцеляване: Разширяване на модела на Кокс. Ню Йорк, Ню Йорк: Springer Science + Business Media, LLC

  • Добро въведение в подхода на процеса на преброяване и анализ на корелирани данни за оцеляване. Авторът също е написал пакета за оцеляване в R

Алисън PD (2010). Анализ на оцеляването с помощта на SAS: Практическо ръководство, 2-ро изд. Кари, Северна Каролина: Институт SAS

  • Страхотен приложен текст за потребители на SAS

Багдонавичус V, Никулин М (2002). Ускорени модели на живот: Моделиране и статистически анализ, Бока Ратон, Флорида: Chapman & Hall / CRC Press.

  • Добър ресурс за повече информация относно параметричните и полупараметричните ускорени модели на време на отказ и как те се сравняват с моделите с пропорционална опасност

Методологически статии

Въведение / Преглед на статии

Hougaard P (1999). Основи на данните за оцеляване. Биометрия 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Анализ на оцеляването, част I: основни понятия и първи анализи. Br J Рак 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Анализ на оцеляването, част II: анализ на многомерни данни - въведение в концепциите и методите. Br J Рак 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Анализ на оцеляването, част II: анализ на многомерни данни - избор на модел и оценка на неговата адекватност и годност. Br J Рак 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Анализ на оцеляването, част IV: допълнителни концепции и методи за анализ на оцеляването. Br J Рак 89 (5): 781-6. PMID: 12942105

  • Поредицата от четири статии по-горе е отличен уводен преглед на методите за анализ на оцеляването, който е изключително добре написан и лесен за разбиране - горещо се препоръчва.

Възрастта като времева скала

Korn EL, Graubard BI, Midthune D (1997). Анализ от време до събитие на надлъжно проследяване на проучване: избор на времевия мащаб. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Доклад, в който се застъпва използването на възрастта като времева скала, а не на времето за обучение.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Анализ на времето до събитие на надлъжно проследяване на проучване: избор на времевия мащаб. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Коментирайте хартията Korn, описвайки предпазните мерки, които да вземете, когато използвате възрастта като времева скала.

Thiébaut AC, Bénichou J (2004). Избор на времеви мащаб в моделния анализ на Cox на епидемиологични кохортни данни: симулационно проучване. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Симулационно проучване, показващо величината на пристрастия за различните степени на асоциация между възрастта и ковариата на интереса, когато се използва времето за изследване като времева скала.

Canchola AJ, Stewart SL, Bernstein L, et al. Регресия на Кокс, използвайки различни времеви скали. Наличен в: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Хубава хартия, в която се сравняват 5 модела на регресия на Кокс с вариации във времето на обучение или възрастта като времева скала със SAS код.

Цензура

Huang CY, Ning J, Qin J (2015). Полупараметрично заключение за вероятност за отрязани отляво и цензурирани отдясно данни. Биостатистика [epub] PMID: 25796430 .

  • Тази статия има хубаво въведение в анализа на цензурирани данни и предоставя нова процедура за оценка на разпределението на времето на оцеляване с ляво пресечени и цензурирани данни. Той е много плътен и има усъвършенстван статистически фокус.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Пристрастие, дължащо се на ляво съкращаване и ляво цензуриране в надлъжни изследвания на развитието и болестните процеси. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • Отличен ресурс, който обяснява пристрастията, присъща на левоцензурираните данни от епидемиологична гледна точка.

Sun J, Sun L, Zhu C (2007). Тестване на модела на пропорционалните шансове за цензурирани по интервал данни. Аналитични данни за целия живот 13: 37–50. PMID 17160547 .

  • Друга статистически плътна статия за нюансиран аспект на анализа на данните от TTE, но предоставя добро обяснение на данните, цензурирани по интервали.

Robins JM (1995a) Аналитичен метод за рандомизирани проучвания с информативна цензура: Част I. Anal 1 Lifetime Data 1: 241–254. PMID 9385104 .

Robins JM (1995b) Аналитичен метод за рандомизирани проучвания с информативна цензура: Част II. Данни за целия живот 1: 417–434. PMID 9385113 .

  • Две статии, които обсъждат методи за справяне с информативна цензура.

Непараметрични методи за оцеляване

Borgan Ø (2005) Оценка на Каплан-Майер. Енциклопедия по биостатистика DOI: 10.1002 / 0470011815.b2a11042

  • Отличен преглед на оценителя на Каплан-Майер и връзката му с оценителя на Нелсън-Аален

Родригес G (2005). Непараметрична оценка в модели за оцеляване. Достъпен от: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Въведение в непараметричните методи и модела на пропорционалната опасност на Кокс, който обяснява връзките между методите и математическите формули

Cole SR, Hernan MA (2004). Коригирани криви на оцеляване с обратни вероятни тегла. Компютърни методи Програми Biomed 75 (1): 35-9. PMID: 15158046

  • Описва използването на IPW за създаване на коригирани криви на Каплан-Майер. Включва пример и макрос на SAS.

Zhang M (2015). Здрави методи за подобряване на ефективността и намаляване на пристрастията при оценяване на кривите на оцеляване в рандомизирани клинични проучвания. Данни за целия живот 21 (1): 119-37. PMID: 24522498

  • Предложен метод за коригирани с ковариации криви на оцеляване при RCT

Полупараметрични методи за оцеляване

Cox DR (1972) Регресионни модели и таблици на живота (с дискусия). J R Statist Soc B 34: 187–220.

  • Класическата справка.

Christensen E (1987) Анализ на многовариантния преживяемост, използващ регресионния модел на Кокс. Хепатология 7: 1346–1358. PMID 3679094 .

  • Описва използването на модела на Кокс, използвайки мотивиращ пример. Отличен преглед на ключовите аспекти на анализа на модела на Cox, включително как да се побере модел на Cox и проверка на допусканията на модела.

Grambsch PM, Therneau TM (1994) Тестове за пропорционална опасност и диагностика въз основа на претеглени остатъци. Биометрика 81: 515–526.

  • Подробна статия за тестване на предположението за пропорционалните опасности. Добра комбинация от теория и разширено статистическо обяснение.

Ng’andu NH (1997) Емпирично сравнение на статистически тестове за оценка на предположението за пропорционалните опасности на модела на Кокс. Stat Med 16: 611–626. PMID 9131751 .

  • Друга задълбочена статия за тестване на предположението за пропорционални опасности, тази включва дискусия за проверка на остатъчни количества и ефекти от цензурата.

Параметрични методи за оцеляване

Родригес, Джорджия (2010). Параметрични модели за оцеляване. Достъпен от: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • кратко въведение в най-често срещаните разпределения, използвани при параметричен анализ на оцеляването

Nardi A, Schemper M (2003). Сравняване на Cox и параметрични модели в клинични проучвания. Stat Med 22 (23): 2597-610. PMID: 14652863

  • Предоставя добри примери за сравняване на полупараметрични модели с модели, използващи общи параметрични разпределения и се фокусира върху оценка на пригодността на модела

Royston P, Parmar MK (2002). Гъвкави параметрични модели на пропорционални опасности и пропорционални шансове за цензурирани данни за оцеляване, с приложение към прогностично моделиране и оценка на ефектите от лечението. Stat Med 21 (15): 2175-97. PMID: 12210632

  • Добро обяснение за основите на пропорционалните модели на опасности и коефициенти и сравнения с кубични сплайни

Cox C, Chu H, Schneider MF, Muñoz A (2007). Параметричен анализ на оцеляването и таксономия на функциите на опасност за генерализираното гама разпределение. Statist Med 26: 4352–4374. PMID 17342754 .

  • Предоставя отличен преглед на параметричните методи за оцеляване, включително таксономия на функциите на опасност и задълбочена дискусия на генерализираното семейство гама разпределение.

Crowther MJ, Lambert PC (2014). Обща рамка за параметричен анализ на оцеляването. Stat Med 33 (30): 5280-97. PMID: 25220693

  • Описва ограничителни предположения за често използваните параметрични разпределения и обяснява методологията с ограничен кубичен сплайн

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Параметрични модели на оцеляване за интервално цензурирани данни с зависими от времето ковариати. Биометрия 7 (4): 599-614. PMID: 16597670

  • Разширение и пример за използване на параметрични модели с интервално цензурирани данни

Променливи във времето ковариации

Fisher LD, Lin DY (1999). Зависими от времето ковариации в модела на регресия на Кокс с пропорционални опасности. Annu Rev Public Health 20: 145-57. PMID: 10352854

  • Изчерпателно и лесно за разбиране обяснение на вариращите във времето ковариати в модели на Кокс, с математическо приложение

Petersen T (1986). Монтиране на параметрични модели на оцеляване с зависими от времето ковариати. Appl Statist 35 (3): 281-88.

  • Плътна статия, но с полезен приложен пример

Конкуриращ се анализ на риска

Вижте Конкуриращи се рискове

Tai B, Machin D, White I, Gebski V (2001) Анализ на конкурентни рискове при пациенти с остеосарком: сравнение на четири различни подхода. Stat Med 20: 661–684. PMID 11241570 .

  • Добра задълбочена хартия, която описва четири различни метода за анализ на данните за конкуриращи се рискове и използва данни от рандомизирано проучване на пациенти с остеосарком, за да сравнява тези четири подхода.

Checkley W, Brower RG, Muñoz A (2010). Заключение за взаимно изключващи се конкуриращи се събития чрез комбинация от обобщени гама разпределения. Епидемиология 21 (4): 557–565. PMID 20502337 .

  • Документ за конкуриращи се рискове, използващ генерализираното гама разпределение.

Анализ на клъстерирани данни и модели на нестабилност

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Модели на пропорционални опасности със случайни ефекти за изследване на централни ефекти в многоцентрови клинични проучвания за рак. Stat Methods Med Res 11: 221–236. PMID 12094756 .

  • Статия с отлично теоретично и математическо обяснение на отчитането на групирането при анализ на данните за оцеляване от многоцентровите клинични изпитвания.

O’Quigley J, Stare J (2002) Модели на пропорционални опасности с слабости и случайни ефекти. Stat Med 21: 3219–3233. PMID 12375300 .

  • Пряко сравнение на модели на слабост и модели на случайни ефекти.

Balakrishnan N, Peng Y (2006). Генерализиран модел на гама-крехкост. Statist Med 25: 2797–2816. PMID

  • Статия за модели на крехкост, използваща обобщеното гама разпределение като разпределение на крехкостта.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: R пакет за анализ на корелирани данни за оцеляване с модели на крехкост, използващи наказателна оценка на вероятността или параметрична оценка. Списание за статистически софтуер 47 (4): 1-28.

  • R пакет винетка с добра основна информация за крехки модели.

Шаубел DE, Cai J (2005). Анализ на клъстерирани данни за повтарящи се събития с приложение към процентите на хоспитализация при пациенти с бъбречна недостатъчност. Биостатистика 6 (3): 404-19. PMID 15831581 .

  • Отлична хартия, в която авторите представят два метода за анализ на клъстерирани данни за повтарящи се събития и след това сравняват резултатите от предложените модели с тези, базирани на модел на нестабилност.

Gharibvand L, Liu L (2009). Анализ на данните за оцеляване с клъстерирани събития. SAS Global Forum 2009 Paper 237-2009.

  • Кратък и лесен за разбиране източник за анализ на данни от време до събитие с клъстерирани събития с SAS процедури.

Анализ на повтарящи се събития

Twisk JW, Smidt N, de Vente W (2005). Приложен анализ на повтарящи се събития: практически преглед. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Много лесно за разбиране въведение в моделирането на повтарящи се събития и концепцията за рисковите набори

Villegas R, Juliá O, Ocaña J (2013). Емпирично проучване на корелираните времена на оцеляване за повтарящи се събития с пропорционални граници на опасности и ефекта от корелацията и цензурата.BMC Med Res Methodol 13:95. PMID: 23883000

  • Използва симулации, за да тества устойчивостта на различни модели за данни за повтарящи се събития

Kelly PJ, Lim LL (2000). Анализ на оцеляването за данни за повтарящи се събития: приложение за детски инфекциозни заболявания. Stat Med 19 (1): 13-33. PMID: 10623190

  • Приложени примери за четирите основни подхода за моделиране на данни за повтарящи се събития

Wei LJ, Lin DY, Weissfeld L (1989). Регресионен анализ на многовариантни непълни данни за времето на отказ чрез моделиране на пределни разпределения. Вестник на Американската статистическа асоциация84 (108): 1065-1073

Оригиналната статия, описваща маргинални модели за анализ на повтарящи се събития

Курсове

Летен институт по епидемиология и здраве на населението при Колумбийския университет (EPIC)

„Статистически хоризонти“, частен доставчик на специални статистически семинари, преподавани от експерти в областта

  • 5-дневен семинар по история на събитията и анализ на оцеляването, предложен на 15-19 юли 2015 г. във Филаделфия, преподаван от Пол Алисън. Не са необходими предишни познания за анализ на оцеляването. За повече информация вижте http://statistichorizons.com/seminars/public-seminars/eventhistory13

Междууниверситетски консорциум за политически и социални изследвания (ICPSR) Лятна програма по количествени методи за социални изследвания, част от Института за социални изследвания към Университета в Мичиган

  • Тридневен семинар за анализ на оцеляването, моделиране на историята на събитията и анализ на продължителността, предложен на 22-24 юни 2015 г. в Бъркли, Калифорния, преподавател от Тенко Райков от Мичиганския държавен университет. Изчерпателен преглед на методите за оцеляване в различни дисциплини (не само в общественото здраве): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Институтът за статистически изследвания предлага два онлайн курса за анализ на оцеляването, предлагани няколко пъти в годината. Тези курсове са базирани на учебника по приложен анализ на Klein и Kleinbaum (виж по-долу) и могат да се вземат а ла карт или като част от програма за сертифициране в Статистика:

  • Въведение в анализа на оцеляването, с акцент върху полупараметрични модели на Кокс, преподавани от Дейвид Клайнбаум или Мат Стрикланд: http://www.statistics.com/survival/

  • Усъвършенстван анализ на оцеляването, включително параметрични модели, анализ на рецидиви и модели на слабост, преподавани от Мат Стрикланд: http://www.statistics.com/survival2/

Институтът за цифрови изследвания и образование към UCLA предлага семинари, които те наричат, чрез уебсайта си за анализ на оцеляването в различен статистически софтуер. Тези семинари демонстрират как да се провежда приложен анализ на оцеляването, като се фокусира повече върху кода, отколкото върху теорията.

Интересни Статии

Избор На Редактора

Потискане на свободното изразяване и събрание в Сингапур
Потискане на свободното изразяване и събрание в Сингапур
Глобалната свобода на изразяването на Колумбия се стреми да подобри разбирането на международните и национални норми и институции, които най-добре защитават свободния поток от информация и изразяване във взаимосвързана глобална общност с основни общи предизвикателства, с които да се справим. За да постигне своята мисия, Глобалната свобода на изразяването предприема и възлага научноизследователски и политически проекти, организира събития и конференции, участва и допринася в глобалните дебати за защитата на свободата на изразяване и информация през 21 век.
Пратениците от Хелен Краузилат и Лаетиция Тура
Пратениците от Хелен Краузилат и Лаетиция Тура
ГОСПОЖИЦА. Степен
ГОСПОЖИЦА. Степен
Преглед на магистърската програма по журналистика в Колумбийското училище по журналистика. Научете за учебната програма, редовното и задочното обучение по MS опции за степен и разликата между M.S. и магистърски програми.
Кристофър буково дърво
Кристофър буково дърво
Кристофър Бухенхолц е американски композитор, чиито оркестрови, камерни, вокални и пиано произведения са приети най-благосклонно в САЩ и в чужбина. Неговите композиции са най-известни със своята изключителна комбинация от традиционни музикални звукови светове, безмилостен контрапункт, сложни ритмични агрегации и иновативно хармонично движение. Музиката му е била
GOOGLE ИЗДАВА АКТУАЛИЗАЦИИ ЗА СИГУРНОСТ ЗА ХРОМ НА 10 МАЙ 2021 ГОДИНА
GOOGLE ИЗДАВА АКТУАЛИЗАЦИИ ЗА СИГУРНОСТ ЗА ХРОМ НА 10 МАЙ 2021 ГОДИНА
Учителският колеж, Колумбийският университет, е първото и най-голямото висше училище за образование в Съединените щати, а също и трайно класирано сред най-добрите в страната.
Белпиетро срещу. Италия
Белпиетро срещу. Италия
Глобалната свобода на изразяването на Колумбия се стреми да подобри разбирането на международните и национални норми и институции, които най-добре защитават свободния поток от информация и изразяване във взаимосвързана глобална общност с основни общи предизвикателства, с които да се справим. За да постигне своята мисия, Глобалната свобода на изразяването предприема и възлага научноизследователски и политически проекти, организира събития и конференции, участва и допринася в глобалните дебати за защитата на свободата на изразяване и информация през 21 век.
Физикът от Колумбия е удостоен с възпоменателна пощенска марка в САЩ
Физикът от Колумбия е удостоен с възпоменателна пощенска марка в САЩ
Пионерската работа на Chien-Shiung Wu промени начина, по който учените гледат на структурата на Вселената.