Vigtigste Andet Time-to-Event-dataanalyse

Time-to-Event-dataanalyse

Oversigt

Software

Beskrivelse

Hjemmesider

nagasaki og hiroshima i dag

Aflæsninger

Kurser

Oversigt

Denne side beskriver kort en række spørgsmål, der skal overvejes, når man analyserer data fra tid til begivenhed og giver en kommenteret ressourceliste for mere information.

Beskrivelse

Hvad er unikt ved TTE-data (time-to-event)?

Time-to-event (TTE) data er unikke, fordi resultatet af interesse ikke kun er, om en begivenhed opstod eller ej, men også når den begivenhed fandt sted. Traditionelle metoder til logistisk og lineær regression er ikke egnede til at kunne inkludere både hændelses- og tidsaspekterne som resultatet i modellen. Traditionelle regressionsmetoder er heller ikke udstyret til at håndtere censurering, en særlig type manglende data, der opstår i tid-til-begivenhedsanalyser, når forsøgspersoner ikke oplever begivenheden af ​​interesse i opfølgningstiden. I nærvær af censur undervurderes den sande tid til begivenhed. Specielle teknikker til TTE-data, som vil blive diskuteret nedenfor, er blevet udviklet til at udnytte den delvise information om hvert emne med censureret data og tilvejebringe upartiske overlevelsesestimater. Disse teknikker indeholder data fra flere tidspunkter på tværs af emner og kan bruges til direkte beregning af hastigheder, tidsforhold og fareforhold.

Hvad er vigtige metodologiske overvejelser af tid til begivenhedsdata?

Der er 4 hovedmetodiske overvejelser i analysen af ​​data til tid til begivenhed eller overlevelse. Det er vigtigt at have en klar definition af målhændelsen, tidsoprindelsen, tidsskalaen og at beskrive, hvordan deltagerne forlader undersøgelsen. Når disse er veldefinerede, bliver analysen mere ligetil. Der er typisk en enkelt målbegivenhed, men der er udvidelser af overlevelsesanalyser, der giver mulighed for flere begivenheder eller gentagne begivenheder.

Hvad er tidens oprindelse?

Tidspunktet er det tidspunkt, hvor opfølgningstiden starter. TTE-data kan anvende en række tidsoprindelse, der i vid udstrækning bestemmes af undersøgelsesdesign, der hver har tilknyttede fordele og ulemper. Eksempler inkluderer baseline tid eller baseline alder. Tidsoprindelse kan også bestemmes af en definerende egenskab, såsom eksponering eller diagnose. Dette er ofte et naturligt valg, hvis resultatet er relateret til denne egenskab. Andre eksempler inkluderer fødsel og kalenderår. For kohortestudier er tidsskalaen oftest tid til undersøgelse.

Er der en anden mulighed for anden tidsskala end studietid?

Alder er en anden almindeligt anvendt tidsskala, hvor baseline-alderen er tidspunktet for oprindelsen, og enkeltpersoner forlader deres begivenheds- eller censuralder. Modeller med alder som tidsskala kan justeres for kalendereffekter. Nogle forfattere anbefaler, at alder i stedet for studietid bruges som tidsskala, da det kan give mindre partiske skøn.

Hvad er censur?

En af de specifikke udfordringer for overlevelsesanalyse er, at kun nogle individer vil have oplevet begivenheden ved afslutningen af ​​undersøgelsen, og derfor vil overlevelsestider være ukendte for en delmængde af studiegruppen. Dette fænomen kaldes censurering og kan opstå på følgende måder: studiedeltageren har endnu ikke oplevet det relevante resultat, såsom tilbagefald eller død, ved afslutningen af ​​undersøgelsen; studiedeltageren går tabt af opfølgning i løbet af undersøgelsesperioden eller, studiedeltageren oplever en anden begivenhed, der gør yderligere opfølgning umulig. Sådanne censurerede intervalltider undervurderer den sande, men ukendte tid til begivenhed. For de fleste analytiske tilgange antages censurering at være tilfældig eller ikke-informativ.

Der er tre hovedtyper af censur, højre, venstre og interval. Hvis begivenhederne finder sted efter afslutningen af ​​undersøgelsen, er dataene højcensureret. Venstecensurerede data opstår, når begivenheden observeres, men den nøjagtige begivenhedstid er ukendt. Intervalcensurerede data opstår, når begivenheden observeres, men deltagerne kommer ind og ud af observation, så den nøjagtige begivenhedstid er ukendt. De fleste overlevelsesanalytiske metoder er designet til højcensurerede observationer, men metoder til interval- og venstrecensurerede data er tilgængelige.

Hvad er spørgsmålet om interesse?

Valget af analytisk værktøj bør styres af det forskningsspørgsmål, der er af interesse. Med TTE-data kan forskningsspørgsmålet antage flere former, som påvirker hvilken overlevelsesfunktion, der er mest relevant for forskningsspørgsmålet. Tre forskellige typer forskningsspørgsmål, der kan være af interesse for TTE-data, inkluderer:

  1. Hvilken andel af enkeltpersoner vil forblive fri for begivenheden efter et bestemt tidsrum?

  2. Hvor stor andel af enkeltpersoner vil have begivenheden efter et bestemt tidspunkt?

  3. Hvad er risikoen for begivenheden på et bestemt tidspunkt blandt dem, der har overlevet indtil det tidspunkt?

Hvert af disse spørgsmål svarer til en anden type funktion, der anvendes i overlevelsesanalyse:

  1. Overlevelsesfunktion, S (t): sandsynligheden for, at et individ vil overleve ud over tiden t [Pr (T> t)]

  2. Sandsynlighedsdensitetsfunktion, F (t) eller den kumulative incidensfunktion, R (t): sandsynligheden for, at et individ har en overlevelsestid på mindre end eller lig med t [Pr (T≤t)]

  3. Hazard Function, h (t): det øjeblikkelige potentiale ved at opleve en begivenhed på tidspunktet t, betinget af at have overlevet til det tidspunkt

  4. Kumulativ farefunktion, H (t): integrationen af ​​farefunktionen fra tid 0 til tid t, som svarer til arealet under kurven h (t) mellem tid 0 og tid t

Hvis en af ​​disse funktioner er kendt, kan de andre funktioner beregnes ved hjælp af følgende formler:

S (t) = 1 - F (t) Overlevelsesfunktionen og sandsynlighedsdensitetsfunktionen er 1

h (t) = f (t) / S (t) Den øjeblikkelige fare er lig med den ubetingede sandsynlighed for

oplever begivenheden på tidspunktet t, skaleret af fraktionen i live på tidspunktet t

H (t) = -log [S (t)] Den kumulative fare-funktion er lig med den negative log for overlevelse

fungere

S (t) = e –H (t) Overlevelsesfunktionen er lig med den eksponentierede negative kumulative fare

fungere

Disse konverteringer bruges ofte i overlevelsesanalysemetoder, som det vil blive diskuteret nedenfor. Generelt vil en stigning i h (t), den øjeblikkelige fare, føre til en stigning i H (t), den kumulative fare, som oversættes til et fald i S (t), overlevelsesfunktionen.

Hvilke antagelser skal der gøres for at bruge standardteknikker til data til tid til begivenhed?

Hovedantagelsen ved analyse af TTE-data er, at ikke-informativ censurering er: personer, der er censureret, har samme sandsynlighed for at opleve en efterfølgende begivenhed som personer, der forbliver i undersøgelsen. Informativ censur er analog med ikke-ignorable manglende data, hvilket vil påvirke analysen. Der er ingen endelig måde at teste, om censur er ikke-informativ, selvom udforskning af censuremønstre kan indikere, om en antagelse om ikke-informativ censur er rimelig. Hvis der er mistanke om informativ censurering, kan følsomhedsanalyser, såsom bedste case og worst-case scenarier, bruges til at forsøge at kvantificere den virkning, som informativ censur har på analysen.

En anden antagelse ved analyse af TTE-data er, at der er tilstrækkelig opfølgningstid og antal begivenheder for tilstrækkelig statistisk styrke. Dette skal overvejes i undersøgelsesdesignfasen, da de fleste overlevelsesanalyser er baseret på kohortestudier.

Yderligere forenklende antagelser er værd at nævne, da de ofte er lavet i oversigter over overlevelsesanalyse. Mens disse antagelser forenkler overlevelsesmodeller, er de ikke nødvendige for at udføre analyser med TTE-data. Avancerede teknikker kan bruges, hvis disse antagelser overtrædes:

  • Ingen kohorteffekt på overlevelse: For en kohort med en lang rekrutteringsperiode antager du, at personer, der tilmelder sig tidligt, har de samme overlevelsessandsynligheder som dem, end dem der deltager sent

  • Højre censur kun i dataene

  • Begivenheder er uafhængige af hinanden

Hvilke typer tilgange kan bruges til overlevelsesanalyse?

Der er tre hovedmetoder til analyse af TTE-data: ikke-parametriske, semi-parametriske og parametriske tilgange. Valget af, hvilken metode der skal bruges, skal være drevet af forskningsspørgsmålet af interesse. Ofte kan mere end en tilgang anvendes korrekt i den samme analyse.

Hvad er ikke-parametriske tilgange til overlevelsesanalyse, og hvornår er de passende?

Ikke-parametriske tilgange er ikke afhængige af antagelser om form eller form for parametre i den underliggende befolkning. I overlevelsesanalyse anvendes ikke-parametriske tilgange til at beskrive dataene ved at estimere overlevelsesfunktionen, S (t) sammen med medianen og kvartilerne for overlevelsestid. Disse beskrivende statistikker kan ikke beregnes direkte ud fra dataene på grund af censurering, som undervurderer den sande overlevelsestid hos censurerede forsøgspersoner, hvilket fører til skæve skøn over middelværdien, medianen og andre beskrivelser. Ikke-parametriske tilgange bruges ofte som det første trin i en analyse for at generere upartisk beskrivende statistik og bruges ofte i forbindelse med semi-parametriske eller parametriske tilgange.

Kaplan-Meier Estimator

Den mest almindelige ikke-parametriske tilgang i litteraturen er estimatoren Kaplan-Meier (eller produktgrænse). Kaplan-Meier estimatoren fungerer ved at opdele estimeringen af ​​S (t) i en række trin / intervaller baseret på observerede begivenhedstider. Observationer bidrager til estimeringen af ​​S (t), indtil begivenheden finder sted, eller indtil de er censureret. For hvert interval beregnes sandsynligheden for at overleve indtil slutningen af ​​intervallet i betragtning af, at forsøgspersoner er i fare i begyndelsen af ​​intervallet (dette angives almindeligvis som pj = (nj - dj) / nj). Den anslåede S (t) for hver værdi af t er lig med produktet af at overleve hvert interval op til og med tid t. De vigtigste antagelser om denne metode ud over ikke-informativ censur er, at censur opstår efter fiaskoer, og at der ikke er nogen kohorteffekt på overlevelse, så forsøgspersoner har samme overlevelsessandsynlighed uanset hvornår de blev undersøgt.

Den estimerede S (t) fra Kaplan-Meier-metoden kan afbildes som en trinvis funktion med tiden på X-aksen. Dette plot er en god måde at visualisere kohortens overlevelsesoplevelse på og kan også bruges til at estimere medianen (når S (t) ≤0,5) eller kvartiler overlevelsestid. Disse beskrivende statistikker kan også beregnes direkte ved hjælp af Kaplan-Meier-estimatoren. 95% konfidensintervaller (CI) for S (t) er afhængige af transformationer af S (t) for at sikre, at 95% CI er inden for 0 og 1. Den mest almindelige metode i litteraturen er Greenwood estimatoren.

Estimator for livstabel

Livstabelestimatoren for overlevelsesfunktionen er et af de tidligste eksempler på anvendte statistiske metoder, der er blevet brugt i over 100 år til at beskrive dødelighed i store populationer. Livstabelestimatoren svarer til Kaplan-Meier-metoden, bortset fra at intervaller er baseret på kalendertid i stedet for observerede begivenheder. Da livstabelmetoder er baseret på disse kalenderintervaller og ikke er baseret på individuelle begivenheder / censureringstider, bruger disse metoder den gennemsnitlige risikosætstørrelse pr. Interval til at estimere S (t) og skal antage, at censurering skete ensartet over kalenderens tidsinterval. Af denne grund er estimatoren for livstabellen ikke så præcis som Kaplan-Meier-estimatoren, men resultaterne vil være ens i meget store prøver.

Nelson-Aalen Estimator

Et andet alternativ til Kaplan-Meier er Nelson-Aalen estimatoren, som er baseret på anvendelse af en optællingsproces tilgang til at estimere den kumulative fare-funktion, H (t). Estimatet af H (t) kan derefter bruges til at estimere S (t). Skøn over S (t) afledt ved hjælp af denne metode vil altid være større end K-M estimatet, men forskellen vil være lille mellem de to metoder i store prøver.

Kan ikke-parametriske tilgange anvendes til univariable eller multivariable analyser?

Ikke-parametriske tilgange som Kaplan-Meier estimatoren kan bruges til at udføre univariable analyser for kategoriske faktorer af interesse. Faktorer skal være kategoriske (enten i naturen eller en kontinuerlig variabel opdelt i kategorier), fordi overlevelsesfunktionen, S (t), estimeres for hvert niveau af den kategoriske variabel og derefter sammenlignes på tværs af disse grupper. De estimerede S (t) for hver gruppe kan afbildes og sammenlignes visuelt.

Rank-baserede tests kan også bruges til statistisk at teste forskellen mellem overlevelseskurverne. Disse tests sammenligner observeret og forventet antal begivenheder på hvert tidspunkt på tværs af grupper under nulhypotesen om, at overlevelsesfunktionerne er ens på tværs af grupper. Der er flere versioner af disse rangbaserede tests, som adskiller sig i vægten til hvert tidspunkt i beregningen af ​​teststatistikken. To af de mest almindelige rangbaserede tests, der ses i litteraturen, er lograngstesten, der giver hvert tidspunkt lige vægt, og Wilcoxon-testen, som vejer hvert tidspunkt med antallet af udsatte personer. Baseret på denne vægt er Wilcoxon-testen mere følsom over for forskelle mellem kurver tidligt i opfølgningen, når flere forsøgspersoner er i fare. Andre tests, som Peto-Prentice-testen, bruger vægte imellem dem af lograng og Wilcoxon-test. Rangbaserede tests er underlagt den yderligere antagelse, at censur er uafhængig af gruppe, og at alle er begrænset af ringe styrke til at opdage forskelle mellem grupper, når overlevelseskurver krydser. Selvom disse tests giver en p-værdi af forskellen mellem kurver, kan de ikke bruges til at estimere effektstørrelser (log-rang test p-værdi svarer imidlertid til p-værdien for en kategorisk faktor af interesse i en univariabel Cox model).

Ikke-parametriske modeller er begrænsede, da de ikke giver effektestimater og generelt ikke kan bruges til at vurdere effekten af ​​flere faktorer af interesse (multivariable modeller). Af denne grund anvendes ikke-parametriske tilgange ofte i forbindelse med semi- eller fuldt parametriske modeller inden for epidemiologi, hvor multivariable modeller typisk bruges til at kontrollere for confounders.

Kan Kaplan-Meier kurver justeres?

Det er en almindelig myte, at Kaplan-Meier-kurver ikke kan justeres, og dette nævnes ofte som en grund til at bruge en parametrisk model, der kan generere covariat-justerede overlevelseskurver. Der er imidlertid udviklet en metode til at skabe justerede overlevelseskurver ved hjælp af invers sandsynlighedsvægtning (IPW). I tilfælde af kun et kovariat kan IPW'er estimeres ikke-parametrisk og svarer til direkte standardisering af overlevelseskurverne til undersøgelsespopulationen. I tilfælde af flere covariater skal der bruges semi- eller fuldt parametriske modeller til at estimere vægtene, som derefter bruges til at skabe multiple-covariate justerede overlevelseskurver. Fordele ved denne metode er, at den ikke er underlagt den proportionale fare-antagelse, den kan bruges til tidsvarierende kovariater, og den kan også bruges til kontinuerlige kovariater.

Hvorfor har vi brug for parametriske tilgange til analyse af tid til begivenhedsdata?

En ikke-parametrisk tilgang til analyse af TTE-data bruges til simpelthen at beskrive overlevelsesdata med hensyn til den undersøgte faktor. Modeller, der benytter denne tilgang, kaldes også univariable modeller. Mere almindeligt er efterforskere interesseret i forholdet mellem flere kovariater og tidspunktet for begivenheden. Brugen af ​​semi- og fuldt parametriske modeller gør det muligt at analysere tiden til begivenheden med hensyn til mange faktorer samtidigt og giver estimater af styrken af ​​effekten for hver bestanddel.

Hvad er en semi-parametrisk tilgang, og hvorfor bruges den så ofte?

Cox Proportional-modellen er den mest anvendte multivariable tilgang til analyse af overlevelsesdata i medicinsk forskning. Det er i det væsentlige en tid til begivenhed regressionsmodel, der beskriver forholdet mellem begivenhedens forekomst, som udtrykt ved fare-funktionen, og et sæt kovariater. Cox-modellen er skrevet som følger:

farefunktion, h (t) = h0 (t) exp {β1X1 + β2X2 +… + βpXp}

Det betragtes som en semi-parametrisk tilgang, fordi modellen indeholder en ikke-parametrisk komponent og en parametrisk komponent. Den ikke-parametriske komponent er risikoen ved baseline, h0 (t). Dette er farens værdi, når alle kovariater er lig med 0, hvilket understreger vigtigheden af ​​at centrere kovariaterne i modellen for fortolkningsevne. Forveks ikke baseline-faren med faren på tidspunktet 0. Baseline-fare-funktionen estimeres ikke-parametrisk, og i modsætning til de fleste andre statistiske modeller antages overlevelsestiderne ikke at følge en bestemt statistisk fordeling og formen på baseline fare er vilkårlig. Baseline-fare-funktionen behøver ikke at blive estimeret for at kunne slutte sig om den relative fare eller fare-forholdet. Denne funktion gør Cox-modellen mere robust end parametriske tilgange, fordi den ikke er sårbar over for fejlspecifikation af baseline-faren.

Den parametriske komponent består af den covariate vektor. Den covariate vektor multiplicerer risikoen ved baseline med den samme mængde uanset tid, så effekten af ​​ethvert covariat er den samme når som helst under opfølgningen, og dette er grundlaget for den antagelse om proportional fare.

Hvad er antagelsen om proportional fare?

Antagelsen om den proportionelle fare er afgørende for brugen og fortolkningen af ​​en Cox-model.

Under denne antagelse er der en konstant sammenhæng mellem resultatet eller den afhængige variabel og den covariate vektor. Implikationerne af denne antagelse er, at farefunktionerne for to personer er proportionale på ethvert tidspunkt, og fareforholdet varierer ikke med tiden. Med andre ord, hvis et individ har en dødsrisiko på et indledende tidspunkt, der er dobbelt så høj som et andet individs, så forbliver dødsrisikoen på alle senere tidspunkter dobbelt så høj. Denne antagelse indebærer, at farekurverne for grupperne skal være proportionale og ikke bør krydse. Fordi denne antagelse er så vigtig, bør den absolut testes.

Hvordan tester du antagelsen om proportional fare?

Der er en række forskellige teknikker, både grafiske og testbaserede, til vurdering af gyldigheden af ​​den antagelse om proportional fare. En teknik er simpelthen at tegne Kaplan – Meier overlevelseskurver, hvis du sammenligner to grupper uden kovariater. Hvis kurverne krydser, kan antagelsen om den proportionelle fare blive overtrådt. En vigtig advarsel til denne tilgang skal holdes for øje ved små studier. Der kan være en stor mængde fejl forbundet med estimeringen af ​​overlevelseskurver for undersøgelser med en lille stikprøvestørrelse, derfor kan kurverne krydse, selv når den antagelse om proportional fare er opfyldt. Det komplementære log-log plot er en mere robust test, der tegner logaritmen for den negative logaritme for den estimerede overlevende funktion mod logaritmen for overlevelsestid. Hvis farerne er proportionale på tværs af grupper, vil dette plot give parallelle kurver. En anden almindelig metode til at teste den antagelse om proportional fare er at inkludere et tidsinteraktionsudtryk for at bestemme, om HR ændres over tid, da tiden ofte er synderen for ikke-proportionaliteten af ​​farerne. Bevis for, at gruppen * tidsinteraktionsudtrykket ikke er nul, er bevis for proportionale farer.

Hvad hvis antagelsen om proportional fare ikke holder?

Hvis du finder ud af, at PH-antagelsen ikke holder, behøver du ikke nødvendigvis at opgive brugen af ​​Cox-modellen. Der er muligheder for at forbedre ikke-proportionaliteten i modellen. For eksempel kan du medtage andre kovariater i modellen, enten nye kovariater, ikke-lineære termer for eksisterende kovariater eller interaktioner mellem kovariater. Eller du kan stratificere analysen på en eller flere variabler. Dette estimerer en model, hvor den grundlæggende fare tillades at være forskellig inden for hvert stratum, men de kovariatiske effekter er ens på tværs af strata. Andre muligheder inkluderer opdeling af tid i kategorier og brug af indikatorvariabler, så fareforhold kan variere på tværs af tid og ændring af analysetidsvariablen (f.eks. Fra forløbet tid til alder eller omvendt).

Hvordan undersøger du semi-parametrisk modelpasning?

Ud over at kontrollere for overtrædelser af antagelsen om proportionalitet er der andre aspekter af modeltilpasning, der skal undersøges. Statistikker svarende til dem, der bruges i lineær og logistisk regression, kan anvendes til at udføre disse opgaver for Cox-modeller med nogle forskelle, men de væsentlige ideer er de samme i alle tre indstillinger. Det er vigtigt at kontrollere lineariteten af ​​den covariate vektor, hvilket kan gøres ved at undersøge resterne, ligesom vi gør i lineær regression. Imidlertid er rester i TTE-data ikke lige så ligetil som i lineær regression, dels fordi værdien af ​​resultatet er ukendt for nogle af dataene, og resterne ofte er skæve. Flere forskellige typer rester er blevet udviklet for at vurdere Cox-model, der passer til TTE-data. Eksempler inkluderer blandt andet Martingale og Schoenfeld. Du kan også se på resterne for at identificere meget indflydelsesrige og dårligt tilpassede observationer. Der er også godhed-of-fit-tests, der er specifikke for Cox-modeller, såsom Gronnesby- og Borgan-testen og det prognostiske indeks Hosmer og Lemeshow. Du kan også bruge AIC til at sammenligne forskellige modeller, selvom brugen af ​​R2 er problematisk.

Hvorfor bruge en parametrisk tilgang?

En af de største fordele ved semi-parametriske modeller er, at baseline-faren ikke behøver at specificeres for at estimere fareforhold, der beskriver forskelle i den relative fare mellem grupper. Det kan dog være, at estimeringen af ​​selve baseline-faren er af interesse. I dette tilfælde er en parametrisk tilgang nødvendig. I parametriske tilgange specificeres både farefunktionen og effekten af ​​kovariaterne. Farefunktionen estimeres ud fra en antaget fordeling i den underliggende befolkning.

Fordele ved at bruge en parametrisk tilgang til overlevelsesanalyse er:

  • Parametriske tilgange er mere informative end ikke- og semi-parametriske tilgange. Ud over beregning af relative effektestimater kan de også bruges til at forudsige overlevelsestid, faresatser og gennemsnit og medianoverlevelsestider. De kan også bruges til at forudsige absolutte risikoforudsigelser over tid og til at plotte covariatjusterede overlevelseskurver.

  • Når den parametriske form er angivet korrekt, har parametriske modeller mere magt end semi-parametriske modeller. De er også mere effektive, hvilket fører til mindre standardfejl og mere præcise estimater.

  • Parametriske tilgange er afhængige af fuld maksimal sandsynlighed for at estimere parametre.

  • Rester af parametriske modeller antager den velkendte form af forskellen i den observerede versus forventede.

Den største ulempe ved at bruge en parametrisk tilgang er, at det afhænger af antagelsen om, at den underliggende befolkningsfordeling er blevet specificeret korrekt. Parametriske modeller er ikke robuste over for fejlspecifikation, hvorfor semi-parametriske modeller er mere almindelige i litteraturen og er mindre risikable at bruge, når der er usikkerhed om den underliggende befolkningsfordeling.

Hvordan vælger du den parametriske form?

Valget af den passende parametriske form er den sværeste del af parametrisk overlevelsesanalyse. Specificeringen af ​​den parametriske form skal styres af studiens hypotese sammen med forudgående viden og biologisk sandsynlighed for formen af ​​baseline-faren. For eksempel, hvis det vides, at risikoen for død øges dramatisk lige efter operationen og derefter falder og flader ud, ville det være uhensigtsmæssigt at specificere den eksponentielle fordeling, som antager en konstant fare over tid. Dataene kan bruges til at vurdere, om den angivne formular ser ud til at passe til dataene, men disse datadrevne metoder skal supplere, ikke erstatte, hypotesedrevne valg.

Hvad er forskellen mellem en proportional faremodel og en accelereret fejltidsmodel?

Selvom modellen for proportionale farer fra Cox er semi-parametrisk, kan modeller for proportionale farer også være parametriske. Parametriske proportionelle faremodeller kan skrives som:

h (t, X) = h0 (t) exp (Xi β) = h0 (t) λ

hvor grundlinjefaren, h0 (t), kun afhænger af tid, t, men ikke af X, og λ er en enhedsspecifik funktion af kovariater, som ikke afhænger af t, der skalerer baselinefarefunktionen op eller ned. λ kan ikke være negativ. I denne model er faresatsen en multiplikativ funktion af baseline-faren, og fareforholdene kan fortolkes på samme måde som i den semi-parametriske proportionale faremodel.

AFT-modeller (Accelerated Failure Time) er en klasse af parametriske overlevelsesmodeller, der kan lineariseres ved at tage den naturlige log for overlevelsestidsmodellen. Det enkleste eksempel på en AFT-model er den eksponentielle model, der er skrevet som:

ln (T) = β0 + β1X1 +…. + βpXp + ε *

Hovedforskellen mellem AFT-modeller og PH-modeller er, at AFT-modeller antager, at effekter af kovariater er multiplikative på tidsskalaen, mens Cox-modeller bruger fareskalaen som vist ovenfor. Parameterestimater fra AFT-modeller fortolkes som effekter på tidsskalaen, som enten kan fremskynde eller bremse overlevelsestiden. Exp (β)> 1 fra en AFT-model betyder, at faktoren fremskynder overlevelsestiden eller fører til længere overlevelse. Exp (β)<1 decelerates survival time (shorter survival). AFT models assume that estimated time ratios are constant across the time scale. A time ratio of 2, for example, can be interpreted as the median time to death in group 1 is double the median time to death in group 2 (indicated longer survival for group 1).

Nogle fejlfordelinger kan skrives og fortolkes som både PH- og AFT-modeller (dvs. eksponentiel, Weibull), andre er kun PH (dvs. Gompertz) eller kun AFT-modeller (dvs. loglogistisk), og andre er hverken PH- eller AFT-modeller (dvs. montering af en spline).

Hvilke former kan parametriske modeller antage?

Fare-funktionen kan have enhver form, så længe h (t)> 0 for alle værdier af t. Mens den primære overvejelse for den parametriske form skal være forudgående kendskab til formen på baseline-faren, har hver distribution sine egne fordele og ulemper. Nogle af de mere almindelige former vil blive kort forklaret med mere information tilgængelig på ressourcelisten.

Eksponentiel distribution

Den eksponentielle fordeling antager, at h (t) kun afhænger af modelkoefficienter og kovariater og er konstant over tid. Den største fordel ved denne model er, at den både er en proportional faremodel og en accelereret fejltidsmodel, så effektestimater kan fortolkes som enten fareforhold eller tidsforhold. Den største ulempe ved denne model er, at det ofte er usandsynligt at påtage sig en konstant fare over tid.

Weibull-distribution

Weibull-distributionen svarer til den eksponentielle distribution. Mens den eksponentielle fordeling antager en konstant fare, antager Weibull-fordelingen en monoton fare, som enten kan være stigende eller faldende, men ikke begge. Det har to parametre. Formparameteren (σ) styrer, om faren øges (σ1) (i den eksponentielle fordeling er denne parameter indstillet til 1). Skalaparameteren (1 / σ) exp (-β0 / σ) bestemmer skalaen for denne stigning / fald. Da Weibull-fordelingen forenkles til den eksponentielle fordeling, når σ = 1, kan nulhypotesen om, at σ = 1 testes ved hjælp af en Wald-test. Den største fordel ved denne model er, at den både er en PH- og AFT-model, så både fareforhold og tidsforhold kan estimeres. Igen er den største ulempe, at antagelsen om monotonicitet ved baseline-faren i nogle tilfælde kan være usandsynlig.

Gompertz-distribution

Gompertz-fordelingen er en PH-model, der er lig med log-Weibull-fordelingen, så logfunktionen for fare-funktionen er lineær i t. Denne fordeling har en eksponentielt stigende fejlrate og er ofte passende til aktuarmæssige data, da risikoen for dødelighed også stiger eksponentielt over tid.

Log-logistisk distribution

Den loglogistiske fordeling er en AFT-model med et fejludtryk, der følger standardlogistikfordelingen. Det kan passe til ikke-monotone farer og passer generelt bedst, når den underliggende fare stiger til et højdepunkt og derefter falder, hvilket kan være sandsynligt for visse sygdomme som tuberkulose. Den loglogistiske fordeling er ikke en PH-model, men den er en proportional odds-model. Dette betyder, at det er underlagt den antagelse om proportional odds, men fordelen er, at hældningskoefficienter kan fortolkes som tidsforhold og også som oddsforhold. Et odds-forhold på 2 fra en parametrisk log-logistisk model, for eksempel, vil blive fortolket som odds for overlevelse ud over tid t blandt forsøgspersoner med x = 1 er dobbelt så store odds blandt forsøgspersoner med x = 0.

Generaliseret Gamma (GG) distribution

Den generaliserede gamma (GG) distribution er faktisk en familie af distributioner, der indeholder næsten alle de mest almindeligt anvendte distributioner, inklusive eksponentiel, Weibull, log normal og gamma distributioner. Dette giver mulighed for sammenligninger mellem de forskellige distributioner. GG-familien inkluderer også alle fire af de mest almindelige typer af farefunktioner, hvilket gør GG-fordelingen særlig nyttig, da farefunktionens form kan hjælpe med at optimere modelvalg.

Splines tilgang

Da den eneste generelle begrænsning af specifikationen for baseline-fare-funktionen er, ath (t)> 0 for alle værdier af t, kan splines bruges til maksimal fleksibilitet i modellering af formen for baseline-fare. Begrænsede kubiske splines er en metode, der for nylig er blevet anbefalet i litteraturen til parametrisk overlevelsesanalyse, da denne metode giver mulighed for fleksibilitet i formen, men begrænser funktionen til at være lineær i ender, hvor data er sparsomme. Splines kan bruges til at forbedre estimeringen og er også fordelagtige til ekstrapolering, da de maksimerer tilpasningen til de observerede data. Hvis det er korrekt angivet, bør effektestimater fra modeller, der passer til brug af splines, ikke være partisk. Som i andre regressionsanalyser kan udfordringer i montering af splines omfatte valg af antal og placering af knobene og problemer med overmontering.

Hvordan undersøger du parametrisk modelpasning?

Den vigtigste komponent i vurderingen af ​​parametrisk modeltilpasning er at kontrollere, om dataene understøtter den specificerede parametriske form. Dette kan vurderes visuelt ved at tegne en diagram over den modelbaserede kumulative risiko mod Kaplan-Meiers estimerede kumulative farefunktion. Hvis den angivne form er korrekt, skal grafen gå gennem oprindelsen med en hældning på 1. Grønnesby-Borgan godhed-af-pas-test kan også bruges til, om det observerede antal begivenheder er væsentligt forskelligt fra det forventede antal begivenheder i grupper differentieret efter risikoscore. Denne test er meget følsom over for antallet af valgte grupper og har en tendens til at afvise nulhypotesen om tilstrækkelig pasform for liberalt, hvis der vælges mange grupper, især i små datasæt. Testen mangler strøm til at opdage modelovertrædelser, men hvis der vælges for få grupper. Af denne grund synes det dårligt at stole på en godhed-of-fit test alene for at afgøre, om den specificerede parametriske form er rimelig.

AIC kan også bruges til at sammenligne modeller, der kører med forskellige parametriske former, med den laveste AIC, der indikerer den bedste pasform. AIC kan ikke bruges til at sammenligne parametriske og semi-parametriske modeller, da parametriske modeller er baseret på observerede begivenhedstider og semi-parametriske modeller er baseret på rækkefølgen af ​​begivenhedstider. Igen skal disse værktøjer bruges til at undersøge, om den specificerede form passer til dataene, men sandsynligheden for den specificerede underliggende fare er stadig det vigtigste aspekt ved valg af en parametrisk form.

Når den angivne parametriske form er bestemt til at passe dataene godt, kan lignende metoder til dem, der tidligere er beskrevet for semi-proportionale faremodeller, bruges til at vælge mellem forskellige modeller, såsom restdiagrammer og test af godhed-af-pasform.

Hvad hvis forudsigere ændrer sig over tid?

I ovenstående modeludtalelser har vi antaget, at eksponeringer er konstante i løbet af opfølgningen. Eksponeringer med værdier, der ændres over tid eller tidsvarierende kovariater, kan inkluderes i overlevelsesmodeller ved at ændre analyseenheden fra individet til det tidsrum, hvor eksponeringen er konstant. Dette opdeler individernes individuelle tid i intervaller, som hver person bidrager til risikosættet for udsat og ueksponeret for det covariate. Hovedantagelsen om at inkludere et tidsvarierende kovariat på denne måde er, at effekten af ​​det tidsvarierende kovariat ikke afhænger af tid.

For en Cox-proportional faremodel ville inkluderingen af ​​et tidsvarierende kovariat have form af: h (t) = h0 (t) e ^ β1x1 (t). Tidsvarierende kovariater kan også inkluderes i parametriske modeller, selvom det er lidt mere kompliceret og vanskeligt at fortolke. Parametriske modeller kan også modellere tidsvarierende kovariater ved hjælp af splines for større fleksibilitet.

Generelt bør der anvendes tidsvarierende kovariater, når det antages, at faren afhænger mere af de senere værdier for kovariatet end værdien af ​​covariatet ved baseline. Udfordringer, der opstår med tidsvarierende kovariater, mangler data om kovariatet på forskellige tidspunkter og en potentiel bias i estimering af faren, hvis det tidsvarierende kovariat faktisk er en mediator.

Hvad er konkurrerende risikoanalyse?

Traditionelle metoder til overlevelsesanalyse antager, at der kun forekommer en type begivenhed af interesse. Imidlertid findes der mere avancerede metoder til at muliggøre efterforskning af flere typer begivenheder i den samme undersøgelse, såsom død af flere årsager. Konkurrerende risikoanalyse bruges til disse undersøgelser, hvor overlevelsesvarigheden afsluttes med den første af flere begivenheder. Særlige metoder er nødvendige, fordi det kan være partisk at analysere tiden til hver begivenhed separat. Specifikt i denne sammenhæng har KM-metoden en tendens til at overvurdere andelen af ​​emner, der oplever begivenheder. Konkurrerende risikoanalyse bruger den kumulative incidensmetode, hvor den samlede hændelsessandsynlighed til enhver tid er summen af ​​de hændelsesspecifikke sandsynligheder. Modellerne implementeres normalt ved at indtaste hver enkelt deltager flere gange - en pr. Begivenhedstype. For hver deltager i studiet censureres tiden til enhver begivenhed på det tidspunkt, hvor patienten oplevede den første begivenhed. For mere information, se siden advancedepidemiology.org på konkurrerende risici .

Hvad er skrøbelige modeller, og hvorfor er de nyttige til korrelerede data?

Korrelerede overlevelsesdata kan opstå på grund af tilbagevendende begivenheder, som en person oplever, eller når observationer er grupperet i grupper. Enten på grund af manglende viden eller for gennemførlighed måles nogle kovariater relateret til begivenheden af ​​interesse muligvis ikke. Svaghedsmodeller tegner sig for heterogenitet forårsaget af ikke-målte kovariater ved at tilføje tilfældige effekter, som virker multiplikativt på fare-funktionen. Svaghedsmodeller er i det væsentlige udvidelser af Cox-modellen med tilføjelse af tilfældige effekter. Selv om der er forskellige klassifikationsordninger og nomenklaturer, der bruges til at beskrive disse modeller, inkluderer fire almindelige typer svaghedsmodeller delt, indlejret, fælles og additiv svaghed.

Er der andre tilgange til analyse af tilbagevendende hændelsesdata?

Data om tilbagevendende begivenhed er korreleret, da flere begivenheder kan forekomme inden for samme emne. Mens skrøbelige modeller er en metode til at redegøre for denne sammenhæng i tilbagevendende hændelsesanalyser, er en mere enkel tilgang, der også kan redegøre for denne sammenhæng, brugen af ​​robuste standardfejl (SE). Med tilføjelsen af ​​robuste SE'er kan tilbagevendende hændelsesanalyse udføres som en simpel udvidelse af enten semi-parametriske eller parametriske modeller.

Selvom det er simpelt at implementere, er der flere måder at modellere tilbagevendende hændelsesdata ved hjælp af robuste SE'er. Disse tilgange adskiller sig i, hvordan de definerer risikosættet for hver gentagelse. På denne måde besvarer de lidt forskellige undersøgelsesspørgsmål, så valget af hvilken modelleringsmetode, der skal bruges, skal baseres på studiens hypotese og validiteten af ​​modelleringsantagelserne.

Tælleprocessen, eller Andersen-Gill, tilgang til tilbagevendende begivenhedsmodellering antager, at hver gentagelse er en uafhængig begivenhed og ikke tager hensyn til rækkefølgen eller typen af ​​begivenhed. I denne model starter opfølgningstiden for hvert emne i starten af ​​undersøgelsen og er opdelt i segmenter defineret af begivenheder (gentagelser). Emner bidrager til den risiko, der er sat for en begivenhed, så længe de er under observation på det tidspunkt (ikke censureret). Disse modeller er enkle at passe som en Cox-model med tilføjelse af en robust SE-estimator, og fareforhold fortolkes som effekten af ​​det covariate på gentagelseshastigheden i opfølgningsperioden. Denne model ville imidlertid være uhensigtsmæssig, hvis antagelsen om uafhængighed ikke er rimelig.

Betingede tilgange antager, at et emne ikke er i fare for en efterfølgende begivenhed, før en tidligere begivenhed finder sted, og derfor tager rækkefølgen af ​​begivenhederne i betragtning. De er tilpasset ved hjælp af en stratificeret model med hændelsesnummeret (eller antallet af gentagelse, i dette tilfælde), som lagvariabel og inklusive robuste SE'er. Der er to forskellige betingede tilgange, der bruger forskellige tidsskalaer og derfor har forskellige risikosæt. Den betingede sandsynlighedsmetode bruger tiden siden starten af ​​undersøgelsen til at definere tidsintervallerne og er passende, når interessen er i hele forløbet af den tilbagevendende hændelsesproces. Gap-tidsnulstillingen nulstiller i det væsentlige uret for hver gentagelse ved at bruge tiden siden den foregående begivenhed til at definere tidsintervaller og er mere passende, når skøn over begivenhedsspecifikke effekter (eller gentagelse) er af interesse.

Endelig betragter marginale tilgange (også kendt som WLW - Wei, Lin og Weissfeld - tilgang) hver begivenhed som en separat proces, så emner er i fare for alle begivenheder fra starten af ​​opfølgningen, uanset om de oplevede en forudgående begivenhed. Denne model er passende, når begivenhederne antages at stamme fra forskellige underliggende processer, så et emne f.eks. Kan opleve en 3. begivenhed uden at opleve den første. Selv om denne antagelse synes usandsynlig med nogle typer data, som kræftgenoptræden, kan den bruges til at modellere gentagelser af skader over en periode, hvor forsøgspersoner kunne opleve forskellige typer skader over tidsperioden, der ikke har nogen naturlig orden. Marginalmodeller kan også tilpasses ved hjælp af stratificerede modeller med robuste SE'er.

Aflæsninger

Dette projekt havde til formål at beskrive de metodologiske og analytiske beslutninger, man kan stå over for, når man arbejder med data til tid til begivenhed, men det er på ingen måde udtømmende. Ressourcer gives nedenfor for at dykke dybere ned i disse emner.

Lærebøger og kapitler

Vittinghoff E, Glidden DV, Shiboski SC, McCulloch CE (2012). Regressionsmetoder i biostatistik, 2. New York, NY: Springer.

  • Introduktionstekst til modeller for lineær, logistisk, overlevelse og gentagne målinger, bedst for dem der ønsker et grundlæggende udgangspunkt.

  • Kapitel overlevelsesanalyse giver et godt overblik, men ikke dybde. Eksempler er STATA-baserede.

Hosmer DW, Lemeshow S, May S. (2008) Anvendt overlevelsesanalyse: Regression Modelling of Time-to-Event Data, 2. udgave. Hoboken, NJ: John Wiley & Sons, Inc.

  • Dybtgående overblik over ikke-parametriske, semi-parametriske og parametriske Cox-modeller, bedst for dem, der er vidende inden for andre statistiske områder. Avancerede teknikker er ikke dækket i dybden, men der henvises til andre specialbøger.

Kleinbaum DG, Klein M (2012). Survival Analysis: A Self-Learning Text, 3. udgave. New York, NY: Springer Science + Business Media, LLC

  • Fremragende indledningstekst

Klein JP, Moeschberger ML (2005). Overlevelsesanalyse: Teknikker til censureret og afkortet data, 2. udg. New York, NY: Springer Science + Business Media, LLC

  • designet til kandidatstuderende, denne bog giver mange praktiske eksempler

Therneau TM, Grambsch PM (2000). Modellering af overlevelsesdata: Udvidelse af Cox-modellen. New York, NY: Springer Science + Business Media, LLC

  • God introduktion til optælling af procesmetode og analyse af korrelerede overlevelsesdata. Forfatteren skrev også overlevelsespakken i R

Allison PD (2010). Survival Analysis Using SAS: A Practice Guide, 2. udg. Cary, NC: SAS Institute

  • En fantastisk anvendt tekst til SAS-brugere

Bagdonavicius V, Nikulin M (2002). Accelererede livsmodeller: Modellering og statistisk analyse. Boca Raton, FL: Chapman & Hall / CRC Press.

  • God ressource for mere information om parametriske og semi-parametriske accelererede fejltidsmodeller og hvordan de sammenlignes med proportionale faremodeller

Metodiske artikler

Indledende / oversigtsartikler

Hougaard P (1999). Grundlaget for overlevelsesdata. Biometri 55 (1): 13-22. PMID: 11318147 .

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Overlevelsesanalyse del I: grundlæggende begreber og første analyser. Br J Cancer 89 (2): 232-8. PMID: 12865907

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Overlevelsesanalyse del II: multivariat dataanalyse - en introduktion til begreber og metoder. Br J Cancer 89 (3): 431-6. PMID: 1288808

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Overlevelsesanalyse del II: multivariat dataanalyse – valg af model og vurdering af dens tilstrækkelighed og pasform. Br J Cancer 89 (4): 605-11. PMID: 12951864

Clark TG, Bradburn MJ, Love SB, Altman DG (2003). Overlevelsesanalyse del IV: yderligere koncepter og metoder i overlevelsesanalyse. Br J Cancer 89 (5): 781-6. PMID: 12942105

  • Serien med fire artikler ovenfor er en fremragende introduktionsoversigt over metoder til overlevelsesanalyse, der er ekstremt velskrevet og let at forstå - det anbefales stærkt.

Alder som tidsskala

Korn EL, Graubard BI, Midthune D (1997). Time-to-event-analyse af den langsgående opfølgning af en undersøgelse: valg af tidsskalaen. Am J Epidemiol 145 (1): 72-80. PMID: 8982025

  • Paper, der fortaler brugen af ​​alder som tidsskala snarere end tid til undersøgelse.

Ingram DD, Makuc DM, Feldman JJ (1997). Re: Time-to-event analyse af langsgående opfølgning af en undersøgelse: valg af tidsskala. Am J Epidemiol 146 (6): 528-9. PMID: 9290515 .

  • Kommenter Korn-papiret, der beskriver de forholdsregler, der skal træffes, når man bruger alder som tidsskala.

Thiébaut AC, Bénichou J (2004). Valg af tidsskala i Cox's modelanalyse af epidemiologiske kohortdata: en simuleringsundersøgelse. Stat Med 30; 23 (24): 3803-20. PMID: 15580597

  • Simuleringsundersøgelse, der viser størrelsen af ​​bias for forskellige grader af sammenhæng mellem alder og det covariate af interesse, når man bruger tid på undersøgelsen som tidsskalaen.

Canchola AJ, Stewart SL, Bernstein L, et al. Cox regression ved hjælp af forskellige tidsskalaer. Fås på: http://www.lexjansen.com/wuss/2003/DataAnalysis/i-cox_time_scales.pdf .

  • Et flot papir, der sammenligner 5 Cox-regressionsmodeller med variationer på enten tid på undersøgelse eller alder som tidsskala med SAS-kode.

Censur

Huang CY, Ning J, Qin J (2015). Semiparametrisk sandsynlighedsindledning for venstrestunkerede og højrecensurerede data. Biostatistik [epub] PMID: 25796430 .

  • Dette papir har en god introduktion til analysen af ​​censurerede data og giver en ny estimationsprocedure for overlevelsestidsfordelingen med venstre-afkortede og højre-censurerede data. Det er meget tæt og har et avanceret statistisk fokus.

Cain KC, Harlow SD, Little RJ, Nan B, Yosef M, Taffe JR, Elliott MR (2011). Bias på grund af venstre trunkering og venstre censurering i langsgående undersøgelser af udviklings- og sygdomsprocesser. Am J Epidemiol 173 (9): 1078-84. PMID: 21422059 .

  • En fremragende ressource, der forklarer den bias, der er forbundet med venstrecensurerede data fra et epidemiologisk perspektiv.

Sun J, Sun L, Zhu C (2007). Test af den proportionelle odds model for intervalcensurerede data.Lifetime Data Anal 13: 37–50. PMID 17160547 .

  • En anden statistisk tæt artikel om et nuanceret aspekt af TTE-dataanalyse, men giver en god forklaring på intervalcensurerede data.

Robins JM (1995a) En analysemetode til randomiserede forsøg med informativ censurering: Del I. Lifetime Data Anal 1: 241-254. PMID 9385104 .

Robins JM (1995b) En analytisk metode til randomiserede forsøg med informativ censur: Del II. Lifetime Data Anal 1: 417-434. PMID 9385113 .

  • To artikler, der diskuterer metoder til håndtering af informativ censur.

Ikke-parametriske overlevelsesmetoder

Borgan Ø (2005) Kaplan-Meier Estimator. Encyclopedia of Biostatistics DOI: 10.1002 / 0470011815.b2a11042

  • Fremragende overblik over Kaplan-Meier estimatoren og dens forhold til Nelson-Aalen estimatoren

Rodríguez G (2005). Ikke-parametrisk estimering i overlevelsesmodeller. Ledig fra: http://data.princeton.edu/pop509/NonParametricSurvival.pdf

  • Introduktion til ikke-parametriske metoder og Cox proportional hazard-model, der forklarer sammenhængen mellem metoder med de matematiske formler

Cole SR, Hernan MA (2004). Justerede overlevelseskurver med inverse sandsynlighedsvægte.Comput Methods Programs Biomed 75 (1): 35-9. PMID: 15158046

  • Beskriver brugen af ​​IPW til at skabe justerede Kaplan-Meier-kurver. Inkluderer et eksempel og SAS makro.

Zhang M (2015). Robuste metoder til at forbedre effektiviteten og reducere bias ved estimering af overlevelseskurver i randomiserede kliniske forsøg. Lifetime Data Anal 21 (1): 119-37. PMID: 24522498

  • Foreslået metode til covariatjusterede overlevelseskurver i RCT'er

Semi-parametriske overlevelsesmetoder

Cox DR (1972) Regressionsmodeller og livstabeller (med diskussion). J R Statist Soc B 34: 187-220.

  • Den klassiske reference.

Christensen E (1987) Multivariat overlevelsesanalyse ved hjælp af Cox's regressionsmodel.Hepatologi 7: 1346-1358. PMID 3679094 .

  • Beskriver brugen af ​​Cox-modellen ved hjælp af et motiverende eksempel. Fremragende gennemgang af de vigtigste aspekter af Cox-modelanalyse, herunder hvordan man tilpasser en Cox-model og kontrol af modelantagelser.

Grambsch PM, Therneau TM (1994) Proportionelle faretest og diagnostik baseret på vægtede rester. Biometrika 81: 515-526.

  • Et dybtgående papir om testning af den antagelse om proportional fare. God blanding af teori og avanceret statistisk forklaring.

Ng’andu NH (1997) En empirisk sammenligning af statistiske tests til vurdering af den antagelse om proportional fare i Cox's model. Stat Med 16: 611–626. PMID 9131751 .

  • Et andet dybtgående papir om test af den antagelse om proportionale farer, denne inkluderer diskussion af kontrol af rester og effekter af censurering.

Parametriske overlevelsesmetoder

Rodrίguez, G (2010). Parametriske overlevelsesmodeller. Ledig fra: http://data.princeton.edu/pop509/ParametricSurvival.pdf

  • kort introduktion til de mest almindelige distributioner anvendt i parametrisk overlevelsesanalyse

Nardi A, Schemper M (2003). Sammenligning af Cox og parametriske modeller i kliniske studier.Stat Med 22 (23): 2597-610. PMID: 14652863

  • Giver gode eksempler på sammenligning af semi-parametriske modeller med modeller, der bruger almindelige parametriske distributioner og fokuserer på vurdering af modeltilpasning

Royston P, Parmar MK (2002). Fleksible parametriske proportional-farer og proportional-odds modeller til censureret overlevelsesdata med anvendelse til prognostisk modellering og estimering af behandlingseffekter. Stat Med 21 (15): 2175-97. PMID: 12210632

  • God forklaring på grundlæggende forhold til proportionale farer og odds modeller og sammenligninger med kubiske splines

Cox C, Chu H, Schneider MF, Muñoz A (2007). Parametrisk overlevelsesanalyse og taksonomi af farefunktioner til den generelle gammafordeling. Statist Med 26: 4352-4374. PMID 17342754 .

  • Giver et fremragende overblik over parametriske overlevelsesmetoder, herunder en taksonomi af farefunktionerne og en grundig diskussion af den generelle gammafordelingsfamilie.

Crowther MJ, Lambert PC (2014). En generel ramme for parametrisk overlevelsesanalyse.Stat Med 33 (30): 5280-97. PMID: 25220693

  • Beskriver restriktive antagelser om almindeligt anvendte parametriske fordelinger og forklarer begrænset kubisk spline-metode

Sparling YH, Younes N, Lachin JM, Bautista OM (2006). Parametriske overlevelsesmodeller for intervalcensurerede data med tidsafhængige kovariater. Biometri 7 (4): 599-614. PMID: 16597670

  • Udvidelse og eksempel på, hvordan man bruger parametriske modeller med intervalcensurerede data

Tidsvarierende kovariater

Fisher LD, Lin DY (1999). Tidsafhængige kovariater i Cox-regressionsmodellen med proportional-farer. Annu Rev Public Health 20: 145-57. PMID: 10352854

  • Grundig og let at forstå forklaring på tidsvarierende kovariater i Cox-modeller med et matematisk bilag

Petersen T (1986). Montering af parametriske overlevelsesmodeller med tidsafhængige kovariater. Appl Statist 35 (3): 281-88.

  • Tæt artikel, men med et nyttigt anvendt eksempel

Konkurrerende risikoanalyse

Se Konkurrerende risici

Tai B, Machin D, White I, Gebski V (2001) Konkurrerende risikoanalyse af patienter med osteosarkom: en sammenligning af fire forskellige tilgange. Stat Med 20: 661–684. PMID 11241570 .

  • Godt dybdegående papir, der beskriver fire forskellige metoder til analyse af konkurrerende risikodata, og bruger data fra et randomiseret forsøg med patienter med osteosarkom til at sammenligne disse fire tilgange.

Checkley W, Brower RG, Muñoz A (2010). Slutning for gensidigt eksklusive konkurrerende begivenheder gennem en blanding af generaliserede gammafordelinger. Epidemiologi 21 (4): 557-565. PMID 20502337 .

  • Paper om konkurrerende risici ved hjælp af den generelle gammafordeling.

Analyse af klyngedata og svaghedsmodeller

Yamaguchi T, Ohashi Y, Matsuyama Y (2002) Proportionelle faremodeller med tilfældige effekter til at undersøge centereffekter i multicenter kræft kliniske forsøg. Stat Methods Med Res 11: 221-236. PMID 12094756 .

  • Et papir med fremragende teoretisk og matematisk forklaring på, hvordan man tager klynger i betragtning, når man analyserer overlevelsesdata fra kliniske multicenterforsøg.

O'Quigley J, Stare J (2002) Proportionelle faremodeller med svagheder og tilfældige effekter. Stat Med 21: 3219-3233. PMID 12375300 .

  • En head-to-head sammenligning af skrøbelige modeller og tilfældige effekter modeller.

Balakrishnan N, Peng Y (2006). Generaliseret gamma-svaghedsmodel. Statist Med 25: 2797-2816. PMID

  • Et papir om svaghedsmodeller, der bruger den generaliserede gammafordeling som svaghedsfordelingen.

Rondeau V, Mazroui Y, Gonzalez JR (2012). frailtypack: En R-pakke til analyse af korrelerede overlevelsesdata med svaghedsmodeller, der bruger penaliseret sandsynlighedsestimering eller parametrisk estimering. Journal of Statistical Software 47 (4): 1-28.

  • R-pakkevignet med god baggrundsinformation om skrøbelige modeller.

Schaubel DE, Cai J (2005). Analyse af grupperede tilbagevendende hændelsesdata med anvendelse på hospitalsindlæggelsesrater blandt patienter med nyresvigt. Biostatistik 6 (3): 404-19. PMID 15831581 .

  • Fremragende papir, hvor forfatterne præsenterer to metoder til at analysere klyngede tilbagevendende hændelsesdata, og derefter sammenligner de resultater fra de foreslåede modeller med dem baseret på en svag model.

Gharibvand L, Liu L (2009). Analyse af overlevelsesdata med klyngede begivenheder. SAS Global Forum 2009 Paper 237-2009.

  • Kortfattet og let at forstå kilde til analyse af tid til begivenhedsdata med klyngede begivenheder med SAS-procedurer.

Tilbagevendende hændelsesanalyse

Twisk JW, Smidt N, de Vente W (2005). Anvendt analyse af tilbagevendende begivenheder: et praktisk overblik. J Epidemiol Community Health 59 (8): 706-10. PMID: 16020650

  • Meget let at forstå introduktion til tilbagevendende begivenhedsmodellering og begrebet risikosæt

Villegas R, Juliá O, Ocaña J (2013). Empirisk undersøgelse af korrelerede overlevelsestider for tilbagevendende hændelser med proportionale faremargener og effekten af ​​korrelation og censurering.BMC Med Res Methodol 13:95. PMID: 23883000

  • Bruger simuleringer til at teste robustheden i forskellige modeller for tilbagevendende hændelsesdata

Kelly PJ, Lim LL (2000). Overlevelsesanalyse for tilbagevendende hændelsesdata: en applikation til infektionssygdomme hos børn. Stat Med 19 (1): 13-33. PMID: 10623190

  • Anvendte eksempler på de fire hovedtilgange til modellering af tilbagevendende hændelsesdata

Wei LJ, Lin DY, Weissfeld L (1989). Regressionsanalyse af multivariate ufuldstændige fejltidsdata ved modellering af marginale fordelinger. Journal of the American Statistical Association84 (108): 1065-1073

Den originale artikel, der beskriver marginale modeller til tilbagevendende begivenhedsanalyse

Kurser

Epidemiologi og befolkningssundhedssommerinstitut ved Columbia University (EPIC)

Statistical Horizons, privat udbyder af specialiserede statistiske seminarer undervist af eksperter inden for området

Interuniversitetskonsortium for politisk og social forskning (ICPSR) Sommerprogram i kvantitative metoder til social forskning, en del af Institute for Social Research ved University of Michigan

  • 3-dages seminar om overlevelsesanalyse, modellering af begivenhedshistorie og varighedsanalyse, der blev tilbudt 22. - 24. juni 2015 i Berkeley, Californien, undervist af Tenko Raykov fra Michigan State University. Omfattende oversigt over overlevelsesmetoder på tværs af discipliner (ikke kun folkesundhed): http://www.icpsr.umich.edu/icpsrweb/sumprog/courses/0200

Institute for Statistics Research tilbyder to online kurser til overlevelsesanalyse, der tilbydes flere gange om året. Disse kurser er baseret på den anvendte analyse-lærebog af Klein og Kleinbaum (se nedenfor) og kan tages a la carte eller som en del af et certifikatprogram i statistik:

Instituttet for digital forskning og uddannelse ved UCLA tilbyder det, de kalder seminarer, via deres hjemmeside til overlevelsesanalyse i forskellige statistiske software. Disse seminarer demonstrerer, hvordan man gennemfører anvendt overlevelsesanalyse med mere fokus på kode end teori.

Interessante Artikler

Redaktørens Valg

NPD v. City of Zittau
NPD v. City of Zittau
Columbia Global Ytringsfrihed søger at fremme forståelsen af ​​de internationale og nationale normer og institutioner, der bedst beskytter den frie strøm af information og udtryk i et sammenkoblet globalt samfund med store fælles udfordringer at tackle. For at nå sin mission foretager og bestiller Global Freedom of Expression forsknings- og politikprojekter, organiserer begivenheder og konferencer og deltager i og bidrager til globale debatter om beskyttelse af ytringsfrihed og information i det 21. århundrede.
Amerikanere tror på videregående uddannelse som et offentligt gode, finder en ny undersøgelse
Amerikanere tror på videregående uddannelse som et offentligt gode, finder en ny undersøgelse
Amerikanere tror på videregående uddannelse som et offentligt gode, finder en ny undersøgelse
Anklagemyndighed v. Roberto Spada
Anklagemyndighed v. Roberto Spada
Columbia Global Ytringsfrihed søger at fremme forståelsen af ​​de internationale og nationale normer og institutioner, der bedst beskytter den frie strøm af information og udtryk i et sammenkoblet globalt samfund med store fælles udfordringer at tackle. For at nå sin mission foretager og bestiller Global Freedom of Expression forsknings- og politikprojekter, organiserer begivenheder og konferencer og deltager i og bidrager til globale debatter om beskyttelse af ytringsfrihed og information i det 21. århundrede.
X mod Google Frankrig og Google Inc.
X mod Google Frankrig og Google Inc.
Columbia Global Expression Freedom søger at fremme forståelsen af ​​de internationale og nationale normer og institutioner, der bedst beskytter den frie strøm af information og udtryk i et sammenkoblet globalt samfund med store fælles udfordringer at tackle. For at nå sin mission påtager Global Freedom of Expression forsknings- og politikprojekter, organiserer begivenheder og konferencer og deltager i og bidrager til globale debatter om beskyttelse af ytringsfrihed og information i det 21. århundrede.
GOOGLE FRIGIVER SIKKERHEDSOPDATERINGER FOR KROM 10. MAJ 2021
GOOGLE FRIGIVER SIKKERHEDSOPDATERINGER FOR KROM 10. MAJ 2021
Teachers College, Columbia University, er den første og største uddannelseskole i USA og er også evigt rangeret blandt landets bedste.
SCAT Airlines mod Sergei Vitalevich Kim
SCAT Airlines mod Sergei Vitalevich Kim
Columbia Global Ytringsfrihed søger at fremme forståelsen af ​​de internationale og nationale normer og institutioner, der bedst beskytter den frie strøm af information og udtryk i et sammenkoblet globalt samfund med store fælles udfordringer at tackle. For at nå sin mission foretager og bestiller Global Freedom of Expression forsknings- og politikprojekter, organiserer begivenheder og konferencer og deltager i og bidrager til globale debatter om beskyttelse af ytringsfrihed og information i det 21. århundrede.
Knight First Amendment Institute mod Donald J. Trump
Knight First Amendment Institute mod Donald J. Trump
Columbia Global Ytringsfrihed søger at fremme forståelsen af ​​de internationale og nationale normer og institutioner, der bedst beskytter den frie strøm af information og udtryk i et sammenkoblet globalt samfund med store fælles udfordringer at tackle. For at nå sin mission foretager og bestiller Global Freedom of Expression forsknings- og politikprojekter, organiserer begivenheder og konferencer og deltager i og bidrager til globale debatter om beskyttelse af ytringsfrihed og information i det 21. århundrede.