공부해 봅시다/Pathology

생존 분석

Anonymous Pathologist 2014. 7. 21. 15:39




내가 필요한 부분만 참고해서 확인한 것임.

  1. KM 추정의 기본 가정들: 개개의 생존 시간은 독립적임. 중도절단은 생존시간과 독립적임. 마지막 관측된 시점이 중도 절단일 경우 별도의 추가적으로 분산을 구하는 공식이 있음. SPSS, R 등에서는 자동으로 진행됨.
  2. 생존함수의 비교
    1. Log-rank (로그 순위 검정): 모든 시간대에 동일한 가중치 부여
    2. Weighted log-rank test (가중 로그 순위검정): 특정 시간대에 가중치를 부여 하는 방식임. 전체 구간에 걸쳐서 동일한 가중치를 부여할 수 있음(log-rank test). 초기 시점에 가중치를 부여할 수 있음(Gehen, Peto-Prentice). 후반부에 가중치를 부여할 수 있음(R에서 rho = -1로 설정)
  3. 모수회귀모형: 과거 연구를 통해 관련 자료가 어떤 분포를 따른 다고 알려져 있을 때 적용 가능하다고 함.
  4. 비례위험모형: 모수모형의 가정에 영향을 받지 않는다. Cox PH
    1. 생존시간과 공변량의 관계가 위험함수를 통해서 표현됨. 위험률의 비는 시간에 의존하지 않고 항상 일정하다는 가정(시간에 따라서 불변함).
    2. 원래 가정은 사건 발생 시간들이 모두 서로 다름이 가정되어 있음. 동일 생존시간 및 사건(tie 라고 표현됨)을 처리하기 위한 방법으로는 Breslow, Efron 등의 방법이 있음. SPSS 에서는 Breslow 가 기본적으로 제공되고 있음. R에서는 Efron 방법을 기본으로 제공하고 있으며, Breslow 나 기타 방법을 적용할 수 있음. Efron 방법은 tie 수가 많지 않을 때 만족스러운 결과를 제시한다고 되어 있음(그 수치에 대한 설명은 없음).
    3. 이 책에서는 시간 가변 공변량에 대한 설명이 조금 이상함. R에서 제공하고 있는 tt() 에 대한 설명이 없음. 
    4. Stratum 을 분석에 고려해볼 것.
  5. 회귀모형 진단
    1. Martingale residual 마팅게일 잔차: 산점도 scatter plot 을 통해서 적절한 공변량의 형태(log 변화 여부)를 고려할 수 있다고 함. 하지만, 병리 분야에서는 연속변수가 없다시피하기 때문에 산점도가 예쁘게 그려지지 않음. 회의적임. 
    2. Cox-Snell 잔차: 무슨 말인지 모르겠음.
    3. Devicancel residual: 편차 잔차. 이상치(outlier)를 식별할 수 있음. 잘 모르겠음. 그리고 연속 변수가 아니면 그래프가 예쁘게 그려지지도 않음.
    4. Schoefled residual: 이 자체로는 무슨 말인지 모르겠음.
    5. Grambsch and Therneau test: 시간에 따른 공병량의 효과가 고정되는 Cox PH 모형의 가정을 검정할 수 있음. Scale Schoenfeld 를 이용함. R에서 편하게 구할 수 있음.