주저리 주저리

For IRB

Anonymous Pathologist 2010. 6. 9. 07:52


  연구를 위한 자료 수집을 하다보면 환자의 신상 정보가 포함될 수 밖에 없는데 이러면 환자 정보가 노출될 가능성이 있어서 IRB에서는 금지하고 있다. 물론 신상정보가 반드시 있어야 하는 연구도 있겠지만 일반적으로는 쉽게 의료 정보를 검색하기 위하여, 파일을 별도로 두기가 귀찮아서 같이 보관한다. 하지만 IRB 심사가 강화되고 있는 상황에서는 이 문제를 해결해야만 한다. 그 동안 곰곰히 생각해 왔는데 그에 따른 필요 조건들을 생각해 보았다.

0. 임의번호 할당
  나이, 연령등은 중요한 고려 인자이기 때문에 배제하기는 힘들다. 다른 개인 정보는 배제할 수 있기 때문에 어떤 고유의 번호를 할당하면 될 것이다. 입력하는 순서대로 1번부터 할당하는 방법도 있을 것이고, 임의의 숫자나 숫자와 문자 조합을 사용하는 방법도 있다. 다만, 순서대로 할당하는 방법은 숫자의 크기에 따라서 Bias가 생길 가능성이 있어 임의의 숫자+문자 조합이 좋을 것 같다.

1. CSPRNG(Cryptographically secure pseudo-random number generator )
  꼭 안전해야하는 것은 아니지만, 예측 불가능한 점은 좋은 요건이 될 것이다. 만일 성공적으로 이런 번호 할당 시스템을 구축할 수 있다면 다른 곳에도 권유할 수도 있다. 사람이 임의로 고른다면 역시 bias가 생기게 되므로, 이를 해결하기 위한 신뢰할만한 방법이 있어야 한다.

2. 중복된 것이 없을 것.
  한 번에 어느 정도의 번호를 만들어낼 것인가가 문제가 될 것 같다. 1000명 정도라면 왠만한 것은 해결할 수 있겠지만, 5000개 정도면 당분간 문제는 없을 것이다. 하지만, 필요하다면 증가할 수도 있는 옵션이 있어야 한다.

2.1 우연의 일치
  한 연구내에서는 중복된 숫자가 발생하면 안된다. 하지만, 여러 연구를 하다보면 중복된 번호 발생이 생길 수는 있지만, 같은 번호가 같은 환자를 의미하지는 않기 때문에 문제 없을 것으로 본다.

3. 출력의 문제
  연구 Data는 보통 엑셀에 저장을 한다. 생성된 번호는 엑셀에서 쉽게 불러올 수 있는 구조이어야 한다.

4. 별도의 신상 정보 파일은 어떻게 안전하게 보관하는가?
  첫 번호 혹은 마지막 번호를 사용하여 파일 압축시 암호를 설정하면 되지 않을까?

4.1 분실시를 대비하여 프린트 해야할 필요가 있을 것인가?

공부 좀 해봐야 겠다. ㅡㅡ


RNGkind(kind="Mersenne-Twister")

NUMBER <- 5000

a <- matrix(nrow=NUMBER, ncol=1)
b <- matrix(nrow=NUMBER, ncol=1)
c <- matrix(nrow=NUMBER, ncol=1)

a[,1] <- trunc(runif(NUMBER) * 10e07)
b[,1] <- a[,1]

for (Y in 1:NUMBER){
 COUNT <- 0;  for (X in 1:NUMBER) {
   if (a[X,1] == b[Y,1]) {COUNT <- COUNT + 1;c[Y,1] <- COUNT}
   }
}

COUNT1 <- 0
for (X in 1:NUMBER) {if (c[X,1] >= 2) {COUNT1 <- COUNT1 + 1}}

if (COUNT1 == 0) {print("SAFE")} else {print("Danger")}

  적어도 중복된 수는 발생하지 않을 수 있다는 것은 알게 되었는데... 정말로 RANDOM 한가??

'주저리 주저리' 카테고리의 다른 글

축구 내기  (0) 2010.06.17
현재 병리과는..  (0) 2010.06.15
흑..  (0) 2010.06.06
괴로운 구내염..  (6) 2010.06.01
APCN 2010  (0) 2010.05.30