[1] 사전 준비
테스트 분석용 및 교육 실습용: 충치 진단 AI 솔루션 및 검진 예방관리 서비스
(치과치료 이미지;구강사진 데이터는 개인정보라 접근 어려움 -> 합성데이터 필요)
데이터 공급자: 랭스치과의원
합성데이터 생성기관: (주)AIT 스토리(구강사진 데이터 처리 위탁받아 합성이미지로 직접 생성)
합성데이터 수요자: 연세 세브란스 병원, 한국인터넷 진흥원(공동 소유권자로서 교육 실습 등 목적에 활용)
[원본 특성 검토]
개인정보 포함 여부: 치과 내부정보를 통해 환자 개인 식별 가능 -> 개인정보로 판단됨
파일명이 환자이름과 촬영일자로 되어있으므로 비식별 처리 필요
[관련 법률 검토]
해당 프로젝트는 인간대상연구*에 해당하여, 「생명윤리법」에 따라 기관생명윤리심의위원회(IRB) 심의대상이므로, 합성데이터 생성 수행에 앞서 IRB 심의를 받음
* 인간대상연구: 사람을 대상으로 물리적으로 개입하거나 의사 소통, 대인 접촉 등의 상호작용을 통하여 수행하는 연구 또는 개인을 식별할 수 있는 정보를 이용하는 연구 (「생명윤리법」 제2조제1호)
< IRB 심의 주요 내용 >
(연구목적) 충치 데이터의 합성 및 데이터 증폭을 통해, 치과병원에서 인식 학습을 통한 AI 충치진단 솔루션 및 서비스 개발을 위한 기반 기술확보를 위한 연구
(연구책임자) AIT스토리 부대표(연구총괄)
(공동연구자) 랭스치과 대표원장(개인정보처리자 및 책임자)
(연구담당자) AIT스토리 연구원
(연구지원기관) 랭스치과, 한국인터넷진흥원
내부 규정 확인: 치과 내부 규정에 따라 원본 데이터(파일이름) 전처리하여 식별성 없는 상태로 AIT스토리에 제공
원본 데이터는 외부로 반출 X, 일련의 합성 데이터 생성 작업은 치과내 안전한 처리 장소에서 진행
협의 계약사항 확인: 공급자, 수요자 간 공동연구 협약, 개인정보 보호법에 따라 개인정보 처리 위탁계약(랭스치과-AIT스토리) 체결
[2] 합성데이터 생성
모델 결정: styleGAN3(ADA; Adaptive Discriminator Augmentation) , SOTA 모델 활용
* styleGAN는 무작위 이미지 생성 -> 생성된 이미지는 완전 합성 데이터
유의점: 지나치게 원본과 유사한 생성 혹은 overfitting 여부 검증 필요
전처리: 구강 영역 외 얼굴, 코, 턱, 수염이 촬영된 경우, 해당 부분을 crop하는 전처리 수행
높은 해상도 = 학습비용 증가, 서로 크기가 다른 이미지들 -> 512 x 512로 사이즈 통일
개인식별자 처리방식: 파일이름에 포함된 환자이름, 촬영일자는 비식별 처리
학습 방법: 상악치, 하악치 별도 수행(2개 학습모델 생성), 학습 결과 주기적 확인으로 과적합 방지 Early stopping 사용
유용성이 높게 측정된 최적의 하이퍼 파라미터를 찾아서 훈련
[3] 유용성, 안전성 검증
검증 방법: 필요한 합성데이터 수량 500장의 2배(1000장) 이하의 합성데이터를 생성 후, 검증과정을 통해 기준 미달 삭제
* 만약 목표한 데이터 수량을 확보하지 못한 경우(목표 수량의 50%, 250장 이하인 경우 -> 생성단계 2로 재수행)
50%이상인데 500장 이하인 경우 유용성,안전성 기준이 높은 데이터 샘플링
[유용성 검증]
1) 모델성능 검증: 원본 임의 100장만 학습한 모델 (가), 합성데이터 임의 100장만 학습한 모델 (나)을 만들고, 학습에 사용되지 않은 원본 데이터 132장에 대해 충치 여부 판별을 수행했을 때, 두 모델 간의 정확도 성능 비교
원본 데이터로 학습된 모델과 비교할 때 95분위수 이상의 성능을 지님 -> 유용성 임계값 충족
2) VTT (Visual Turing Test)
[치의학 전문가가 받은 고지사항]
▸ 무작위 샘플에 원본과 AI로 만든 이미지(합성데이터)가 같은 수량이며, AI로 만든 이미지를 최대한 찾는 것이 목표
▸ 각 100장 혼합 샘플에서 50장의 합성 이미지를 찾아내야 함
▸ 제한시간 60분
결과: 평균 66% 정답률 산출 -> 30~70%내의 정답률이므로 유용성 임계값 충족
3) 이미지 품질검증 (FID): pytorch-fid모듈 사용
임계값: 100장 원본 임의분할하여 50장씩 두 개의 셋으로 구성하고 FID측정을 100회 반복 후, 누적된 측정값의 95분위수
FID 임계값 측정 결과
상악치: 84.577~
하악치: 73.997~
유용성 측정 및 임계값 충족 여부: 50장씩 데이터 셋 구성 후 점수가 높은 데이터를 우선 사용, 최종 선발 500장 데이터 셋 FID 측정 -> 측정값 평균이 모두 임계값 이하임을 확인
[안전성 검증]
1) 생성과정 검증
2) 구조적(MS-SSIM), 지각적(LPIPS) 유사도 검증: 이미지 유사도 검증
임계값: 100장 원본을 임의분할하여 50장씩 두 개의 셋으로 구성 후, 구조적·지각적 유사도 측정을 100회 반복하여 누적된 측정값의 99분위수
안전성 측정 방법: 각각 합성데이터에 대해 모든 원본 이미지로 1:1 유사성 비교 점수 측정, 합성데이터 1개와 원본 전체를 비교 후 평균내는 전수조사
-> 전체 측정 평균은 모두 임계값 이하로 측정 BUT, 일부 임계값보다 높게 측정된 합성이미지 有
-> 해당 이미지는 안전성 주관적 검증 수행 필요
3) 주관적 검증: 위에 임계값 넘은 이미지 대상으로 인간이 직접 원본 유사성, 개인식별성 안전성 검토
결과: 안전함 (원본 유사 or 개인 식별 요인 없음으로 판별)
[4] 활용
객관적 검증을 위해 외부전문가를 통해 적정성 심의를 받음(외부전문가 5인; 법률2인, 보건2인, 정보보호 1인)
결과: 데이터 생성 및 검증 과정이 적절하다 판단
'TechStudy > SyntheticData' 카테고리의 다른 글
합성데이터 사례: 기업개요 및 주주 신용등급 (0) | 2024.06.18 |
---|---|
합성데이터 사례: 통신사 멤버십 사용내역 (0) | 2024.06.18 |
합성데이터 사례: 혈당 측정정보 (0) | 2024.06.18 |
합성데이터 사례: 안전모 착용 감지 AI 솔루션 (0) | 2024.06.18 |
합성 데이터 개념 (개인정보보호위원회, 인하대, 서울대) (0) | 2024.06.17 |