예상 매칭: 4건
다음 예약일 경과
next_visit < 2026-06-08
예정된 후속 방문일이 이미 지난 샘플 행을 찾습니다.
EMR CSV Cohort Extractor
비식별 CSV를 기준으로 반복적인 대상자 추출 작업을 빠르게 자동화합니다.
의원 운영에서는 재내원, 검사, 추적관리 대상자를 반복적으로 추출해야 하는 경우가 많습니다. 하지만 수동 CSV 필터링은 느리고 기준이 흔들리기 쉬우며, 실제 환자 데이터가 섞이면 공개와 검토가 모두 위험해집니다.
openkiki.org는 이 프로젝트를 공개 가능한 위키와 빌드 로그로 먼저 정리하고, 실제 도구 구현은 별도 로컬 앱 또는 별도 프로젝트로 분리합니다.
첫 버전은 작고, 검토 가능하며, 공개적으로 설명해도 안전한 범위로 유지합니다.
P06은 합성 데이터만 사용해 실제 환자 정보를 노출하지 않고도 업무 흐름을 설명할 수 있게 합니다.
이 경계는 프로젝트를 임상 또는 운영 실사용 시스템이 아니라 워크플로 프로토타입으로 유지하기 위한 기준입니다.
P06은 이후 별도 추출기 프로토타입의 입력 계약으로 사용할 안정적인 가짜 CSV를 갖습니다.
공개용 샘플 파일
이 CSV는 P06을 위한 첫 번째 재사용 가능 합성 데이터셋입니다. 실제 환자 데이터를 openkiki.org에 가져오지 않고도 이후 추출기 앱의 안정적인 입력 계약으로 사용할 수 있습니다.
합성 샘플 데이터 전용입니다. 실제 환자 데이터, 차트번호, 연락처, 보험 정보, EMR 내보내기 파일은 사용하지 않습니다.
첫 추출기 프로토타입에서는 아래 컬럼 구조를 안정적으로 유지합니다.
| 컬럼 | 타입 | 필수 | 설명 |
|---|---|---|---|
| patient_id | string | 예 | 실제 차트번호가 아닌 합성 샘플 ID입니다. |
| age | integer | 예 | 필터와 테이블 테스트를 위한 가짜 나이 값입니다. |
| sex | M | F | U | 예 | 샘플 행 다양성을 위한 가짜 성별 코드입니다. |
| diagnosis | category | 예 | 실제 진단이 아닌 워크플로 테스트용 가짜 분류입니다. |
| hba1c | float | empty | 아니오 | 임상 데이터가 아닌 필터 연습용 가짜 숫자 값입니다. |
| last_visit | YYYY-MM-DD | 예 | 장기 미내원 필터링을 위한 가짜 마지막 방문일입니다. |
| next_visit | YYYY-MM-DD | empty | 아니오 | 다음 예약 누락 테스트를 위한 가짜 예약일 또는 빈 값입니다. |
예상 매칭: 4건
next_visit < 2026-06-08
예정된 후속 방문일이 이미 지난 샘플 행을 찾습니다.
예상 매칭: 7건
2026-06-08 <= next_visit <= 2026-06-22
기준일로부터 14일 안에 후속 방문일이 있는 샘플 행을 찾습니다.
예상 매칭: 3건
next_visit is empty
후속 방문일이 비어 있는 샘플 행을 찾습니다.
예상 매칭: 5건
diagnosis = diabetes AND hba1c >= 8.0
임상 판단 없이 분류와 숫자 필터를 조합하는 연습용 조건입니다.
예상 매칭: 2건
last_visit <= 2025-12-08
기준일로부터 180일 이상 방문 공백이 있는 샘플 행을 찾습니다.
다음으로는 브리프를 작고 테스트 가능한 산출물로 바꾸는 것이 가장 유용합니다.