728x90
SMALL
- 이번에는 특정 병원에서의 No-show 데이터로 분석했던 내용들을 정리해보고자 합니다.
🏥 No-show 환자를 줄이자! 프로젝트
- 특정 A 병원에서는 예약한 환자들이 오지 않아 진료가 원활히 이루어지지 않는 일이 종종 발생한다고 합니다.
- 문제를 해결하기 위해서 예약하고 오지 않는 환자들의 특징을 파악하고, 'No Show'의 발생률을 줄일 수 있는 아이디어를 제시해보고자 데이터를 분석하려고 합니다!
✨ 데이터 읽어보고 확인
- 데이터의 컬럼명을 확인해보니 다음과 같은 컬럼들이 존재하고 있었습니다.
속성 | 타입 | 설명 |
PatientId | float | 환자ID |
AppointmentID | int | 예약ID |
Gender | F or M | 성별 |
ScheduledDay | datetime | 병원 예약 날짜 |
AppointmentDay | datetime | 실제 병원 방문 날짜 |
Age | int | 나이 |
Neighbourhood | string | 병원 위치 |
SMS_received | 0 or 1 | 메시지 수락 여부 |
No-show | Yes or No | No-show 여부 |
- 그리고 전반적인 데이터의 정보를 확인해보니 누락된 값은 없는 것으로 확인되었습니다.
✨ 데이터 전처리
💡 결측치, 이상치 확인 후 처리
- 이번에는 전에 썼던 방식(isnull().sum())이 아닌, isnull().any(axis=1)를 사용해서 결측치를 확인해보았습니다.
- 여기서 axis=1로 설정하면 행별 열 방향을 의미하는 것이고,
- axis=0으로 설정하면 컬럼(열)별 행 방향을 의미하는 것입니다.
- describe() 함수를 사용하여 통계량을 확인해본 결과, 나이가 음수인 값이 존재해서 나이가 0 이상인 값으로만 추출해 이상치를 제거해냈습니다.
💡 새로운 변수 추가
- 저희는 'wating_day' 컬럼을 추가했는데, 이 컬럼의 의미는 환자가 예약하고 병원을 방문하기까지의 기다리는 기간을 의미합니다.
- 이 컬럼의 정보를 보니 기다리는 기간인데도 음수인 값이 존재했기 때문에 이 값을 제거하기 위해서 0과 같거나 큰 값만 추출해냈습니다.
- 또 추가적으로 boxplot()으로 시각화하여 이상치를 제거하는 작업도 거치게 되었습니다.
✨ 데이터 시각화
- 이후, 목적에 적합하도록 변수끼리의 상관 관계를 분석하며 여러 시각화를 진행해보았습니다.
🎨 대기 기간에 따른 No-show와 show 환자 건 수 비교
- 대기 기간이 10일 이하인 사람들에 대해서만 먼저 비교를 진행해봤습니다.
- 당일 예약의 경우에는 거의 No-show가 발생되지 않는다는 것을 알 수 있었습니다.
🎨 예약 날짜, 방문 날짜에 따른 No-show와 show 환자 건 수 비교
- 예약 날짜, 방문 날짜 변수와 No-show 변수 간의 상관성을 한 번 살펴보기 위해 시각화를 해보았습니다.
- 5~6월 사이에 예약 환자가 많고, No-show 환자의 비율은 3~4월이 많은 것으로 확인이 되었습니다.
- 이 그래프에서의 특이점은 딱히 없었으나, 환자들의 병원 방문 날짜는 6월 초에 많았던 것으로 확인됩니다.
🎨 환자의 병원 예약 횟수로 재방문 확인해보기
- 병원 방문 횟수가 높은 상위 500명을 대상으로 예약 횟수의 분포를 확인해보았습니다.
- 예약 횟수를 확인해보니 50~60번 사이로 예약을 가장 많이 하는 것으로 보입니다.
- 추후 시각화를 더 진행하였지만, 유의미한 그래프는 이 정도인 듯 하여 여기서 결론을 지어보겠습니다!
✨ 프로젝트 결론
- 시각화에 따른 환자들의 특징으로는
- 환자들은 예약 기간이 길수록 No-show를 하는 경향이 있고,
- 3개월 안에 50회 이상의 재방문이 있고,
- 재방문 횟수 상위 10명을 살펴봤을 때, 수는 많지 않지만 No-show를 하는 경향이 있고,
- 알림 미허용 시, 대기일수가 5일 이상이면 No-show,
- 알림 허용 시, 대기일수가 18일 이상이면 No-show,
- 마지막으로 알림을 허용한 사람보다 알림을 미허용한 환자들이 더 많은 No-show를 한다는 것이었습니다.
- 이에 따라서 환자의 대기 기간을 짧게 잡아주도록 하고, 환자들이 알림을 허용할 수 있도록 독려하는 것이 좋겠습니다.
728x90
LIST
'Projects > LG U+' 카테고리의 다른 글
[Data Analysis] 국내 항공기 운항 데이터 (4) | 2025.03.10 |
---|---|
[Data Analysis] 심부전 데이터 (8) | 2025.03.09 |
[Data Analysis] 한국복지패널 데이터 (13) | 2025.03.09 |
[Data Analysis] 야후 파이낸스 주식 데이터 (4) | 2025.03.05 |
[Data Analysis] 미국 항공기 운항 데이터 (4) | 2025.03.02 |