상식닷컴
로그인
가입하기
2026년 상식닷컴 선정 식당 & 카페 리스트
2025년 2026년 신상 호텔 리스트
최근에 오픈한 호텔을 찾는다면 살펴보세요
일주일 식단표 어플
자동 일주일 식단표 어플
안드로이드
아이폰
주식 & 코인 차트의 신
1000만원으로 2000만원 만들기 프로젝트
수정하기 - 머신러닝알고리즘: ROC 곡선이란 무엇인가요?
닉네임
비밀번호
제목
내용
[이미지 업로드는 권한이 있는 사람만 가능. 하단 카톡으로 연락]
ROC(Receiver Operating Characteristic) 곡선은 이진 분류 모델의 성능을 평가하기 위해 널리 사용되는 시각화 도구입니다. ‘수신자 조작 특성’이라는 뜻을 지니고 있으며, 분류 결과를 긍정(positive)과 부정(negative)으로 나누었을 때, 모델이 실제 양성인 샘플과 음성인 샘플을 얼마나 잘 구분해 내는지를 한눈에 보여 줍니다. 먼저 축(axes)에 대해 살펴보면, 가로축은 False Positive Rate(FPR), 즉 실제 음성(Negative)임에도 모델이 양성(Positive)으로 잘못 예측한 비율을 나타냅니다. 반면, 세로축은 True Positive Rate(TPR) 혹은 민감도(sensitivity)라고도 불리며 실제 양성 샘플 중 모델이 올바르게 양성으로 예측한 비율을 의미합니다. 이 두 값을 여러 분류 임계값(threshold)을 변화시키며 계산하여, 임계값에 따라 달라지는 FPR과 TPR의 쌍을 연결하면 곡선 형태가 나타나게 됩니다. 임계값은 모델이 예측 확률을 ‘양성’이라고 판단할 <a href='https://sangseek.com/sangseeks/경계값/ko'>경계값</a>을 의미합니다. 예를 들어 어떤 샘플에 대한 예측 확률이 0.7인데 임계값을 0.5로 설정했다면 양성으로, 0.8로 설정했다면 음성으로 분류하는 식입니다. 임계값을 낮추면 더 많은 샘플을 양성으로 예측하므로 TPR과 FPR이 모두 높아지고, 임계값을 높이면 양성 예측이 엄격해져 두 비율이 모두 낮아집니다. <a href='https://sangseek.com/sangseeks/ROC 곡선/ko'>ROC 곡선</a>은 이 변화 과정을 시각적으로 보여 주므로, 모델이 특정 FPR 수준에서 얼마나 많은 TPR을 얻는지 다양한 관점에서 확인할 수 있습니다. ROC 곡선을 통해 얻는 주요 지표로는 AUC(Area Under the Curve)가 있습니다. AUC는 ROC 곡선 아래 면적을 의미하며 0.5에서 1 사이의 값을 가집니다. 0.5는 무작위 추측과 동일한 수준을, 1에 가까울수록 완벽한 분류 성능을 뜻합니다. AUC 값이 높다는 것은 모델이 전반적으로 양성과 음성을 잘 구분한다는 의미로 해석할 수 있으며, 서로 다른 모델 간 비교나 하이퍼파라미터 튜닝 결과를 평가할 때 유용합니다. 또한 ROC 곡선은 클래스 불균형 클래스(positive와 negative 샘플 수가 크게 차이 나는 상황)에서도 비교적 평가 편향이 적다는 장점이 있습니다. 그러나 실제 업무 환경에서는 특정 지점의 민감도나 특이도(specificity)가 더 중요할 수 있으므로, 임계값을 어떻게 선택할지, 그리고 ROC뿐 아니라 Precision-Recall 곡선 같은 다른 지표도 함께 고려하는 것이 바람직합니다. 이렇게 다양한 시각에서 모델 성능을 검토하면 보다 균형 잡힌 분류 시스템을 구축할 수 있습니다.
이용안내
커뮤니티 이용안내
×
- 게시한 게시글로 발생하는 문제는 게시자에게 책임이 있습니다.
- 게시글이 타인/타업체의 저작권을 침해할 경우 모든 책임은 게시자에게 있습니다. 게시자가 모든 손해를 부담해야 합니다.
- 상식닷컴 운영자는 게시자와 상의하지 않고 게시글을 수정 또는 삭제할 수 있습니다.
- 상식닷컴 운영자는 깨끗한 커뮤니티 공간을 만드는 것이 1순위입니다.
수정하기
취소하기