상식닷컴
로그인
가입하기
2026년 상식닷컴 선정 식당 & 카페 리스트
2025년 2026년 신상 호텔 리스트
최근에 오픈한 호텔을 찾는다면 살펴보세요
일주일 식단표 어플
자동 일주일 식단표 어플
안드로이드
아이폰
주식 & 코인 차트의 신
1000만원으로 2000만원 만들기 프로젝트
궁금한 상식 보기
울란바토르의 인구는 몇 명인가요?
몽골에서 가장 유명한 전통 음식 요리사는 누구인가요?
대만의 과일 생산에 영향을 미치는 기후 요인은 무엇인가요?
베트남의 무역 협정이 경제에 미치는 영향은 무엇인가요?
치앙마이에서 야외 활동을 즐길 수 있는 명소는 어디인가요?
치앙마이에서 커플을 위한 로맨틱한 식사 장소는 어디인가요?
플레이스테이션의 최근 출시된 게임 중 가장 기대되는 타이틀은 무엇인가요?
플레이스테이션의 배경화면을 변경하는 방법은 무엇인가요?
보홀에서 ATV 투어를 즐길 수 있는 곳은 어디인가요?
저속노화식단을 시작하기 전, 고려해야 할 개인 건강 상태는 무엇인가요?
노인들이 새로운 기술을 배우는 것이 중요한 이유는 무엇인가요?
노인들이 일자리를 찾기 위해 스스로의 건강을 어떻게 관리할 수 있나요?
Previous
Next
수정하기 - 머신러닝알고리즘: Decision Boundary와 Margin의 의미는?
닉네임
비밀번호
제목
내용
[이미지 업로드는 권한이 있는 사람만 가능. 하단 카톡으로 연락]
머신러닝 분류 문제에서 “Decision Boundary(결정 경계)”와 “Margin(여유도 또는 마진)”은 모델이 학습한 후 입력 공간을 어떻게 나누고, 그 나뉜 경계로부터 데이터가 얼마나 떨어져 있는지를 설명하는 중요한 개념입니다. 아래에 두 개념을 글로 풀어서 상세히 설명합니다. 1. Decision Boundary(결정 경계) 머신러닝 분류 모델은 학습 데이터로부터 “어떤 특성 값 조합을 양성(positive) 또는 음성(negative) 클래스”로 분류할지 배우게 됩니다. 이때 입력 특성 공간(feature space)을 두 영역으로 나누는 경계가 곧 결정 경계입니다. - 선형 분류기(예: 선형 로지스틱 회귀, 선형 SVM)의 경우 결정 경계는 직선(2차원), 평면(3차원), 또는 초평면(고차원)으로 표현됩니다. 수식으로는 wᵀx + b = 0 형태이며, 이 식을 만족하는 모든 x가 경계를 이루게 됩니다. - 비선형 분류기(예: 커널 SVM, 결정 트리, 신경망)의 경우 결정 경계는 곡선이나 복잡한 형태가 될 수 있습니다. 예컨대 RBF 커널 SVM은 입력 공간에 비선형 변환을 적용한 뒤 고차원 초평면으로 분리하는 효과를 내므로, 원래 공간에서는 구형(원형) 경계나 물결 모양 경계를 형성할 수 있습니다. - 결정 경계의 위치는 모델이 “이 지점까지는 클래스 A, 이 지점 이상은 클래스 B”라고 판단하는 기준이기도 하며, 새로운 데이터가 어느 쪽 영역에 속하느냐에 따라 예측 결과가 달라집니다. 2. Margin(여유도 또는 마진) Margin은 분류 경계로부터 가장 가까운 학습 샘플(서포트 벡터)이 얼마나 떨어져 있는지를 나타내는 거리입니다. 경계와 데이터 포인트 사이의 여유 거리를 최대화하면 일반화 성능이 좋아진다는 SVM의 핵심 아이디어가 여기에 기반합니다. - 기하학적 마진(Geometric Margin): 경계면으로부터 한 점 xᵢ까지의 직선 거리를 말합니다. 선형 분류기의 wᵀx + b = 0 경계에 대해 해당 샘플의 기하학적 마진은 |wᵀxᵢ + b| / ‖w‖ 로 계산됩니다. - 기능적 마진(Functional Margin): 단순히 wᵀxᵢ + b 의 부호와 크기로 표현된 값으로, 실제 기하학적 거리를 ‖w‖ 로 나누지 않은 형태입니다. 이 값이 클수록 모델이 해당 샘플을 강하게(확신을 갖고) 분류했다고 볼 수 있습니다. - SVM은 “하드 마진”과 “소프트 마진” 개념으로 나뉘는데, 하드 마진은 모든 샘플이 경계로부터 최소한 일정 거리 이상 떨어지도록(즉, 잘못 분류가 전혀 없도록) w와 b를 찾는 것이고, 소프트 마진은 일부 오분류를 허용하되 마진 위반(마진보다 가까이 있거나 반대편에 있는 샘플)에 패널티를 부여하면서 최적의 w, b를 찾는 방식입니다. 3. Margin의 역할과 일반화 마진이 넓다는 것은 “결정 경계가 각 클래스의 데이터를 충분히 멀리 떨어뜨려 안정적으로 분류하고 있다”는 뜻입니다. - 일반적으로 마진이 크면 과적합(overfitting)의 위험이 줄고 새로운 데이터에 대한 일반화 성능이 향상됩니다. - 반대로 마진이 너무 좁거나, 과도하게 복잡한 경계를 사용하면 학습 데이터에만 특화된 모델이 되어 테스트 시 성능이 떨어질 수 있습니다(과적합). 4. 다른 알고리즘과의 비교 - 로지스틱 회귀는 직접적으로 마진을 최대화하도록 설계된 것은 아니지만, wᵀx + b 의 절댓값이 클수록 예측 확신이 높다는 관점에서 “마진 비슷한” 개념으로 볼 수 있습니다. - 신경망 분류에서도 출력층의 softmax 확률이 0.5(이진 분류 시)를 기준으로 경계가 생기며, 확률이 0.5에서 멀어질수록 마진(모델의 확신)이 커진다고 해석할 수 있습니다. 정리하자면, 결정 경계는 모델이 클래스 구분을 위해 구축한 “구분선(초평면)”이고, 마진은 그 경계로부터 데이터가 얼마나 여유 있게 떨어져 있는지를 나타내는 “안전 여백”입니다. 특히 SVM처럼 마진을 직접 최대화하는 방법은 경계를 안정적으로 확보하여 새로운 데이터에 대한 예측력을 높이는 핵심 원리로 작용합니다.
이용안내
커뮤니티 이용안내
×
- 게시한 게시글로 발생하는 문제는 게시자에게 책임이 있습니다.
- 게시글이 타인/타업체의 저작권을 침해할 경우 모든 책임은 게시자에게 있습니다. 게시자가 모든 손해를 부담해야 합니다.
- 상식닷컴 운영자는 게시자와 상의하지 않고 게시글을 수정 또는 삭제할 수 있습니다.
- 상식닷컴 운영자는 깨끗한 커뮤니티 공간을 만드는 것이 1순위입니다.
수정하기
취소하기