Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
Tags
- 코드잇스프린트수료후기
- 취업까지달린다
- 1종오류
- 2종오류
- 이상치
- 코드잇
- 지원후기
- 통계적가설검정
- 단일표본t검정
- 독립표본T검정
- 코드잇스프린트
- 코드잇da
- 대립가설
- 대응표본T검정
- 수료후기
- 코드잇스프린트프리코스
- 선발후기
- 결측치
- p값
- 코드잇스프린트da
- 데이터분석가
- codeitconference2025
- t-test
- 스프린터의봄
- T검정
- 스프린트
- 데이터전처리
- 코드잇데이터분석
- 데이터분석
- 코드잇스프린트후기
Archives
- Today
- Total
Ori's IT 공부일지
[위클리 페이퍼 #8] 지도 학습 vs 비지도 학습, 손실함수 본문
1. 지도 학습과 비지도 학습의 차이는 무엇인가요?

1) 지도 학습 : 정답(label)이 지정된 데이터 세트를 이용해 데이터를 분류하거나 결과를 정확하게 예측하도록 알고리즘 설계
- 분류 : 알고리즘을 사용하여 데이터를 특정 카테고리로 할당하는 방식
- 선형 분류기, 서포트벡터머신(SVM), 의사 결정 트리, 랜덤 포레스트 등
- ex) 이메일이 스팸인지 아닌지 분류
- 회귀 : 알고리즘을 사용하여 종속 변수와 독립 변수 간의 관계를 이해하는 방법
- 선형 회귀, 로지스틱 회귀, 다항 회귀 등
- ex) 집 크기와 위치를 기반으로 가격 예측
2) 비지도 학습 : 정답(label)이 지정되지 않은 데이터 세트를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측, 사람의 개입 없이 데이터에서 숨겨진 패턴을 발견하는 방식
- 클러스터링 : label이 지정되지 않은 데이터를 유사성 or 차이점에 따라 그룹화하는 데이터 마이닝 기술
- K-means, 계층적 클러스터링 등
- ex) 고객을 구매 패턴에 따라 그룹화
- 연관 : 주어진 데이터 세트에서 변수 간의 관계를 찾는 방법
- 장바구니 분석, 추천 엔진 등
- 차원 축소 : 특정 데이터 세트의 특징 or 차원 수가 너무 많을 때 사용. 데이터 무결성을 유지하면서 데이터 입력 수를 관리 가능한 크기로 줄임
- PCA 등

2. 손실 함수(loss function)란 무엇이며, 왜 중요한가요?
1) 손실함수 : 지도학습 시 알고리즘이 예측한 값과 실제 정답의 차이를 비교하기 위한 함수. 목적 함수, 비용 함수, 에너지 함수 등으로 불리기도 함
- 손실(loss)이 작아질수록 학습이 잘 이루어지고 있다고 해석
- 손실을 최소화하는 방향으로 모델 학습시킴
2) 손실함수의 중요성
- 모델의 학습 방향 설정
- 경사 하강법 등 최적화 기법을 통해 모델 개선 방향 제시
- 손실 값 작아지도록 모델의 가중치 업데이트에 활용
- 성능 평가
- 손실 값을 통해 과대적합이나 과소적합 상태 확인
- 훈련 데이터와 검증 데이터 손실 값 차이로 일반화 성능 평가
- 적절한 손실함수 선택
- 문제 유형(분류 or 회귀)에 따른 적절한 손실함수 선택
- 손실함수 잘못 선택하면 모델 학습 방향 잘못될 가능성 존재
3) 손실함수의 종류
- 회귀 : MAE(평균 절대 오차), MSE(평균 제곱 오차), RMSE(평균 제곱근 오차) 등
- 분류 : Binary cross-entropy, Categorical cross-entropy 등
'코드잇 스프린트 > 위클리 페이퍼' 카테고리의 다른 글
| [위클리 페이퍼 #10] 결정트리, 부스팅 (0) | 2025.04.13 |
|---|---|
| [위클리 페이퍼 #9] 편향, 분산 , k-fold 교차 검증 (0) | 2025.04.13 |
| [위클리 페이퍼 #7] A/B 테스트, 이벤트 로그 설계 (0) | 2025.04.13 |
| [위클리 페이퍼 #6] AARRR, 코호트 분석, RFM 분석 (0) | 2025.04.13 |
| [위클리 페이퍼 #5] 데이터베이스 정규화, 엔터티, 속성, 관계 (0) | 2025.01.21 |