| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- 코드잇da
- t-test
- 결측치
- 2종오류
- 대응표본T검정
- codeitconference2025
- 코드잇데이터분석
- 수료후기
- 코드잇스프린트da
- 코드잇스프린트
- 스프린트
- 선발후기
- 코드잇스프린트수료후기
- 코드잇스프린트프리코스
- 대립가설
- 데이터전처리
- 취업까지달린다
- 코드잇
- 데이터분석
- 통계적가설검정
- p값
- 데이터분석가
- 1종오류
- 지원후기
- T검정
- 단일표본t검정
- 스프린터의봄
- 독립표본T검정
- 코드잇스프린트후기
- 이상치
- Today
- Total
목록전체 글 (16)
Ori's IT 공부일지
✅커리큘럼 및 학습 방식 PART 1 PART 2 Python 기초 (pandas, matplotlib, seaborn 등)태블로 시각화 툴기초 통계 및 가설 검정 방법 SQL웹 자동화각종 지표A/B 테스트로그 설계 PART 3 PART 4 머신러닝 (회귀, 분류, 앙상블, 클러스터 등)차원축소장바구니 분석 기초 유닉스 커맨드GitDockerAirflowBigquery 코드잇 스프린트 데이터 분석가 과정은 크게 4가지 파트로 나뉘어 있고각 파트의 주요 학습 내용은 위 표와 같다! 초반 PART1 학습 때는 객체와 클래스 등익숙하지 않은 알고리즘 성격의 수업과문제 풀기 과제에 힘들었지만,그 부분이 어렵다면Pandas, matplotlib, seaborn만이라도무조건 익히고 가야 한다는강..
✅ 코드잇 스프린트에 합류하기 전 나는...?돌이켜보면, 대학교 3학년 이후부터는 항상어떤 일을 해야 더 행복할까? 내가 진짜 원하는 게 뭘까?이런 고민을 해왔던 것 같다. 통계학과에 진학했지만R 프로그래밍에서 벽을 느끼고 제대로 적응하지 못했다..당시 '데이터 사이언티스트'가 막 떠오르던 시기였지만무조건 '대학원, 석사'가 필요하다고만 알고 있었고와.. 이런 상태에서 대학원까지? 안돼...'아, 난 전공 살리는 건 무리구나.'라고 생각했다. 😢그 후 여러 진로 적성 검사에서 '공무원, 공기업' 쪽이 잘 맞는다고 나왔고,안정적인 삶을 원하기도 했어서우선 공기업을 준비했다. 하지만 뜻대로 잘 풀리지 않았고, 운 좋게 대학병원에 계약직 사무원으로 입사했다.안정적인 삶의 꿀맛도 봤지만,전공의 파업이라는..
어느새 코드잇 스프린트 과정에합류한지도 5개월차...!!그동안 코드잇 측에서 마련해주시는 현직자 특강 등기회가 있으면 모두 참여하려고 노력했다. 이번엔 모든 과정, 모든 기수 대상으로 진행된스프린터의 봄🌸 : Sprint Conference 2025 내용 및 후기를 정리해보고자 한다. 🕰️0교시_커리어 코치 세션(10:00 ~ 10:30) ✅2025 신입 채용 트렌드 요즘 기업의 주요 고민?- 몸값 높은 경력은 부담- 신입은 교육에 투자할 여력 부족- 바로 실무에 투입 가능한 주니어 원함 이러한 상황으로 1. 중고 신입2. 수시 채용3. 모티베이션 핏이 3가지가 주요 채용 트렌드!! 이 중 '모티베이션 핏' 이란기업들이 적합한 인재를 찾기 어렵고, MZ세대의 조기 이직/퇴사 경험으로 채용 후 ..
1. 데이터 간의 유사도를 계산할 때, feature의 수가 많다면(예: 100개 이상), 이러한 high-dimensional clustering 문제를 해결하기 위한 방법들을 설명해 주세요.1) 차원의 저주차원이 높아질수록 데이터 간의 거리가 모두 비슷해지는 경향이 생겨, 거리 기반 클러스터링(예. KMeans)의 성능 저하 초래하는 문제2) 해결 방법2-1) 차원 축소차원 축소(PCA)고차원 데이터를 분산이 큰 방향으로 축소해 저차원으로 변형노이즈 제거, 데이터 시각화, 거리 기반 클러스터링에 주로 사용t-SNE / UMAP비선형 차원 축소 기법데이터의 군집 구조 잘 유지시각화에 효과적 / 실제 클러스터링에는 부적합 가능성 존재(거리 왜곡, 느린 속도 등)AutoEncoder인공신경망 이용 차원 축..
1. 결정 트리의 장점과 단점은 무엇인가요?1) 의사 결정 나무?예 or 아니오로 답할 수 있는 어떤 질문들이 있고, 그 질문들의 답을 따라가면서 데이터를 분류하는 알고리즘; 입력 데이터를 분류하기 위해 분류 규칙을 나무 구조로 표현하여 ‘의사 결정 나무’분류, 회귀 문제에 모두 적용 가능2) 장점분석 결과 해석 용이성쉬운 사용자 이해새로운 데이터 모형에 적용 쉬움변수 간 상호작용과 비선형성을 반영하여 정확한 예측 가능비모수적 모형이라서 이상치에 민감하지 않음유연성, 정확도 높음대용량 데이터에서도 빠르게 생성수치형, 범주형 변수 모두 가능중요한 변수 자동 선택 기능 존재3) 단점비안정성과적합 문제 발생 가능성 존재 → 적절한 가지치기와 샘플링 필요선형성 결여각 변수의 고유한 영향력 해석의 어려움 존재비연..
1. 모델 학습 시 발생할 수 있는 편향과 분산에 대해 설명하고, 두 개념의 관계에 대해 설명해 주세요. 1) 편향(Bias)추정 결과가 한 쪽으로 치우치는 경향을 보임으로써 발생하는 오차머신러닝 모델에서는 예측한 결과가 정답과 일정하게 차이나는 정도 의미편향이 높은 경우 문제데이터의 패턴을 충분히 학습하지 못함일정한 방향으로 치우쳐진 예측일반적으로 너무 모델이 단순함과소적합(underfitting) 가능성 상승2) 분산(Variance)변량(데이터)들이 퍼져있는 정도머신러닝 모델에서는 주어진 데이터 포인트에 대한 모델 에측의 가변성 의미분산이 높은 경우 문제훈련 데이터에는 잘 맞지만, 새로운 데이터에서는 낮은 성능훈련 데이터에 과도하게 최적화(노이즈까지 학습함)일반적으로 모델이 너무 복잡함과대적합(o..