일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 깊이우선탐색
- 강화학습
- 이진탐색
- 지도학습
- 멱등
- 파이썬
- post
- 코딩테스트
- rest api
- HTTP
- Merge sort
- 해시
- 머신러닝
- bineary search
- 백준
- 너비우선탐색
- 코테
- 딕셔너리
- 파이썬 알고리즘
- 오버라이딩
- 프로그래머스
- 자바
- 캐싱
- 비지도학습
- 딥러닝
- BOJ
- 코딩
- 알고리즘
- 파이썬 오류
- 스택과 힙
- Today
- Total
목록ML (5)
chae._.chae
보호되어 있는 글입니다.
✔ 과대적합 과대적합이란 모델이 훈련세트에서는 좋은 성능을 내지만 검증 세트에서는 낮은 성능을 내는 경우이다. 과대적합 모델 = 분산이 크다. 원인 : 훈련세트에 다양한 패턴의 샘플이 포함되지 않아서 검증세트에 적응하지 못해 성능이 낮음 해결 : 더 많은 훈련 샘플을 모아 훈련시킨다. 최적점 이후에도 훈련세트로 모델을 학습시키면 모델이 훈련세트에 밀착하여 학습하기에, 모델이 과대적합된다. 과대적합의 경우, 모델이 훈련세트에 집착하지 않도록 가중치를 제한할 수 있다. (= 모델의 복잡도를 낮춘다) ✔ 과소적합 과소적합이란 훈련세트와 검증세트의 성능에는 차이가 크지 않지만, 모두 낮은 성능을 내는 경우 측정한 성능의 간격은 점점 가까워지지만, 성능 자체가 낮음 과소적합 모델 = 편향이 크다. 원인 : 모델이..
분류하는 뉴런, 이진 분류 로지스틱 회귀(Logistic Regression)는 회귀를 사용하여 데이터가 어느 범주에 속할 확률을 0에서 1사이의 값으로 예측하고, 그 확률에 따라 더 가능성이 높은 범주에 속하도록 분류해주는 학습 알고리즘이다. (스펨메일 분류나 시험 합격 여부 등이 있다.) 공부 시간에 따른 시험 합격 가능성을 예로 들어보면, 다음은 선형회귀로 나타낸 그림이다. 공부시간이 적으면 합격할 확률이 낮아지고, 공부시간이 많으면 확률이 높아진다. 그림은 선형회귀로 표현했기에 확률이 양,음의 방향으로 무한대로 뻗어나간다. (확률을 음수나 1을 초과해서 표현할 수 X) 이를 로지스틱 회귀로 나타내면, 아래 그림과 같다. 로지스틱 회귀로 표현하여 합격 확률이 0~1 사이로 표현된다. 로지스틱 회귀에..
선형회귀(Linear Regression)는 머신러닝 알고리즘 중 하나로 데이터를 가장 잘 설명할 수 있는 1차 함수를 찾는 방법을 선형회귀라 하며, y=mx+b로 표현할 수 있다. (즉, 주어진 데이터를 통해 일차방정식을 수정해 나가는 것이다.) 학습을 통해서 가장 데이터를 잘 표현하는 합리적인 선을 찾아간다. 선형회귀의 목표는 입력데이터(x)와 타깃데이터(y)를 통해 기울기와 절편을 찾는 것이다. 경사하강법(Gradient Descent)은 적절한 직선의 방정식을 찾기 위해 기울기(변화율)를 사용하여 모델을 조정하는 최적화 알고리즘이다. 손실함수(Loss Function)이 정의되었을 때, 손실함수의 값이 최소가 되는 지점을 찾아가는 방법이다. 손실함수란 예상값과 실제 타깃값의 차이를 함수로 정의한 ..

머신러닝의 학습방법은 다음과 같이 크게 세가지로 나눌 수 있다. 1. 지도학습(Supervised Learning) 2. 비지도학습(Unsupervised Learning) 3. 강화학습(Reinforcement Learning) 1. 지도학습 지도학습은 문제와 정답을 알려주고 학습시키는 방법이다. 예를 들어, 컵의 사진을 주고 이건 컵이라고 알려주며 학습시킨다. 1-1) 회귀(Regression) : 예측하고 싶은 종속변수가 양적데이터(숫자)일때 사용한다. 어떤 데이터들의 특징을 바탕으로 값을 예측하는 방법이다. 1-2) 분류(Classification) : 대상을 그룹핑하는 방식이다. 종속변수가 범주형데이터(이름)일때 사용한다. 이진분류 : P/F 처럼 두가지 중에 하나로 분류하는 것, 다중분류 : ..