반응형
💡수업 목표💡
- 머신러닝의 기초 개념을 알아본다.
- 선형회귀에 대해 배운다.
- Colab과 Kaggle을 이용해 직접 실습해본다!
머신러닝 (ML, Machine Learning)
: 인공지능AI의 한 분야로 경험,학습을 통해서 점진적으로 개선하는 방식 컴퓨터 알고리즘의 분야.
알고리즘이란?
수학과 컴퓨터 과학, 언어학 또는 관련 분야에서 어떠한 문제를 해결하기 위해 정해진 일련의 절차나 방법을 공식화한 형태로 표현한 것, 계산을 실행하기 위한 단계적 절차
머신 러닝 알고리즘의 분류
- 지도 학습(Supervised learning) 머신러닝
- 레이블이 지정된 데이터셋을 사용하여 데이터를 분류하거나 정확하게 결과를 예측하는 알고리즘.
- 입력 데이터가 모델에 공급되면서, 이는 모델이 적절하게 맞춰질 때까지 해당 가중치를 조정한다.
- 비지도 학습 (Unsupervised learning) 머신러닝
- 지도 학습 알고리즘과 반대로 레이블링되지 않은 데이터 세트를 분석하고 클러스터링하는 알고리즘.
- 새로운 데이터에 대해 '올바른' 출력을 제공하지 않고 인간의 개입 없이도 숨겨진 패턴이나 데이터 그룹핑을 감지.
- 준지도 학습(Semi-Supervised learning) 머신러닝
- 학습에 레이블이 지정된 데이터와 레이블이 없는 데이터를 모두 사용하는 알고리즘
- 지도 학습과 비지도 학습 머신러닝 간의 적절한 타협점을 제공
- 레이블링된 보다 작은 데이터 세트를 사용하여 레이블링되지 않은 보다 큰 데이터 세트에서 분류 및 특징 추출을 유도해서 지도 학습 머신러닝으로 학습하기에 충분치 않은 레이블링 데이터셋을 보유한 경우 문제해결.
- 강화 학습(Reinforcement learning) 머신러닝
- 지도 학습 머신러닝과 유사한 머신 러닝 모델이지만, 알고리즘이 샘플 데이터셋으로 사용하는 것이 아닌 시행착오를 통해서 학습하는 알고리즘.
- 환경과 상호 작용하여 행동을 생성하고 오류와 현상을 발견하는 방식을 통해 최상의 성능을 위한 특정 컨텍스트 내에서 적절한 동작을 결정가능.
지도 학습 모델 : 회귀 vs 분류
지도학습 머신러닝 알고리즘에서 해결하려는 문제의 종류와 예측하려는 값의 종류에 따라 크게 회귀모델 , 분류 모델로 나눌수 있다.
회귀(Regression) 모델
- 여러 개의 독립변수x 와 한 개의 종속변수y 간의 선형 상관 관계를 모델링하는 기법
- 이를 통해 독립변수에 영향을 미치는 회귀 계수(Regression coefficients)의 최적 값을 찾아 출력하는 종속변수를 예측해내는 것이다.
- 예측하는 값은 float형태인 연속적인 값(continuous value)이다.
분류(Classification) 모델
- 주어진 데이터를 클래스 별로 구별해 내는 기법
- 레이블이 달린 학습 데이터로 학습한 모델을 통해 새로 입력된 데이터가 어느 범주에 속한 데이터인지 판단하고 예측하게 된다.
- 예측하는 값은 한정된 수로 끊어져 있는 이산 값(discrete value)이다.
반응형