기계학습의 정의
명시적으로 프로그램을 작성하지 않고 컴퓨터에 학습할 수 있는 능력을 부여하기 위한 연구 분야. (Arthur Samuel, 1959)
Example (y=2x)
- 학습데이터 (1, 2), (2, 4), (3, 6), (4, 8)
- 컴퓨터에 $y=2x$ 의 함수를 프로그래밍하지 않아도 앞의 학습데이터를 학습한 후 (5, ?), (10, ?)의 새로운 질문을 던져도 그 대답을 할 수 있게 만드는 것
기계학습의 정의의 변화
만약 컴퓨터 프로그램이 특정한 태스크 T를 수행할 때 성능 P만큼 개선되는 경험 E를 보이면, 그 컴퓨터 프로그램은 태스크 T와 성능 P에 대해 경험 E를 학습했다라고 할 수 있다.
(Tom Mitchell, 1997)
이전 기계학습 정의와의 차이점
- Task 정의
- Performance를 정량적으로 평가
기계학습과 프로그램 비교
기존의 프로그램에서는 수행하지 못한 '예측' 이 가능
- 프로그램: 통계적 접근
- 기계학습: 여러 변수의 변화량에 따라 변수 변화량 예측
기계학습의 방식
기계학습의 세 종류
- 비지도 학습(unsupervised learning)
- 정답 없이 입력들만 주어짐
- ex) 군집화, 차원 축소
- 지도 학습(supervised learning)
- 입력에 대한 정답 값과 대조하며 학습
- ex) 예측, 분류
- 강화 학습(reinforcement learning)
- 입력에 대한 평가만 주어짐
지도 학습이란?
일을 맡아서 보살피고 지휘하는 과정으로 지식을 습득하는 행위
지도 (Supervised)
- 어떤 사람을 인도.
- 일을 맡아서 보살피고 지휘.
학습 (Learning)
- 배워서 익힘.
- 지식을 습득하는 과정.
- 경험의 결과로 나타나는, 비교적 지속적인 행동의 변화나 그 잠재력의 변화.
정답을 이미 알고 있는 경우에 사용하는 학습법
- 문제와 그 정답의 쌍이 주어진 상태로 학습을 진행
- 문제를 푼 뒤 그 결과를 정답과 비교, 정답과의 오차가 적어지도록 동작을 수정(학습)함
- 명시적인 정답이 주어진 상황에서 기계를 학습 시키기 위해 데이터와 레이블을 사용(오차, error or loss)
- 사람이 목표 값에 개입하여, 정확도가 높으나 시간이 오래 걸리고 필요 데이터량이 많음
지도 학습의 데이터
문제와 그 정답(label)의 쌍이 주어진 상태
비지도 학습이란?
일을 맡아서 보살피고 지휘하는 과정 없이, 지식을 습득하는 행위
비지도 (Unsupervised)
- 어떤 사람을 인도하지 않음.
- 일을 맡아서 보살피고 지휘하지 않음.
학습 (Learning)
- 배워서 익힘.
- 지식을 습득하는 과정.
- 경험의 결과로 나타내는, 비교적 지속적인 행동의 변화나 그 잠재력의 변화.
- 정답이 없을 경우에 사용
- 문제를 관찰함으로써 비슷한 문제의 집합을 발견하고, 문제의 타입을 이해
비지도 학습의 데이터
정답이 없는 상태
강화 학습이란?
강하게 만드는 과정으로 지식을 습득하는 행위
강화 (Reinforcement)
- 강하게 하는 것
학습 (Learning)
- 배워서 익힘.
- 지식을 습득하는 과정.
- 경험의 결과로 나타내는, 비교적 지속적인 행동의 변화나 그 잠재력의 변화.
- 시행착오를거쳐가며 최적으로 보이는 행동 방법을 학습
- 보상(Reward) 을 통해 최적의 행동인지 평가
- 시행착오 과정을 거쳐 학습하기 때문에 사람의 학습방식과 유사
- Agent(AI)는 Enviroment(환경, 문제, X)으로부터 상태를 관측하고 이에 따른 적절한 행동을 하면 환경으로부터 보상을 받음
- 관측-행동-보상의 상호작용을 반복하면서 환경으로부터 얻는 보상을 최대화하는 일련의 과정
- 관측-행동-보상의 과정을 경험(Experience) or 학습이라고도 함
그 외의 학습 방법
Limited Resource(제한된 데이터)에서의 Powerful Performance
준지도 학습 (Semi-supervised learning)
- 소량의 정답 있는 문제와 대량의 정답 없는 문제를 학습
- 정답 없는 문제 학습 통해 문제의 패턴을 학습하고, 이를 통해 얻은 정보로 지도학습 수행
전이 학습 (Transfer learning)
- 목표 하는 문제에는 정답이 소량만 존재하는 반면, 문제와 비슷한 문제에는 정답이 대량으로 존재할 경우 사용
제로샷 학습 (Zero-shot learning)
- 목표하는 문제에 대한 정답이 거의 없는 상태에 사용하는 전이학습
- 해결하려는 문제를 추상화함으로써 정답이 있는 다른 문제의 풀이 방법에 응용
출처: [성균관대 컨소시엄] 건양대 DNA School 기초과정 - 병원 임상데이터를 활용한 AI기초 강의자료
'Data Science > ML & DL' 카테고리의 다른 글
딥러닝의 원리와 확장성 (0) | 2024.07.08 |
---|---|
선형(Linear) 문제 (0) | 2024.07.07 |
인공지능의 역사 (0) | 2024.07.04 |
인공지능이란? (0) | 2024.07.04 |
목적 함수(Objective Function) vs 비용 함수(Cost Function) vs 손실 함수(Loss Function) (1) | 2024.06.03 |