본문 바로가기
  • 노션에서 삽질한 내용을 정리하는 블로그
자기발전소/# Machine Learning

Machine Learning 입문

by iamlucia 2020. 12. 23.

 

AI가 무엇인가요? 인공지능이요 

머신러닝이 무엇인가요? 인공지능이요

딥러닝이 무엇인가요? 인공지능이요

 

Azure Machine Learning Studio 를 사용하기에 앞서, 

Machine Learning의 개념을 짚어보자 

 


머신러닝 관련 개념

1. AI는 쉽게 말하자면, 사람을 흉내낼 수 있는 것을 말한다.

 

2. 1980년대 이후 메모리,컴퓨터 성능이 좋아지면서 컴퓨터에 수학적으로 학습을 시키기 시작했다.

즉, 문제해결의 주체가 인간에서 기계로 넘어가는 전환점이 되는 시기였는데 인간이 기계에 데이터를 입력하면

기계가 수학적으로 이에 대한 계산을 수행하고 문제를 해결했다.

 

기존의 방식대로 사람이 찾아서 기계한테 알려주는 것과 달리,

머신러닝에서는 어떤 계산식이 존재하는지 모르는 블랙박스에 대한

초기값과 그 박스를 통해 나온 결과값의 데이터를 기계에 입력하여 기계가 해결하게 하는 것

 

*머신 러닝:

인간이 개발한 알고리즘을 컴퓨터 언어(데이터)를 통해 기계에게 학습시키는 행위

Machine Learning : Machine Learned By Computer Lanuguages To perform the algorithm Created by human

 

앞으로의 머신러닝 발전을 고려하면,

인간은 기계가 직접 찾을 수 있도록 적절한 데이터를 넣어야 하는 등의 질문을 잘해야 한다. 

3. 데이터가 점점 방대해지면서 단순한 수학식으로 데이터를 처리하기 어려워졌다.

딥러닝 알고리즘을 활용하기 시작하였는데, 이를 통해 데이터에 대해 빠른 응답(번역, 음성인식)이 가능해졌다.

 

*딥러닝:

어떠한 종류의 입력에 대한 가중치를 둬서, 해당 입력이 약하게 들어왔을 때에도 더 예민하게 반응하여 출력까지 이어지게 한다. (뇌세포 구조 기반)

 

뇌세포의 입력 및 출력 처리 모식도 
CPU보다 GPU가 더 중요한 이유 

 

머신러닝의 종류

1. Supervised Learning (지도학습):

 

1) 문제Feature & 정답 Label 제공 : 인공지능 개발시 Labeling에 비용이 많이 들어감

 

2) 사용하는 알고리즘:

  2-1) Classification(분류): 개와 강아지 사진 천 장주기(텍스트도 가능-신입사원 인사관리)

  2-2) Regression(회귀분석): 일반적인 데이터를 점으로 찍은 다음 그 평균점을 잇는 선을 회귀곡선

      ex. 키에 따른 신발 사이즈, 시간에 따른 커피 소비량, 햇빛 노출시간과 선크림 소비량...
       (대부분의 문제는 Regression으로 해결가능하다고 보면 편하다) 

 

3) 해당 알고리즘을 통해 학습된 머신러닝 기반 사이트: How-Old.net

 

 

2. Unsupervised Learning(비지도 학습, 안가르쳐줘도 학습): 

 

1) 문제만 제공

Anomaly

2) 사용하는 알고리즘: 
  2-1) Anomaly(Anomaly Detection 패턴/구조발견): 

  평소 사용가보다 더 높은 한도로 사용할 때 카드 거래 중지, 

  주식 프로그램 매도, 항공기에서의 이상 떨림,
   갑자기 흥미도가 치솟는 fake news 감지

 

 

 

 


   2-2)  Clustering(그룹화):  
   지도학습과는 다르게, 문제만 제공(Raw Data)

   (하지만 Classification이 더 효율적!)

 

 

 

 

3. Reinforcement Learning (강화 학습):

 

최근에 각광을 받고 있지만,

현재 비즈니스적인 문제는 대부분 지도학습으로 해결 중

1) Reward(보상) 제공

2) 인과 관계 중요

 ex. 게임(알파고,스타크래프트2), 로봇(youtube-boston dynamics)

알파고 처음에는 지도학습으로 시작하고, 더 발전시키고자 알파고끼리 계속 붙게 해서 강화학습 사용 (보상:SCORE을 제공)

 

 


Microsoft Azure Machine Learning Studio 

을 활용한 간단한 실습

 

해당 사이트에 들어가 계정을 입력하면 무료로 사용 가능! 

 

Experimnets > +NEW 클릭: 머신러닝 모델 캔버스를 연다.

 

 

빨간 느낌표: 값을 입력해야 한다! 

 

Data Input and Output > Enter Data Manually 캔버스에 Drag: 수동으로 데이터를 입력한다.

 

csv형식의 데이터 입력: 콤마로 구분되는 값

hasHeader: 근속연수, 연봉과 같이 테이블의 헤더값

 

 

 

스튜디오 하단 Run 실행:  입력한 데이터 학습시키기

 

 

값을 입력하고 나면 Green Check! 

 

Vizualize: 데이터 시각화 및 확인 

 

컬럼 클릭하며 해당 컬럼의 데이터 통계값들을 살펴볼 수 있다 

 

컬럼을 클릭하면 해당 컬럼의 데이터 통계값을 우측에서 확인할 수 있다.

또한, 다른 컬럼과 비교를 하게 되면 두 값 간의 관계를 점 그래프를 통해 확인할 수 있다. 

(데이터가 더 촘촘하게 입력되면 예측이 더 쉬워질 것임)

 

Microsoft Azure Machine Learning Studio의 의의

기존에는 파이썬, 판다스(데이터 처리), ...등을 배워야

이러한 데이터의 시각화가 가능해졌지만,

해당 툴을 사용하면 빠르게 처리가 가능해졌다. 

 

'자기발전소 > # Machine Learning' 카테고리의 다른 글

Face Recognition 실습  (0) 2020.12.24
Computer Vision API 실습: Object Detection  (0) 2020.12.24
Cognitive Services  (0) 2020.12.24
Azure ML Studio 실습: Linear Regression  (0) 2020.12.23
Machine Learning 입문 2  (0) 2020.12.23