Azure ML Studio 실습: Titanic Mortality Rate

> Kaggle에서 다운받은 Titanic Data Set 업로드

> New Experiment - Data Set 불러오기

> 필요한 컬럼만 선택

모듈 추가

👇

컬럼 선택
👇

컬럼 필터링 확인
👇

> Survived 생존여부 컬럼이 숫자로 인식되면 안됨,

생존여부 유 무로만 분류될 수 있게 Boolean 타입으로 바꾸어야 함

Edit Metadata 모듈 추가

👇

Edit 하려는 컬럼(Survived) 선택 및 Data Type - Boolean으로 설정

👇

Run 하여 적용시킨 다음 Vizualize를 통해 확인

👇

> Missing Value 해결

빠진 값이 있는 행을 아예 삭제하기도 하지만,

데이터 양이 너무 없어서 이거라도 살려야 싶을 때

데이터의 평균값을 그 값에 채워주는 최후의 방법도 있다.

Clean Missing Data 모듈 추가

👇

Missing Value 처리할 컬럼 선택

👇

Missing Value처리 방식 선택 : Remove Entire Row

👇

Run 하여 적용시킨 다음 Vizualize를 통해 확인

👇

> 모델 테스트할 알고리즘 선택 : Predicting Categories - Two-Class

알고리즘을 포함하여 Train/Score/Evaulate Model 모듈 추가

👇

Data 분리 분포 설정(8:2)

👇

Train Model에서 예측하고자 하는 컬럼 선택

👇

Run 하여 적용시킨 다음 Score Model-Vizualize를 통해 확인

👇

Run 하여 적용시킨 다음 Evaluate Model-Vizualize를 통해 확인

👇

> 두번째 알고리즘 추가

Two Class Decision Forest 알고리즘 모듈을

추가한 다음 위의 방식과 똑같이 수행하여 알고리즘 모델 결과를 비교

Run 하여 적용시킨 다음 Evaluate Model-Vizualize를 통해 확인

👇

Azure automatic ml: 머신러닝을 돌려주는 머신러닝
제일 좋은 알고리즘을 찾아주는 머신러닝(Parameter 조정까지 !!!)

" All models are wrong, but some are useful "

모델들이 어떠한 데이터 셋에 딱 들어맞는 것은 좋지 않다

데이터는 유동적이기 때문에 특정한 데이터에만 들어맞는 경우 새롭게 들어오는 데이터에는

맞지 않는 모델이 되기 때문이다.

저작자표시 변경금지

'자기발전소 > # Machine Learning' 카테고리의 다른 글

Azure ML Studio 실습: Walmart 판매액 예측 모델 (0)	2020.12.28
OCR(Optical Character Recognition) 실습 (0)	2020.12.24
Face Recognition 실습 (0)	2020.12.24
Computer Vision API 실습: Object Detection (0)	2020.12.24
Cognitive Services (0)	2020.12.24

lucia.at.dmz

Azure ML Studio 실습: Titanic Mortality Rate

> 두번째 알고리즘 추가

" All models are wrong, but some are useful "

'자기발전소 > # Machine Learning' 카테고리의 다른 글

티스토리툴바

Azure ML Studio 실습: Titanic Mortality Rate

> 두번째 알고리즘 추가

" All models are wrong, but some are useful "

'자기발전소 > # Machine Learning' 카테고리의 다른 글

관련글

티스토리툴바