Shallow diving
- 커리큘럼
- 머신런닝?
- 오늘?
- kaggle
- 타이타닉 생존자 예측 엑셀
- 실습
- 타이타닉 생존자 예측 머신러닝
6월 말 부터 한달 간 머신러닝 학습
1주차
- Kaggle, 엑셀 활용 타이타닉 해상사고의 생존자 예측
2주차
- Python, Library (Pandas, Seaborn, scikit-learn)
3주차
- Predict Bike-Sharing-Demand
4주차
- Hyper Parameter tuning Know-how
≒ 통계를 바탕으로 발생하지 않은 일을 예측 한다.
≒ 빅데이터를 바탕으로 발생하지 않은 일을 예측 한다.
≒ DB 에 쌓은 사용자 로그를 계산하여 미래의 발생할 일을 예측 한다.
≒ 복잡한 알고리즘을 코딩할 필요가 없다.
# 1
Predict Titanic Survivor with Excel
엑셀로 타이타닉 생존자 예측 하기
# 2
Challenge! Predict Titanic Survivor in 30 min
타이타닉 생존자 예측하고 카글에 제출
# 3
Predict Titanic Survivor with Machine Learning
Python Machine Learning Library 를 사용하여 타이타닉 생존자 예측
A platform for predictive modeling competitions.
2010년에 설립, 2017년에 구글이 인수
기업, 단체들이 데이터를 등록, 과제에 따라 상금도 걸려 있음
많은 데이터 과학자들이 들어 붙어서 해결, 노하우 공유
심지어 인터뷰 기회도 얻을 수있음
데이터 과학자들 커리어 증빙도 가능함 Like a Github
- Titanic: Machine Learn from Disaster
- Import train.csv
- Analysis train data
- 왼쪽 모서리 클릭, 데이터>피봇테이블 적용
- 행에 'Sex', Survived 추가, 값에 'Survived' 추가
- 생존자를 예측할 가설을 세워 생존자를 예측
- Import test.csv, Survived 컬럼 추가, 생존자 예측 공식 적용
- 카글에 가입하세요.
- Train.cvs 를 찬찬히 보면서 생존 여부를 맞출 수 있는 가설을 세우세요.
- Test.cvs 에 가설에 부합하는 공식을 적용하세요.
- 카글에 제출해 봅니다.
- 제한 시간은 30분 입니다.
Google Spread Sheet Formula Exam.
1 = IF(true, 1, 0)
true = AND(true, true)
true = OR(true, false, true)
ex. =IF(E2="male",0,1)
- Python Lib. 을 활용하여 Titanic 상위 5% 도전
- 데이터 분석, 시각화, Machine Learning Lib. scikit-learn 등등 을 사용하는 것을 볼 수 있습니다.