SNU-project

3조 GS SHOP 남일우

3조 SK planet 김용휘

  • Feature Analysis

  • Code Review

  • 회고...

Feature Analysis

Kaggle's Forum...

  • https://gist.github.com/hukla/af2b08907eee30038238f28688ab551e

Code Review

How to control Categorical Data??

  • 100000000: 호러, 20000000 : 액션, 90000000 : 멜로 
  • Genre : 100000000, 20000000, .... ...90000000

How to control Categorical Data??

  • 나누기 하면 되나??
  • int(장르 값 / 100000000)
  • 그래도 남는 문제...
  • 호러<->멜로 와 호러<-> 액션의 거리차이 발생

이럴때 해결책은 잘 해놓거 참조하기!

Algorithm

  • LogisticRegressionWithLBFGS
  • LogisticRegressionWithSGD
  • etc...

회   고

  • Feature 를 잘 뽑자
  • 알고리즘을 잘 골라보기 전에 Feature 를 잘 뽑자
  • 잘 되는 알고리즘의 변수값을 잘 조절해 보기 전에 Feature 를 잘뽑자

수고하셨습니다!

SNU-project

By Yonghwee Kim

SNU-project

  • 1,423