Glitterskill

- mapping the industry's most attractive skills  -

Hvorfor denne oppgaven?

Data Kilder

Sluttprodukt

Utfordringer

Analyse av testdata

Sammenligner n x m ord

  • :  Testdata som besto av ord hentet fra 372 stillingsannonser innenfor IT.
     
  • m : En liste med ord vi bestemmer
    • Hvilke ord bør m inneholde?
    • Hvor mange ord bør m inneholde?​

 

m : Ord fra stillingsannonser fra alle andre bransjer enn IT

m : 500 mest vanlige norske og engelske ord

22 224 ord

1000 ord

Antall ord i m :

  • Antar at resultatet vil flate ut, og at testdataen inneholder nok ord til å se platået

Om topplista skal inneholde 100 ord,

bør m inneholde ~10 000 ord

Glitterskill

By kyvik_bcn

Glitterskill

  • 132