Implementação
Ronie Uliana
Cada VAGA de emprego recebe diversos candidatos. Cada um deles possui um CARGO.
É possível prever quais são os CARGOS que a VAGA receberá usando apenas seu texto?
(Read et al. 2008)
Usar apenas os conjuntos mais comuns de rótulos.
Transformar conjunto em um único rótulo.
Exemplo:
["estagio", "vendedor"] = "estagio|vendedor"
Treinar um classificador para cada novo rótulo:
rótulo, ¬rótulo
Tentei primeiro o RAkEL (subconjuntos aleatórios de rótulos), mas haviam muitos rótulos =/
Quando procurei os conjuntos comuns, o número de conjuntos distintos de rótulos foi pequeno. O que condiz com o domínio do negócio.
(~5.000 => ~300)
Usar a estratégia mais simples de COPY (clonar os exemplos uma vez para cada rótulo) e treinar um Ensemble.
Racional: cada pessoa avalia se a vaga é boa para ela sem conhecimento da decisão das outras pessoas.
?
Limpeza do Conjunto
Preparação dos Rótulos
Limpeza dos Registros
Separar amostras!
É muito lento experimentar com todos os dados =/
Truque (no linux):
shuf arquivo.csv -n 999 > amostra.csv
Treino dos classificadores individuais
Montagem dos multirrótulos
Ronie Uliana