Plataforma de IA
IA Front
Universo


Frameworks de (pré)-processamento, IA e Big Data
Armazenamento e pesquisa de dados




Infra de execução


Orquestração
- Usamos kubeflow para orquestrar pipelines
- Execuções podem ser manuais ou agendadas

Autonomia
Damos autonomia ao usuário final para criar/executar pipelines com dados próprios

Orquestração
Temos um ambiente centralizado onde o usuário ver os resultados

Features
Features são armazenadas nas plataformas de bigdata (Athena e BigQuery) com marcações de tempo

Features
Jobs criam versões vetorizadas das features quando necessário

Reúso de aplicações
Criação de uma plataforma para versionamento e compartilhamento de modelos, ETLs, avaliadores, etc.

Customização
- Tudo executado na forma de containers, criando ambientes isolados
- Troca de dados feita por meio de storages comuns e APIs (integrável a vários serviços e bibliotecas)
- Já temos bibliotecas de suporte isolado e nativo para Spark e Tensorflow
- Isolamento dá liberdade total na escolha das ferramentas
- Estamos desenvolvendo tunning automático de modelos
Necessidades
- Parametrização temporal
- Feature Engineering
- Materialização de dados de treino e validação
- Recomposição de features para inferência
- Consistência entre treinamento e inferência
Necessidades
(bônus)
- Simplificar a execução para equipes de negócio
- Permitir análises sobre as features
- Disponibilização global para a empresa
- Visibilidade dos dados
- Feature importance simplificado
deck
By André Claudino
deck
- 179