Plataforma de IA

IA Front

Universo

Frameworks de (pré)-processamento, IA e Big Data

Armazenamento e pesquisa de dados

Infra de execução

Orquestração

Usamos kubeflow para orquestrar pipelines
Execuções podem ser manuais ou agendadas

Autonomia

Damos autonomia ao usuário final para criar/executar pipelines com dados próprios

Orquestração

Temos um ambiente centralizado onde o usuário ver os resultados

Features

Features são armazenadas nas plataformas de bigdata (Athena e BigQuery) com marcações de tempo

Features

Jobs criam versões vetorizadas das features quando necessário

Reúso de aplicações

Criação de uma plataforma para versionamento e compartilhamento de modelos, ETLs, avaliadores, etc.

Customização

Tudo executado na forma de containers, criando ambientes isolados
Troca de dados feita por meio de storages comuns e APIs (integrável a vários serviços e bibliotecas)
Já temos bibliotecas de suporte isolado e nativo para Spark e Tensorflow
Isolamento dá liberdade total na escolha das ferramentas
Estamos desenvolvendo tunning automático de modelos

Necessidades

Parametrização temporal
Feature Engineering
Materialização de dados de treino e validação
Recomposição de features para inferência
Consistência entre treinamento e inferência

Necessidades

(bônus)

Simplificar a execução para equipes de negócio
Permitir análises sobre as features
Disponibilização global para a empresa
Visibilidade dos dados
Feature importance simplificado

Made with Slides.com