Inteligencia


Data Science



Intro

Inteligencia

Capacidad para entender o comprender y resolver problemas. Término compuesto de inter 'entre' y legere 'leer' o 'escoger'.  


Algoritmo      

Dados un estado inicial y una entrada, pasos sucesivos para llegar a un estado final y se obtiene una solución.

Simple algorithms: SQL queries, Basic  data operations
Intermediate algorithms:  Regression analysis,  Decision trees
Complex algorithm: Neural Network,  Sequence Algorithms






Inteligencia

Definiciones
       
     BI:  actor, lugar  vs atributo   

Ranking de actores y lugares según atributo 
Conglomerados de actores y lugares según atributo  
Anomalías :
Detección de actores y lugares tipo Outliers según atributo
Detección de patrones en actores y lugares según atributo      

BI Specs

 Lugares y Actores vs Atributo


lugares posibles:  unidades geográficas de ejecución del presupuesto

 (estados, municipios, localidades, info puntos*)


actores posibles:  unidades administrativas que participan en el flujo de recursos (acreedor,  proveedor,  hospitales,  escuelas)


atributos posibles :  costo medio por acción, beneficiario, municipio, eficiencia relativa,  # acciones, #beneficiarios, duración, velocidad de pago, etc


BI SPECS

Main Objective : separate 'data' ,  comparison & distance measures/metrics are needed.


Ranking & Clustering : Predict/Create Discrete Attribute

 (segmentation algorithms - unobservable classes)

(classification algorithms - observable classes)


Anomaly Detection: ??-supervised algorithm,

(measure - signature - threshold)






Inteligencia


Acapulco, GDF, La Paz, Morelos  2013


Encuestas

         Diseño Experimental:  Muestreo por Cuotas (Info con requisitos distribucionales)
         Identificación entre perfiles y actores (LRegresión, clasificacion de individuos en riesgo)
         Diagnósticos Mapeo Geoespacial (
PCA  clasificación zonas)
        BI planeación_encuestas + wordclouds  (Exploratory Analysis & Text Mining Techs)  

Inteligencia


CNPD, Morelos 2014    

Encuestas
       Diseño Experimental:  Generación Controles (Reg, PCA, clasificación de zonas/individuos )
             Posvalidación Muestral (Boostrapping )
             Métricas calidad encuestas  (Rankings Simples y Quality Asserts vía metainfo)
             BI operación_encuestas  (Exploratory Analysis, actores: encuestadores, coordinadores)

Inteligencia


SEGOB 2014 -- ??  2015


Métricas Compuestas del DWH
        Aggregation Check, Missing, Emptyness, Type, Basic Statistics Summary
Acciones_A   
        BI_Acciones: Diagnóstico acción según atributos (monto, beneficiarios)
             Alineación conceptual acción (LDA:  Clasificación de documentos
vía  semántica )
Acciones_B 
        Alineación actores (cómo se gasta  vs modelado, requiere mapeo árbol-vars)
            Sugerencia estrategia alineación  (Función  brecha/ medida de alienación )

Inteligencia


SEGOB 2014 -- ?? 2015


    Modelado  +  Espacial  (Se necesita una variable dependiente)
         Feature Selection  (LASSO , RF,  Epsilón) (selection, ranking and conditionality)

            Aprendizaje de Ensamble*  (Bayes Optimality / Averaging, B&B )

            Identificación áreas geográficas: patrones propagación, algoritmo selección regional*.

    Verificaciones 
         Asignación Automática*
              BI Verificaciones*: logs_analysis, cuestionario


 Inteligencia


  Ontology, Traffic & Quality (uso y status-mapeo de datos)


 Exploration (dónde invierto)


Diagnosis (cómo invierto) 


 Prediction  (cómo debo invertir)







Inteligencia

Casos de Uso #1


    Se tienen las manzanas de tres municipios contiguos, se entrena sobre la variable piso de tierra y se identifican perfiles de zonas dónde invertir con base en los datos de infraestructura pública, los datos de INEGI o con base en los datos de pobreza multidimensional CONEVAL, pero se desea integrar la mayor cantidad de datos en la decisión por lo que se decide hacer un PCA.


Inteligencia

Casos de Uso #2


Se tiene registro de algunas características economicas, sociales (#jeringas que piden) de los hospitales de un estado que se sabe tienen mala reputación, se entrena un modelo para encontrar qué atributos/patrones (locación, #pacientes, #doctores, etc) se relacionan más con estos para predecir posibles fugas de jeringas en otros. (logit, ranking buena media mala, creación vars categóricas)

CASO 2

Problema: Detectar fuga de recursos en hospitales públicos.

Atributos: #jeringas, #doctores,#pacientes, localización, etc.
Lugar: Hospitales
Actor: Distribuidor de recursos (secretaría de salud)

Método: logit, ranking buena media mala, creación de variables, categorizaciónes, definición de thresholds)

Respuesta: Probabilidad de que un hospital dado tenga fugas de recursos

Inteligencia

Casos de Uso #3


 Se tienen atributos asociados a la población (e información de lugares) y el programa federal tiene en mente una población objetivo pero no sabe cómo localizarla; se desea priorizar a quién atender primero por lo que clasificamos la población con base en los objetivos del programa.... (atender población que cumple estar en pobreza, desnutrición, deserción escolar, estado de inmigrante, residente foráneo, etc) por lo que se lleva acabo una segmentación vía clustering.

CASO 3

Problema versión 1: Hay puntos de atención definidos en un programa pero llega mucha gente a los mismos. Dos preguntas posibles:
- ¿Cómo decido a quien atiendo primero sin cambiar la distribución de recursos?
- Puede haber puntos congestionados y puntos subutilizados. ¿Cómo redistribuyo los recursos para atender a la mayor cantidad de personas?

Problema versión 2: El programa esta decidiendo en dónde poner sus puntos de atención.

desglosar lugares, atributos, método y respuesta

Inteligencia

Casos de Uso #4

  

    Es requerido ordenar por importancia las demandas de distintos bienes públicos (seguridad, trabajo, vivienda, medioambiente) que se establecieron en el plan municipal de cuernavaca, nos pide evaluar 3 modelos que hicieron en la UAEM para rankear los indicadores de los rubros anteriores .
(Simulaciones otros algs, Ensamble y más)

CAso 4


Problema: Tengo dinero para resolver ciertas problemáticas sociales. ¿Dónde existen estas demandas y cómo distribuyo los recursos que tengo?

Primero hay que determinar la demanda por bienes públicos (seguridad, trabajo, vivienda, medioambiente).
Después se debe crear indicadores para medir dicha demanda.
La UAEM genero 3 modelos para resolver este problema. Por lo tanto, es necesario generar métricas de la calidad de sus modelos y decidir cuál es el mejor o cómo se podrían mejorar.

Inteligencia


Gestión del Gasto Público

Dada la distribucíón de recursos en areas geográficas cuál es el diagnóstico de la eficiencia del uso de dichos recursos.

Distribucíón eficiente de recursos limitados en areas geográficas que deben cumplir con un objetivo específico a través de realización de acciones.

Semblanza_Inteligencia

By csampez

Semblanza_Inteligencia

  • 384