Inteligencia
Capacidad para entender o comprender y resolver problemas. Término compuesto de inter 'entre' y legere 'leer' o 'escoger'.
Algoritmo
Dados un estado inicial y una entrada, pasos sucesivos para llegar a un estado final y se obtiene una solución.
Simple algorithms: SQL queries, Basic data operations
Intermediate algorithms: Regression analysis, Decision trees
Complex algorithm: Neural Network, Sequence Algorithms
Ranking de actores y lugares según atributo
Conglomerados de actores y lugares según atributo
Anomalías :Detección de actores y lugares tipo Outliers según atributo
Detección de patrones en actores y lugares según atributo
Lugares y Actores vs Atributo
lugares posibles: unidades geográficas de ejecución del presupuesto
(estados, municipios, localidades, info puntos*)
actores posibles: unidades administrativas que participan en el flujo de recursos (acreedor, proveedor, hospitales, escuelas)
atributos posibles : costo medio por acción, beneficiario, municipio, eficiencia relativa, # acciones, #beneficiarios, duración, velocidad de pago, etc
Main Objective : separate 'data' , comparison & distance measures/metrics are needed.
Ranking & Clustering : Predict/Create Discrete Attribute
(segmentation algorithms - unobservable classes)
(classification algorithms - observable classes)
Anomaly Detection: ??-supervised algorithm,
(measure - signature - threshold)
Acapulco, GDF, La Paz, Morelos 2013
Encuestas
CNPD, Morelos 2014
SEGOB 2014 -- ?? 2015
Métricas Compuestas del DWH
Aggregation Check, Missing, Emptyness, Type, Basic Statistics Summary
Acciones_A
BI_Acciones: Diagnóstico acción según atributos (monto, beneficiarios)
Alineación conceptual acción (LDA: Clasificación de documentos vía semántica )
Acciones_B
Alineación actores (cómo se gasta vs modelado, requiere mapeo árbol-vars)
Sugerencia estrategia alineación (Función brecha/ medida de alienación )
Modelado + Espacial (Se necesita una variable dependiente)
Feature Selection (LASSO , RF, Epsilón) (selection, ranking and conditionality)
Aprendizaje de Ensamble* (Bayes Optimality / Averaging, B&B )
Identificación áreas geográficas: patrones propagación, algoritmo selección regional*.
Verificaciones
Asignación Automática*
BI Verificaciones*: logs_analysis, cuestionario
Ontology, Traffic & Quality (uso y status-mapeo de datos)
Exploration (dónde invierto)
Diagnosis (cómo invierto)
Prediction (cómo debo invertir)
Casos de Uso #1
Se tienen las manzanas de tres municipios contiguos, se entrena sobre la variable piso de tierra y se identifican perfiles de zonas dónde invertir con base en los datos de infraestructura pública, los datos de INEGI o con base en los datos de pobreza multidimensional CONEVAL, pero se desea integrar la mayor cantidad de datos en la decisión por lo que se decide hacer un PCA.
Casos de Uso #2
Problema: Detectar fuga de recursos en hospitales públicos.
Atributos: #jeringas, #doctores,#pacientes, localización, etc.
Lugar: Hospitales
Actor: Distribuidor de recursos (secretaría de salud)
Método: logit, ranking buena media mala, creación de variables, categorizaciónes, definición de thresholds)
Respuesta: Probabilidad de que un hospital dado tenga fugas de recursos
Casos de Uso #3
Problema versión 1: Hay puntos de atención definidos en un programa pero llega mucha gente a los mismos. Dos preguntas posibles:
- ¿Cómo decido a quien atiendo primero sin cambiar la distribución de recursos?
-
Puede haber puntos congestionados y puntos subutilizados. ¿Cómo
redistribuyo los recursos para atender a la mayor cantidad de personas?
Problema versión 2: El programa esta decidiendo en dónde poner sus puntos de atención.
desglosar lugares, atributos, método y respuesta
Casos de Uso #4
Problema: Tengo dinero para resolver ciertas problemáticas
sociales. ¿Dónde existen estas demandas y cómo distribuyo los recursos
que tengo?
Primero hay que determinar la demanda por bienes públicos (seguridad, trabajo, vivienda, medioambiente).
Después se debe crear indicadores para medir dicha demanda.
La
UAEM genero 3 modelos para resolver este problema. Por lo tanto, es
necesario generar métricas de la calidad de sus modelos y decidir cuál
es el mejor o cómo se podrían mejorar.
Gestión del Gasto Público
Dada la distribucíón de recursos en areas geográficas cuál es el diagnóstico de la eficiencia del uso de dichos recursos.
Distribucíón
eficiente de recursos limitados en areas geográficas que deben cumplir
con un objetivo específico a través de realización de acciones.