Inteligencia
Data Science
Intro
Inteligencia
Capacidad para entender o comprender y resolver problemas. Término compuesto de inter 'entre' y legere 'leer' o 'escoger'.
Algoritmo
Dados un estado inicial y una entrada, pasos sucesivos para llegar a un estado final y se obtiene una solución.
Simple algorithms: SQL queries, Basic data operations
Intermediate algorithms: Regression analysis, Decision trees
Complex algorithm: Neural Network, Sequence Algorithms
Inteligencia
DefinicionesBI: actor, lugar vs atributo
Ranking de actores y lugares según atributo
Conglomerados de actores y lugares según atributo
Anomalías :Detección de actores y lugares tipo Outliers según atributo
Detección de patrones en actores y lugares según atributo
BI Specs
Lugares y Actores vs Atributo
lugares posibles: unidades geográficas de ejecución del presupuesto
(estados, municipios, localidades, info puntos*)
actores posibles: unidades administrativas que participan en el flujo de recursos (acreedor, proveedor, hospitales, escuelas)
atributos posibles : costo medio por acción, beneficiario, municipio, eficiencia relativa, # acciones, #beneficiarios, duración, velocidad de pago, etc
BI SPECS
Main Objective : separate 'data' , comparison & distance measures/metrics are needed.
Ranking & Clustering : Predict/Create Discrete Attribute
(segmentation algorithms - unobservable classes)
(classification algorithms - observable classes)
Anomaly Detection: ??-supervised algorithm,
(measure - signature - threshold)
Inteligencia
Acapulco, GDF, La Paz, Morelos 2013
Encuestas
Identificación entre perfiles y actores (LRegresión, clasificacion de individuos en riesgo)
Diagnósticos Mapeo Geoespacial (PCA clasificación zonas)
BI planeación_encuestas + wordclouds (Exploratory Analysis & Text Mining Techs)
Inteligencia
CNPD, Morelos 2014
Diseño Experimental: Generación Controles (Reg, PCA, clasificación de zonas/individuos )
Posvalidación Muestral (Boostrapping )
Métricas calidad encuestas (Rankings Simples y Quality Asserts vía metainfo)
BI operación_encuestas (Exploratory Analysis, actores: encuestadores, coordinadores)
Inteligencia
SEGOB 2014 -- ?? 2015
Métricas Compuestas del DWH
Aggregation Check, Missing, Emptyness, Type, Basic Statistics Summary
Acciones_A
BI_Acciones: Diagnóstico acción según atributos (monto, beneficiarios)
Alineación conceptual acción (LDA: Clasificación de documentos vía semántica )
Acciones_B
Alineación actores (cómo se gasta vs modelado, requiere mapeo árbol-vars)
Sugerencia estrategia alineación (Función brecha/ medida de alienación )
Inteligencia
Modelado + Espacial (Se necesita una variable dependiente)
Feature Selection (LASSO , RF, Epsilón) (selection, ranking and conditionality)
Aprendizaje de Ensamble* (Bayes Optimality / Averaging, B&B )
Identificación áreas geográficas: patrones propagación, algoritmo selección regional*.
Verificaciones
Asignación Automática*
BI Verificaciones*: logs_analysis, cuestionario
Inteligencia
Ontology, Traffic & Quality (uso y status-mapeo de datos)
Exploration (dónde invierto)
Diagnosis (cómo invierto)
Prediction (cómo debo invertir)
Inteligencia
Casos de Uso #1
Se tienen las manzanas de tres municipios contiguos, se entrena sobre la variable piso de tierra y se identifican perfiles de zonas dónde invertir con base en los datos de infraestructura pública, los datos de INEGI o con base en los datos de pobreza multidimensional CONEVAL, pero se desea integrar la mayor cantidad de datos en la decisión por lo que se decide hacer un PCA.
Inteligencia
Casos de Uso #2
Se tiene registro de algunas características economicas, sociales (#jeringas que piden) de los hospitales de un estado que se sabe tienen mala reputación, se entrena un modelo para encontrar qué atributos/patrones (locación, #pacientes, #doctores, etc) se relacionan más con estos para predecir posibles fugas de jeringas en otros. (logit, ranking buena media mala, creación vars categóricas)
CASO 2
Problema: Detectar fuga de recursos en hospitales públicos.
Atributos: #jeringas, #doctores,#pacientes, localización, etc.
Lugar: Hospitales
Actor: Distribuidor de recursos (secretaría de salud)
Método: logit, ranking buena media mala, creación de variables, categorizaciónes, definición de thresholds)
Respuesta: Probabilidad de que un hospital dado tenga fugas de recursos
Inteligencia
Casos de Uso #3
Se tienen atributos asociados a la población (e información de lugares) y el programa federal tiene en mente una población objetivo pero no sabe cómo localizarla; se desea priorizar a quién atender primero por lo que clasificamos la población con base en los objetivos del programa.... (atender población que cumple estar en pobreza, desnutrición, deserción escolar, estado de inmigrante, residente foráneo, etc) por lo que se lleva acabo una segmentación vía clustering.
CASO 3
Problema versión 1: Hay puntos de atención definidos en un programa pero llega mucha gente a los mismos. Dos preguntas posibles:
- ¿Cómo decido a quien atiendo primero sin cambiar la distribución de recursos?
-
Puede haber puntos congestionados y puntos subutilizados. ¿Cómo
redistribuyo los recursos para atender a la mayor cantidad de personas?
Problema versión 2: El programa esta decidiendo en dónde poner sus puntos de atención.
desglosar lugares, atributos, método y respuesta
Inteligencia
Casos de Uso #4
Es requerido ordenar por importancia las demandas de distintos bienes públicos (seguridad, trabajo, vivienda, medioambiente) que se establecieron en el plan municipal de cuernavaca, nos pide evaluar 3 modelos que hicieron en la UAEM para rankear los indicadores de los rubros anteriores .
(Simulaciones otros algs, Ensamble y más)
CAso 4
Problema: Tengo dinero para resolver ciertas problemáticas
sociales. ¿Dónde existen estas demandas y cómo distribuyo los recursos
que tengo?
Primero hay que determinar la demanda por bienes públicos (seguridad, trabajo, vivienda, medioambiente).
Después se debe crear indicadores para medir dicha demanda.
La
UAEM genero 3 modelos para resolver este problema. Por lo tanto, es
necesario generar métricas de la calidad de sus modelos y decidir cuál
es el mejor o cómo se podrían mejorar.
Inteligencia
Gestión del Gasto Público
Dada la distribucíón de recursos en areas geográficas cuál es el diagnóstico de la eficiencia del uso de dichos recursos.
Distribucíón
eficiente de recursos limitados en areas geográficas que deben cumplir
con un objetivo específico a través de realización de acciones.
Semblanza_Inteligencia
By csampez
Semblanza_Inteligencia
- 384