Ingeniero Técnico en Informática de Sistemas por la UMA
Más de 10 años de experiencia en el desarrollo software (.NET)
Desarrollo móvil multiplataforma (Xamarin)
I Concurso de Reutilización de Datos Abiertos del Ayuntamiento de Málaga
Ganador en App móviles: cleanSpot - Tu punto limpio más cercano!
Parece que los Datos Abiertos no son muy conocidos
Dar una charla motiva a aprender y/o profundizar
Datos que las administraciones públicas ponen a nuestra disposición para que los podamos reutilizar
El concepto surgió en el 2007 en EEUU en una reunión de expertos de Internet
8 principios: completos, primarios, oportunos, accesibles, procesables, no discriminatorio, no propietario y libre de licencias
Son un recurso público
Ganancia democrática y creación de valor mediante el desarrollo nuevas actividades
Según el ODI el mercado global de Datos Abiertos podría ascender a 5 trillones de dólares
Miles de empresas y millones de empleos en torno a los Datos Abiertos
España es el segundo país de la UE en gestión de Datos Abiertos en 2019 según el DESI y ODMR
Impacto en la UE: 200KM€ y 1M de empleos en 2019 y se espera 300KM€ y 2M de empleos en 2025
Legislación: Directiva europea 2019/1024 y Ley 37/2007 y Real Decreto 1495/2011 y NTI
Sectores con gran potencial: agricultura, servicios financieros y seguros, salud, educación, comercio
Tenemos derecho al acceso pero hay condiciones para su reutilización
Cada entidad pública puede decidir bajo qué condiciones es posible proceder a la reutilización de la información
El modo más común es bajo licencias tipo y, generalmente, licencias abiertas
En España toda información pública es reutilizable por defecto bajo ciertas condiciones básicas, normalmente la citación de la fuente
Distintas fases para el aprovechamiento de los datos
Fase 0: Scraping o escrapeo de datos. Datos no estructurados a estructurados. Web scraping (ParseHub, Import.io) y PDF scraping (PDFTables, Tabula)
Fase 1: Tratamiento de datos. Mejorar calidad de los datos estructurados. Data cleansing, data wrangling y record linkage. Open Refine y Data Wrangler
Fase 2: Análisis. Clustering o análisis de agrupamiento, análisis de regresión y predictivo. RStudio y Matlab
Fase 3: Visualización. Ayuda a comunicar y comprender la información: Gráficas, mapas, animaciones, etc.
Basados en CKAN
Acceso fácil e intuitivo al catálogo: búsquedas tipo Google y filtrado por categorías, temas, publicador, etc.
Visualización de datos directamente en el portal (mapas) y acceso mediante API REST
Redes federadas de portales
Formato para metadatos: RDF. Consulta sobre éstos usando el lenguaje SPARQL
Formatos: CSV, Excel, JSON, PDF, HTML, etc. Para mapas: KML, KMZ, GeoJSON.
Portal de referencia en España sobre Datos Abiertos
Aglutina todas las iniciativas de Datos Abiertos de España a nivel estatal, autonómico, local y universitario
Más de 300 iniciativas localizables en un mapa y catálogo de datos con más de 27 mil conjuntos
Otros servicios: noticias, disponibilidad de datos, aplicaciones, empresas reutilizadoras, asesoramiento, tutoriales, etc.
Llevo un año trabajando con Datos Abiertos y al principio todo manual
Fase -1: Disponibilidad de los datos. Google Alerts y RSS a datasets
Scraping web: HtmlAgilityPack y XPath
Transformación de datos JSON, KMZ, CSV -> Excel -> SQL. JSONPath, XPath y RegEx
Rastreo y automatizar proceso mediante Azure Functions
Smart city y movilidad urbana en EU
Cuadro de Mandos de COVID19 - David Bueno Vallejo (CEMI)
Monitorización de bosques del mundo
Situación legal de zonas de marisqueo en Andalucía
Distanciamiento peatonal en Madrid
Más Datos Abiertos y de mayor calidad
Estandarización en conjunto de datos similares
Datos del sector privado, académico y tercer sector
Datos en tiempo real