Análisis geoespacial de alta velocidad sobre datos volátiles móviles

11as Jornadas de SIG Libre

Universidad de Girona

1-2 JUNIO 2017

aplicados a la SEGURIDAD VIAL

 José Gómez Castaño CTO INSPIDE jgcasta@inspide.com

 Juan José Cabrera CEO INSPIDE jjcabrera@inspide.com

http://bit.ly/INSPIDE_SIGTE2017

ÍNDICE

Objetivos

Paneles de Mensaje Variable

Metodología

Datos de entrada

Solución

OBJETIVOS

Objetivos

PMV

Metodología

Datos de entrada

Recopilar información georeferenciada proporcionada por fuentes móviles, determinar la posición en relación con el tráfico y calcular las situaciones de congestión para generar notificaciones en los Paneles de Mensaje Variable en tiempo real.

Explorar el análisis de los datos móviles teniendo en cuenta dos aspectos:

ALTA VELOCIDAD

VOLATILIDAD DE LOS DATOS

descripción

Solución

OBJETIVOS

Objetivos

PMV

Metodología

Datos de entrada

descripción

Solución

 PANELES DE MENSAJE VARIABLE

Objetivos

PMV

Metodología

Datos de entrada

Solución

PMV

Los Paneles de Mensajes Variables (PMV) están diseñados para regular el tráfico adaptando su información a los cambios en las condiciones de la vía.

Se utilizan para dar información a los conductores, advertir de posibles peligros y dar recomendaciones instrucciones obligatorias.

definición

Objetivos

PMV

Metodología

Datos de entrada

Solución

PMV

Al mostrar un mensaje, se debe tener en cuenta tanto la distancia al conductor como el tiempo que tarda en leerlo.

5 segundos a 120 km / h, por lo que los mensajes deben ser breves y fáciles de entender por el conductor.

VENTANA DE LECTURA​

consideraciones

Objetivos

PMV

Metodología

Datos de entrada

Solución

PMV

distribución

Objetivos

PMV

Metodología

Datos de entrada

Solución

VOLATILIDAD DEL MENSAJE

concepto

El concepto de volatilidad de la información está relacionado con su uso.

TIEMPO DE VOLATILIDAD DE LA INFORMACIÓN

Período de tiempo durante el cual un dato es útil para un propósito en particular.

No sólo depende de los datos, sino también de los procesos de cálculo necesarios para obtener un resultado de ellos.

El tiempo de expiración de los datos volátiles se ha explorado en un rango desde 1 minuto hasta 15 minutos.

Objetivos

PMV

Metodología

Datos de entrada

Solución

Son los procesos implementados para lograrlo.

Después de este período, los datos se consideran caducados.

ANÁLISIS DE ALTA VELOCIDAD

by

plataforma singularity

METODOLOGÍA

by

Objetivos

PMV

Metodología

Datos de entrada

Solución

flujo de tratamiento

METODOLOGÍA

by

Objetivos

PMV

Metodología

Datos de entrada

Solución

flujo de tratamiento

METODOLOGÍA

by

# Components
agent.sources = Twitter
agent.channels = MemChannel
agent.sinks = Kafka

# Twitter source config
agent.sources.Twitter.type = PublicStream
agent.sources.Twitter.consumerKey = xxxxxxxxxxxx
agent.sources.Twitter.consumerSecret = xxxxxxxxxxxx
agent.sources.Twitter.accessToken = xxxxxxxxxxx
agent.sources.Twitter.accessTokenSecret = xxxxxxxxxxxx
agent.sources.Twitter.locations = -4.7626,39.8212,-1.3678,41.3232

# Channel config which buffers events in memory
agent.channels.MemChannel.type = memory
agent.channels.MemChannel.capacity = 10000
agent.channels.MemChannel.transactionCapacity = 1000

# Spark Streaming + Flume Integration
agent.sinks = avroSink
agent.sinks.Kafka.type = avro
agent.sinks.Kafka.channel = memoryChannel
agent.sinks.Kafka.hostname = SRV1
agent.sinks.Kafka.port = ARV1port


# Bind the Twitter source and Kafka sink to the channel
agent.sources.Twitter.channels = MemChannel
agent.sinks.Kafka.channel = MemChannel

# Spark Streaming Application
 from pyspark.streaming.flume import FlumeUtils
 addresses = [([sink machine hostname 1], [sink port 1]), ([sink machine hostname 2], [sink port 2])]
 flumeStream = FlumeUtils.createPollingStream(streamingContext, addresses)

lógica de tratamiento

METODOLOGÍA

by

  • Transformación de coordenadas .
  • Cálculo de la distancia desde el origen de cada tuit a la carretera más cercana. Aquellos que están a mayor distancia que el error general estimado para GPS, se descarta.
  • Acumulación de tuits en una carretera. El sistema calcula la densidad de mensajes en un segmento de cada carretera.
  • Búsqueda de los PMV que cumplan el criterio espacio-temporal para recibir la notificación de atasco.
  • Los dispositivos son notificados a medida que se aproximan a la cola del atasco.

Objetivos

PMV

Metodología

Datos de entrada

Solución

FUENTES DE DATOS

by

  • BTN100:  Base de datos geográfica 
  • BTN25:  Base de datos geográfica
  • Cartociudad:   Base de datos oficial de la red viaria.
  • OpenStreetmap:   Base de datos colaborativa ampliamente utilizada en todo el mundo.
  • Modelo Digital de Elevaciones (MDE):     Producto IGN (cobertura nacional y precisión de 30 cm).
  • Portal estadístico de la DGT.
  • Datos propios generados por INSPIDE:    INSPIDE tiene la plataforma Singularity que proporciona la lógica necesaria para la resolución de casos de uso relacionados con la seguridad vial y la movilidad. Esta plataforma proporciona soporte a la aplicación de Comobity de la DGT, y entre otras funciones, permite recopilar información sobre los movimientos (urbanos e interurbanos) de usuarios.
  • API de Twitter
  • Información Celdas    de Telefonía.
  • Información CDR   de Telefonía.

 BTN100

 BTN25

 Cartociudad

 OpenStreetmap

 Modelo Digital de Elevaciones (MDE)

 DGT

 INSPIDE

 Twitter

Objetivos

PMV

Metodología

Datos de entrada

Solución

 Celdas

 CDR

HERRAMIENTAS

by

 

  • Base de datos PostGIS.
  • QGIS como software GIS de escritorio.
  • Lenguajes Java y Python.
  • Instancias de Amazon EC2 autoescalado automático.
  • Apache Flume.
  • Apache Spark.

Objetivos

PMV

Metodología

Datos de entrada

Solución

RESULTADOS

by

Como resultado es posible emitir notificaciones e información que sean visibles por los conductores de forma anticipada y automática.

Los mensajes posicionados a lo largo de la geometría de la carretera definen perfectamente las secciones en las que hay concentración de vehículos.

Como conocemos la geometría del camino y la posición de los paneles, es posible enviar mensajes individuales a cada PMV dependiendo de la distancia a la concentración.

Se han utilizado más de 400 K ubicaciones y tuits sobre España, y más de 2,6 M de geometrías.

Objetivos

PMV

Metodología

Datos de entrada

Solución

RESULTADOS

by

En paralelo, los mensajes se envían a los dispositivos de Comobity que se inclinan hacia la zona de la concentración.

Objetivos

PMV

Metodología

Datos de entrada

Solución

RESULTADOS

by

Objetivos

PMV

Metodología

Datos de entrada

Solución

COMPARATIVA

by

Comparación entre la exactitud de los datos de las celdas de telefonía y los obtenidos Directamente de los tuits una vez que se procesaron. 

La ubicación de las antenas de telefonía geoportal del Ministerio de Industria (Infoantenas). Como complemento a Infoantenas, ha obtenido un conjunto adicional de antenas a partir de los datos del portal colaborativo 

con el uso de datos procedentes de celdas

Objetivos

PMV

Metodología

Datos de entrada

Solución

COMPARATIVA

con el uso de datos procedentes de celdas

Objetivos

PMV

Metodología

Datos de entrada

Solución

COMPARATIVA

by

  • Para proyectar el área de cobertura de cada celda sobre suelo se ha desarrollado un proceso que permite que cada una de las tres antenas se sitúe en la hoja correspondiente a la MTN25.
  • A partir de estas posiciones, se ha descargado la información MDE en el que se encuentra.
  • Para asegurar el cálculo de la cuenca de visibilidad completa, se han descargado 9 hojas y las 8 adyacentes para cada antena.
  • El área de estas celdas es variable, teniendo mayor cobertura en áreas cercanas a carreteras principales y áreas urbanas.

con el uso de datos procedentes de celdas

Objetivos

PMV

Metodología

Datos de entrada

Solución

COMPARATIVA

by

con el uso de datos procedentes de celdas

Objetivos

PMV

Metodología

Datos de entrada

Solución

COMPARATIVA

con el uso de datos procedentes de celdas

Objetivos

PMV

Metodología

Datos de entrada

Solución

COMPARATIVA

by

  • Se han utilizado los 4,5 M movimientos de las unidades de la aplicación Comobity para emjular comunicaciones de telefonía, y transferirlos sobre las celdas correspondientes.
  • Los atascos pueden ubicarse a nivel de celda. La resolución obtenida es menor que al usar la posición de los propios tuits, haciendo que la información alcance PMVs en carreteras que no se ven afectadas realmente  por atascos de tráfico.

con el uso de datos procedentes de celdas

Objetivos

PMV

Metodología

Datos de entrada

Solución

COMPARATIVA

by

con el uso de datos procedentes de celdas

Objetivos

PMV

Metodología

Datos de entrada

Solución

Análisis geoespacial de alta velocidad sobre datos volátiles móviles

11as Jornadas de SIG Libre

Universidad de Girona

1-2 JUNIO 2017

aplicados a la SEGURIDAD VIAL