Del Tema al Problema

Experiencias en la exploración de posibles problemas de investigación para Tesinas de Grado

Taller de Tesina (11091) - UNLu - 2021

Antes de comenzar

No es Normativo

No hay reglas ni formulas

Lectura previa

Si, hay que leer incluso antes de tener un Problema

Dimensión Individual y Social

Trabajo Individual (Demostrar al resto la evolución personal)

- Colegas

- Director / Co-Director
- Autores

- ¿Internet?

Tema 1

Tema 1

Indexación Distribuida

Indexación Distribuida

Contexto

Contexto

Final de Carrera

Contexto

Final de Carrera

2 Temas Generales

Contexto

Final de Carrera

2 Temas Generales

Uno "clásico"

Contexto

Final de Carrera

2 Temas Generales

Uno "clásico"

El otro "moderno"

Contexto

Big Data
(Datos Masivos)

Estructuras de Datos para

Motores de Búsquedas

Contexto

Big Data
(Datos Masivos)

Estructuras de Datos para

Motores de Búsquedas

¿Cual Elegir?

Contexto

Big Data
(Datos Masivos)

Estructuras de Datos para

Motores de Búsquedas

¿Cual Elegir?

¿Por qué no  ambos ?

¿Cual Elegir?

Pros y Contras

Pros y Contras

Ventajas

Pros y Contras

Ventajas

  • Docentes con Perfil

Pros y Contras

Ventajas

  • Docentes con Perfil
  • No era un Tema "Raro"

Pros y Contras

Ventajas

  • Docentes con Perfil
  • No era un Tema "Raro"
  • Disponibilidad de Datos de Pruebas

Pros y Contras

Ventajas

  • Docentes con Perfil
  • No era un Tema "Raro"
  • Disponibilidad de Datos de Pruebas

Desventajas

Pros y Contras

Ventajas

  • Docentes con Perfil
  • No era un Tema "Raro"
  • Disponibilidad de Datos de Pruebas

Desventajas

  • Big Data era tema "hot"

Pros y Contras

Ventajas

  • Docentes con Perfil
  • No era un Tema "Raro"
  • Disponibilidad de Datos de Pruebas

Desventajas

  • Big Data era tema "hot"

No nos importa eso en la Tesina de Grado

Pros y Contras

Ventajas

  • Docentes con Perfil
  • No era un Tema "Raro"
  • Disponibilidad de Datos de Pruebas

Desventajas

  • Big Data era tema "hot"
  • Tecnologías que no manejaba

No nos importa eso en la Tesina de Grado

Pros y Contras

Ventajas

  • Docentes con Perfil
  • No era un Tema "Raro"
  • Disponibilidad de Datos de Pruebas

Desventajas

  • Big Data era tema "hot"
  • Tecnologías que no manejaba
  • Ídem con Lenguajes

No nos importa eso en la Tesina de Grado

Tareas iniciales

Tareas iniciales

¿Como arrancar?

Tareas iniciales

¿Como arrancar?

Lectura de Artículos del Tema (superficial)

Tareas iniciales

¿Como arrancar?

Lectura de Artículos del Tema (superficial)¹

Tareas iniciales

¿Como arrancar?

Lectura de Artículos del Tema (superficial)¹

Lectura de Tesinas
(Trabajos Futuros)

Tareas iniciales

¿Como arrancar?

Lectura de Artículos del Tema (superficial)¹

Lectura de Tesinas
(Trabajos Futuros)

Conversaciones con
Docentes Candidatos a Directores

Definiciones

Definiciones

Tesina Experimental
(Relevamiento Bibliográfico + Experimento)

Definiciones

Tesina Experimental
(Relevamiento Bibliográfico + Experimento)

Recae sobre el IR y Big Data sería
secundario

Definiciones

Tesina Experimental
(Relevamiento Bibliográfico + Experimento)

Recae sobre el IR y Big Data sería
secundario

Componente "local": Generación de Cluster que podría ser utilizado por terceros

Preguntas de Investigación

Preguntas de Investigación

PREGUNTA 1
 

¿Existen implementaciones de algoritmos de construcción de índices para la plataforma de Big Data utilizada?

¿Son públicos? ¿Se pueden reutilizar?

Preguntas de Investigación

PREGUNTA 2

¿Los algoritmos elegidos se comportan de forma similar en contextos secuenciales y distribuidos?

Preguntas de Investigación

PREGUNTA 3

Las plataformas de Big Data Open Source

¿Como se comportan en un entorno acotado con hardware commodity?

Tema 2

Tema 2

Procesamiento Distribuido de Grafos

Escenario

Escenario

Big Data como "irrupción"

Escenario

Big Data como "irrupción"

Contextos Distribuidos al alcance de todxs

Escenario

Big Data como "irrupción"

Contextos Distribuidos al alcance de todxs

Nuevas necesidades de los usuarios

Grafos (Tema Clásico)

+

Big Data

=

Tema "Hot"

Escenario

Ejecución de algoritmos
de grafos para datos masivos
en contexto distribuido con datasets

del tamaño de Big Data

Tema

Reflexiones

Tema clásico + Novedad ~= riesgo de obsolescencia

Hay Staff de Investigación para Dirigir Tema

Bibliografía sólida y abundante

¿Como lidiar con la obsolescencia?

* Tiempo de elaboración

* Agregar componente local

Preguntas de Investigación

¿Que plataformas para procesar grafos distribuidos existen?
¿Cuales son los rangos de datos para los cuales funcionan?
¿Rinden bien en contextos de datos masivos?

¿Como varía el rendimiento en el procesamiento para datasets de diferentes tamaño?
¿Existe algún límite práctico?
¿Los limitantes son de Recursos Físicos o de las estrategias de distribución de la carga de trabajo?

Pasos a Seguir

Hablar con Directores posibles

Hacer un estado del arte, viendo si las preguntas ya fueron evaluadas o respondidas.

¿Que pasa si alguna de mis preguntas de investigación ya fueron respondidas?

¿Preguntas?

Muchas Gracias

Made with Slides.com