Defensa de trabajo final
Licenciatura en Sistemas
Javier Pérez
Dispositivos de interacción
Interfaces
Discapacidades
El 12.9% de las personas en Argentina posee una discapacidad.
Fuente: INDEC. Población con dificultad o limitación permanente. Censo Nacional de Población, Hogares y Viviendas 2010. Octubre 2014
Discapacidad motora superior
El 3.8% de las personas con una discapacidad permanente posee discapacidad motora superior.
Fuente: INDEC. Población con dificultad o limitación permanente. Censo Nacional de Población, Hogares y Viviendas 2010. Octubre 2014
Lesiones traumáticas
Enfermedades congénitas
Ayudas técnicas
Linea Braille
Varitas
Ayudas técnicas
Teclados adaptados
Mouse de gran tamaño
Conmutadores
Reconocimiento de voz
Seguimiento ocular
Desarrollar una herramienta que permita a las personas navegar la web mediante el uso exclusivo de comandos de voz.
Interfaz de voz
Propone un medio de interacción oral mediante el cúal las personas se comunican con los dispositivos de forma natural utilizando exclusivamente la voz.
Al contrario de los otros mecanismos de interacción, donde las personas deben adaptarse al uso de dispositivos artificiales, en la interacción por medio de la voz se invierte los roles, es la computadora quien se ocupa de comprender al ser humano.
Ventajas
Antecedentes
Dispositivos Móviles
Industria
Aplicaciones de escritorio
Aplicaciones web
Inconvenientes de los comandos de voz
Complejidad en la implementación
Frustrante para los usuarios
Para reducir errores es necesario limitar el vocabulario
El usuario debe saber o adivinar los comandos disponibles
Clasificación de funcionalidad presente en la web
| Tipo de funcionalidad | Funcionalidades |
|---|---|
| Funcionalidad exclusiva del navegador | Gestión de pestañas, marcadores, descargas, historial, y sitios más visitados. Control de navegación. Imprimir. Búsqueda de texto en sitio web. |
| Funcionalidad genérica de los sitios web | Elementos que componen los sitios web. Botones, listas de selección de opciones, campos de texto. Reproductor multimedia. |
| Funcionalidad específica de los sitios web | Todas aquellas acciones derivadas de la interacción con un componente web no estándar |
Soporte de funcionalidad presente en la web
| Soporte de funcionalidad | |
|---|---|
| Exclusiva del navegador | Se analizó, exploró y enumeró todas las acciones que están a disposición del usuario. Luego se le atribuyó a cada una de ellas un comando de voz que la representa. Ejemplo: "agregar a favoritos" |
| Genérica del sitio web | Se analizaron todas las posibilidades de interacción brindadas por los elementos definidos en el estándar HTML y se le atribuyeron a cada una de ellas un comando de voz que la soporta. Ejemplo: "click" + "{referencia_de_elemento}" |
| Específica del sitio web | Soporte a través de: :: Comandos de voz desarrollados para contenido genérico del sitio web. :: Módulos personalizados de comandos de voz. :: Comandos de voz nativos de un sitio web |
Módulos personalizados de comandos de voz
Mecanismo mediante el cual un usuario mediante la introducción de comandos de voz puede dar soporte de forma personalizada a un conjunto de funcionalidad deseada.
Cada módulo incluido debería detallar por cada comando de voz la evaluación del contexto de ejecución y el código a ejecutar como consecuencia de la invocación del comando.
Comandos de voz nativos de un sitio web
Mecanismo mediante el cual el sitio en forma nativa define instrucciones de voz que desea exponer al usuario.
Un sitio web luego de detectar que se encuentra ante la presencia de un usuario que interactúa a través de comandos de voz, puede exponer las acciones soportadas informando el nombre del comando y el código a ejecutar al ser es invocada.
Módulos personalizados de comandos de voz
Comandos de voz nativos de un sitio web
Comandos de módulos de la aplicación
Comandos de módulos personalizados
Comandos nativos del sitio web
Prioridad de ejecución
Interfaz visual: Feedback
Interfaz visual: Marcadores referenciales
Interfaz visual: Comandos disponibles según el contexto
Interfaz visual: Cuadro de diálogo en pantalla completa
Interfaz visual: Cuadro de opciones sobre barra de estado
Módulos de comandos de voz
Asistencia al usuario
Dificultades en el proceso de reconocimiento
Proceso de inferencia de comando de voz
Transformación de comandos disponibles a fonemas utilizando Metaphone
| Comándo | Fonemas |
|---|---|
| click vínculo | KLKFNKL |
| click botón | KLKBTN |
| click imagen | KLKMJN |
| click video | KLKFT |
Transformación de transcripciones obtenidas luego de decir "click imagen"
| Comándo | Fonemas |
|---|---|
| click imagen | KLKMJN |
| click | KLK |
| clip imagen | KLPMJN |
| click mágico | KLKMJK |
Cálculo de similitud entre cada par de elementos de las listas utilizando Sorensen-Dice
| Fonemas de Transcripción | Fonemas de Comando | Similitud |
|---|---|---|
| KLKMJN | KLKFNKL | 0.36 |
| KLKMJN | KLKBTN | 0.40 |
| KLKMJN | KLKMJN | 1.00 |
| KLKMJN | KLKFT | 0.44 |
| KLK | KLKFNKL | 0.50 |
| KLK | KLKBTN | 0.57 |
| KLK | KLKMJN | 0.57 |
| KLK | KLKFT | 0.66 |
| KLPMJN | KLKFNKL | 0.18 |
| KLPMJN | KLKBTN | 0.20 |
| KLPMJN | KLKMJN | 0.60 |
| KLPMJN | KLKFT | 0.22 |
| KLKMJK | KLKFNKL | 0.36 |
| KLKMJK | KLKBTN | 0.40 |
| KLKMJK | KLKMJN | 0.80 |
| KLKMJK | KLKFT | 0.44 |
| Comándo | Fonemas |
|---|---|
| click vínculo | KLKFNKL |
| click botón | KLKBTN |
| click imagen | KLKMJN |
| click video | KLKFT |
| Transcripciones | Fonemas |
|---|---|
| click imagen | KLKMJN |
| click | KLK |
| clip imagen | KLPMJN |
| click mágico | KLKMJK |
| Comando | Transcripción | Similutd |
|---|---|---|
| Click imagen | Click imagen | 1.00 |
| Click imagen | Click mágico | 0.80 |
| Click | Click video | 0.66 |
| Click imagen | Clip imagen | 0.60 |
Resultados
Aspectos a tener en cuenta:
Etapas de la evaluación
Participantes de las pruebas
Resultados obtenidos
Grado de acierto correspondiente al reconocimiento de comandos de voz según los distintos oradores
Chrome Web Store
Sitio web www.handsfreeforweb.com
Portación de la herramienta a otras plataformas
Mejoras al reconocimiento de voz
Pruebas automatizadas de una interfaz de voz
Repositorio de módulos personalizados de comandos de voz
Mejorar soporte de elementos HTML
Handsfree for Web para personas no videntes
Los diversos aplicativos capaces de proveer al usuario la capacidad de controlar la computadora a través del uso de la voz, no brindan la posibilidad de interactuar plenamente con los sitios web como lo puede hacer una persona manualmente.
Se desarrolló un modelo navegacional de interacción oral y una herramienta que permite al usuario navegar la web exclusivamente invocando comandos de voz, al mismo tiempo que propone y hace posible un cambio de paradigma de interacción.