Aprovechando data no estructurada con iKNOW

  • Condori Velasquez, Jessica
  • Pariona Espinhal, Eder Rafo Jose
  • Ramos Reyes , Alexander

Todo el conocimiento orientado a las actividades dependen en gran medida de los datos no estructurados

Data no estructurada vs data estructurada

Por que analizar data no estructurada

Al menos el 85% del tiempo se dedica a utilizar o la creación de los datos no estructurados

Que es iKnow

Que no es iKnow ?

iKnow no es una herramienta de búsqueda, las herramientas de búsqueda le permite localizar aquellas cosas que una persona ya sabe que están en el texto. iknow permite utilizar todo el contenido del texto incluyendo textos cuyo contenido es totalmente desconocido para una persona, utiliza el algoritmo semántico avanzado, basado en reglas lingüísticas que detecta frases mediante reglas del lenguaje que varían por idioma (ingles, español), identifica conceptos semánticamente, por eso no es necesario buscar estos conceptos en un diccionario

 

Interpretador semantico

El algoritmo semántico de iknow proporciona acceso a los datos no estructurados mediante la fragmentación del texto en entidades relacionadas y produciendo un índice de estas sentencias, guarda las entidades semánticas para futuras consultas (queries).

 

Algoritmo semantico

  • Indexación inteligente : analiza y transforma el texto sin estructurar en una red comprensible de relaciones y conceptos sin necesidad de usar diccionarios, taxonomías u ontologías predefinidas.

Algoritmo semantico

  • Coincidencia inteligente (Smart Matching) enlaza los resultados de la indexación inteligente con informaciones específicas de un dominio, una organización o un sector.

  • Interpretación inteligente (Smart Interpretation)  aplica análisis y/o reglas de negocio a los resultados derivados de la indexación inteligente y la correspondencia inteligente.
  1. Entidades
  2. Paths
  3. Negation
  4. Frecuency
  5. Spread

 

Terminología basica

2. Path

Es una secuencia significativa de conceptos y relaciones a través de una frase. Por ejemplo un path común el concepto esclavo de una CRC se convertirá en el concepto principal del próxima CRC 

Terminología basica

  • Conceptos

  • Relación

  • No relevante

1. Entidades

Ejemplo 1

“The clever cat eats cheese and breathes down rat holes with bated breath”

Conceptos : Clever cat, Chese, rat holes

Relaciones : eats, and breathes down

No relevante : the

 

1. Entidades

Es una secuencia significativa de conceptos y relaciones a través de una frase. Por ejemplo un path común el concepto esclavo de una CRC se convertirá en el concepto principal del próxima CRC 

2. Paths

Utilizando la logica de predicados iKnow convierte una sentencia afirmativa (o parte de una frase) en su contrario, una negación. Por ejemplo, la frase "Yo soy un médico." Puede ser negada como "Yo no soy un médico." Al analizar el texto a menudo es importante separar las declaraciones afirmativas sobre un tema de las declaraciones negativas acerca de ese tema. Hay 2 tipos básicos de negación:

 

  • Negación formal o gramatical siempre se indica un elemento morfológico específico en el texto, generalmente  “no”, “not”, “don’t” , estos elementos negados pueden ser partes de un concepto.

  • Negación semántica es una forma compleja depende del contexto de la negación no está indicado por ningún elemento morfológico específico en el texto.

 

 

 

3. Negation

3. Negation

iKnow representa la negación como un atributo, en las fuentes, oraciones  o paths, que contiene una.

3. Negation

A continuación mostramos la posición del marcador de negación dentro de la entidad como un mapa de bits.

Un "1" indica una palabra que es un marcador de negación;

Un "0" indica una palabra que no es un marcador de negación.

Un marcador de negación que consta de dos palabras adyacentes, tales como "no es", se indica como "11". El mapeo de entidad se detiene cuando el marcador de negación se ha indicado.

Por ejemplo, la relación "is often not" es "001", mientras que la relación "often is not" es "011", y la relación "is not often" es "11".

 

3. Negation

3. Negation

Ejemplo : ”The cow didn’t eat grass with a fork”.

 

iKnow describe su base de conocimientos

3. Frecuency

4. Spread

Conteo de cuantas veces aparece la entidad en los documentos de origen.

Conteo de cuantos documentos de texto originales contiene la entidad.

 

Panel iKnow

Panel iKnow

Panel iKnow

Panel iKnow 

Panel iKnow

Sources

Conclusiones

  • IKnow nos  muestra el significado de los datos no estructurados , no es necesario que los usuarios sepan que tiene un texto para entenderlo ya que iKnow utilizando el algortimo semantico y la logica de predicado me va a mostrar los conceptos mediante resumenes.

 

UPC IA 2015 iKnow

By Eder Rafo Jose Pariona Espiñal

UPC IA 2015 iKnow

Aprovechando data no estructurada con la tecnologia iknow

  • 856