Aprovechando data no estructurada con iKNOW
- Condori Velasquez, Jessica
- Pariona Espinhal, Eder Rafo Jose
- Ramos Reyes , Alexander
Todo el conocimiento orientado a las actividades dependen en gran medida de los datos no estructurados
Data no estructurada vs data estructurada
Por que analizar data no estructurada
Al menos el 85% del tiempo se dedica a utilizar o la creación de los datos no estructurados
Que es iKnow
Que no es iKnow ?
iKnow no es una herramienta de búsqueda, las herramientas de búsqueda le permite localizar aquellas cosas que una persona ya sabe que están en el texto. iknow permite utilizar todo el contenido del texto incluyendo textos cuyo contenido es totalmente desconocido para una persona, utiliza el algoritmo semántico avanzado, basado en reglas lingüísticas que detecta frases mediante reglas del lenguaje que varían por idioma (ingles, español), identifica conceptos semánticamente, por eso no es necesario buscar estos conceptos en un diccionario
Interpretador semantico
El algoritmo semántico de iknow proporciona acceso a los datos no estructurados mediante la fragmentación del texto en entidades relacionadas y produciendo un índice de estas sentencias, guarda las entidades semánticas para futuras consultas (queries).
Algoritmo semantico
-
Indexación inteligente : analiza y transforma el texto sin estructurar en una red comprensible de relaciones y conceptos sin necesidad de usar diccionarios, taxonomías u ontologías predefinidas.
Algoritmo semantico
-
Coincidencia inteligente (Smart Matching) enlaza los resultados de la indexación inteligente con informaciones específicas de un dominio, una organización o un sector.
- Interpretación inteligente (Smart Interpretation) aplica análisis y/o reglas de negocio a los resultados derivados de la indexación inteligente y la correspondencia inteligente.
- Entidades
- Paths
- Negation
- Frecuency
- Spread
Terminología basica
2. Path
Es una secuencia significativa de conceptos y relaciones a través de una frase. Por ejemplo un path común el concepto esclavo de una CRC se convertirá en el concepto principal del próxima CRC
Terminología basica
-
Conceptos
-
Relación
- No relevante
1. Entidades
Ejemplo 1
“The clever cat eats cheese and breathes down rat holes with bated breath”
Conceptos : Clever cat, Chese, rat holes
Relaciones : eats, and breathes down
No relevante : the
1. Entidades
Es una secuencia significativa de conceptos y relaciones a través de una frase. Por ejemplo un path común el concepto esclavo de una CRC se convertirá en el concepto principal del próxima CRC
2. Paths
Utilizando la logica de predicados iKnow convierte una sentencia afirmativa (o parte de una frase) en su contrario, una negación. Por ejemplo, la frase "Yo soy un médico." Puede ser negada como "Yo no soy un médico." Al analizar el texto a menudo es importante separar las declaraciones afirmativas sobre un tema de las declaraciones negativas acerca de ese tema. Hay 2 tipos básicos de negación:
-
Negación formal o gramatical siempre se indica un elemento morfológico específico en el texto, generalmente “no”, “not”, “don’t” , estos elementos negados pueden ser partes de un concepto.
-
Negación semántica es una forma compleja depende del contexto de la negación no está indicado por ningún elemento morfológico específico en el texto.
3. Negation
3. Negation
iKnow representa la negación como un atributo, en las fuentes, oraciones o paths, que contiene una.
3. Negation
A continuación mostramos la posición del marcador de negación dentro de la entidad como un mapa de bits.
Un "1" indica una palabra que es un marcador de negación;
Un "0" indica una palabra que no es un marcador de negación.
Un marcador de negación que consta de dos palabras adyacentes, tales como "no es", se indica como "11". El mapeo de entidad se detiene cuando el marcador de negación se ha indicado.
Por ejemplo, la relación "is often not" es "001", mientras que la relación "often is not" es "011", y la relación "is not often" es "11".
3. Negation
3. Negation
Ejemplo : ”The cow didn’t eat grass with a fork”.
iKnow describe su base de conocimientos
3. Frecuency
4. Spread
Conteo de cuantas veces aparece la entidad en los documentos de origen.
Conteo de cuantos documentos de texto originales contiene la entidad.
Panel iKnow
Panel iKnow
Panel iKnow
Panel iKnow
Panel iKnow
Sources
Conclusiones
- IKnow nos muestra el significado de los datos no estructurados , no es necesario que los usuarios sepan que tiene un texto para entenderlo ya que iKnow utilizando el algortimo semantico y la logica de predicado me va a mostrar los conceptos mediante resumenes.
UPC IA 2015 iKnow
By Eder Rafo Jose Pariona Espiñal
UPC IA 2015 iKnow
Aprovechando data no estructurada con la tecnologia iknow
- 856