Introducción a Langchain

Ing. José Miguel Amaya Camacho

miguel.amaya99@gmail.com

¿Qué son los LLMs?

Los modelos de lenguaje a gran escala (LLMs) son avanzados modelos de machine learning que sobresalen en tareas relacionadas con el lenguaje, como generación de texto, traducción, resumen, respuesta a preguntas, entre otras.
Suelen utilizarse a través de una interfaz de modelo de chat que toma como entrada una lista de mensajes y devuelve un mensaje como salida.

¿Qué son los LLMs?

La última generación de LLMs ofrece capacidades adicionales:

Llamadas a herramientas: Muchos modelos populares ofrecen una API para interactuar con herramientas externas, servicios, APIs y bases de datos.
Salida estructurada: Hacer que el modelo responda en un formato estructurado, como JSON que cumple con un esquema definido.
Multimodalidad: La capacidad de trabajar con datos distintos al texto, como imágenes, audio y video.

¿Qué es Langchain?

Es un framework para desarrollar aplicaciones basadas en Large Language Models (LLM).
Simplifica cada etapa del ciclo de vida de las aplicaciones LLM.
Proporciona una interfaz uniforme para trabajar con modelos de chat de diferentes proveedores y añade funcionalidades útiles para monitorear, depurar y optimizar el rendimiento de las aplicaciones que utilizan LLMs.

Características

Integraciones con múltiples proveedores: Anthropic, OpenAI, Ollama, Microsoft Azure, Google Vertex, Amazon Bedrock, Hugging Face, Cohere, y más.
Formatos de mensajes: Permite usar el formato propio de LangChain o el formato de OpenAI.
API estándar para llamadas a herramientas: Interfaz que enlaza herramientas con los modelos, procesa las solicitudes hechas por el modelo y devuelve resultados.

Características

Salida estructurada: Soporte para estructurar salidas.
Soporte para programación asíncrona: Incluye manejo eficiente por lotes, una API de transmisión avanzada y más.
Monitoreo y depuración con LangSmith: Ideal para aplicaciones en producción basadas en LLMs.
Funcionalidades adicionales como uso estandarizado de tokens, limitación de tasas, almacenamiento en caché, entre otros.

Componentes

langchain-core: Abstracciones base y el Lenguaje de Expresión LangChain.
Paquetes de integración (e.g., langchain-openai, langchain-anthropic).
langchain: Cadenas, agentes y estrategias de recuperación que forman la arquitectura cognitiva de la aplicación.
langchain-community: Integraciones de terceros mantenidas por la comunidad.

Componentes

LangGraph: permite crear aplicaciones robustas y con estado para múltiples actores utilizando LLMs, modelando pasos como nodos y bordes en un gráfico. Se integra con LangChain, pero también puede usarse por separado.
LangGraphPlatform: permite desplegar aplicaciones LLM construidas con LangGraph en producción.
LangSmith: Plataforma para desarrolladores que permite depurar, probar, evaluar y monitorear aplicaciones LLM.

Ejemplo: LLM con Chat Models y Prompt Templates.

Esta aplicación traducirá texto del inglés a otro idioma. Se trata de una aplicación LLM relativamente simple: solo se trata de una única llamada LLM más algunas indicaciones.

Chat Model

Utilizan una convención de nombres que antepone "Chat" a los nombres de sus clases (por ejemplo, ChatOllama, ChatAnthropic, ChatOpenAI, etc.).
Los modelos de chat en LangChain heredan de la interfaz BaseChatModel, que define cómo deben comportarse. Esto asegura que todos los modelos compartan un conjunto básico de funcionalidades.
Son compatibles con una interfaz estándar de transmisión (streaming), programación asíncrona, procesamiento por lotes optimizado (batching) y más.

Parámetros Estándar

Son configuraciones predefinidas que controlan su comportamiento:

Modelo: nombre o identificador del modelo de IA específico que desea utilizar (por ejemplo, "gpt-4-turbo" o "gpt-4o").
Temperatura: Controla la creatividad o aleatoriedad de las respuestas. Un valor bajo genera respuestas más consistentes, mientras que un valor alto permite respuestas más variadas.
Tokens máximos: Define el límite de palabras o caracteres en la respuesta.

Métodos Principales

invoke: método principal para interactuar con el modelo. Se puede enviar un historial de mensajes y recibir la respuesta del modelo. Es útil para interacciones simples.
stream: Permite obtener las respuestas en tiempo real, ideal para aplicaciones donde se necesita feedback inmediato, como chats interactivos.
batch: Mejora la eficiencia al procesar varias solicitudes a la vez, reduciendo costos y tiempos de espera.

Métodos Principales

bind_tools: Es esencial cuando quieres que el modelo de chat use herramientas externas (por ejemplo, APIs o bases de datos) dentro de sus respuestas.
with_structured_output: Se usa cuando el modelo puede devolver resultados en un formato estructurado, como JSON, útil para integrar datos en aplicaciones complejas.

Entradas y salidas

Cada mensaje tiene un rol, que define quién "habla" en el contexto del chat:
- system: Proporciona instrucciones generales al modelo (por ejemplo, "Eres un asistente que responde con formalidad").
- human: Representa lo que el usuario solicita.
- assistant: Respuestas generadas por el modelo.
Los mensajes pueden incluir contenido adicional como imágenes o videos, permitiendo interacciones multimodales.

Prompt Templates

Ayudan a transformar la entrada del usuario y ciertos parámetros en instrucciones para el modelo.
Reciben como entrada un diccionario, donde cada clave representa una variable que se rellenará en la plantilla.
El resultado es un PromptValue, que se puede pasar directamente a un modelo de chat. Este PromptValue también puede convertirse a una cadena de texto (string) o a una lista de mensajes.

Prompt Templates

String PromptTemplates: Estas plantillas se usan para formatear una sola cadena de texto y suelen aplicarse en entradas más simples.
ChatPromptTemplates: Estas plantillas formatean una lista de mensajes. Consisten en una lista de plantillas individuales.
MessagesPlaceholder: Esta plantilla se usa para insertar una lista de mensajes en un lugar específico dentro de un prompt.

Ejemplo: Clasificar Texto en Etiquetas

Asignaremos etiquetas a un texto según diferentes categorías o características que puedan ser relevantes para su análisis o clasificación.
- Sentimiento
- Idioma
- Estilo
- Temas tratados
- Tendencias políticas

Outputs Estructurados

Garantizan que los LLMs generen respuestas en un formato estructurado, como JSON, que sigue un esquema definido. Esto facilita la integración de las salidas del modelo en aplicaciones que necesitan formatos específicos.
Proporciona consistencia y confiabilidad en las respuestas del modelo, especialmente útil para aplicaciones complejas que dependen de datos estructurados.

Implementación

Uso de Modelos Pydantic: Los esquemas se pueden definir usando Pydantic para validar las respuestas.
Parsers de Salida: LangChain incluye parsers específicos para analizar las salidas del modelo y transformarlas según el esquema definido.
Integración con APIs: Uso de métodos como with_structured_output para interactuar directamente con modelos que soporten este tipo de funcionalidad.

Ejemplo: Extracción

En este tutorial, extraeremos información estructurada de texto no estructurado.

Ejemplo: Motor de búsqueda semántica

En este tutorial, construiremos un motor de búsqueda para un documento PDF. Esto nos permitirá recuperar fragmentos del PDF que sean similares a una consulta de entrada.

¿Qué es un motor de búsqueda semántica?

Es un sistema que busca y recupera información basada en el significado o contexto de una consulta, en lugar de simplemente buscar palabras exactas. Por ejemplo, si buscas "formas de aumentar ingresos", el sistema puede identificar fragmentos relacionados con "estrategias de crecimiento empresarial" aunque esas palabras exactas no aparezcan en el texto.

Conceptos

Document loader: Se usa para cargar documentos (como PDF, texto, bases de datos, etc.) en un formato que pueda ser procesado por el modelo.
Embeddings: Son representaciones vectoriales del texto, donde el contenido se convierte en un vector numérico que captura su significado. Esto permite comparar textos según su similitud semántica.
Vector store (almacenamiento vectorial): Es una base de datos especializada en guardar estos vectores, lo que permite realizar búsquedas rápidas y eficientes basadas en similitudes entre los embeddings.

RAG (Retrieval-Augmented Generation)

Es un enfoque donde el modelo de lenguaje utiliza información recuperada de fuentes externas (como bases de datos o documentos) para generar respuestas más relevantes y precisas. Por ejemplo, un modelo puede combinar su conocimiento general con datos específicos de un documento para responder preguntas sobre ese documento.

Muchas gracias

Langchain

By Miguel Amaya Camacho

Langchain

Miguel Amaya Camacho

Ingeniero Informático. Socio fundador de Tallanix S.A.C y de Xprende Tech. Activista del Software Libre y miembro fundador de la Comunidad Piurana de Software Libre VICUX y de la Comunidad de Programadores Python Piura.

Introducción a Langchain

¿Qué son los LLMs?

¿Qué son los LLMs?

¿Qué es Langchain?

Características

Características

Componentes

Componentes

Componentes

Ejemplo: LLM con Chat Models y Prompt Templates.

Chat Model

Parámetros Estándar

Métodos Principales

Métodos Principales

Entradas y salidas

Prompt Templates

Prompt Templates

Ejemplo: Clasificar Texto en Etiquetas

Outputs Estructurados

Implementación

Ejemplo: Extracción

Ejemplo: Motor de búsqueda semántica

¿Qué es un motor de búsqueda semántica?

Conceptos

RAG (Retrieval-Augmented Generation)

Muchas gracias

Langchain

More from Miguel Amaya Camacho