Optimizar el rendimiento del modelo
Después de implementar el modelo en un punto de conexión, puede empezar a interactuar con él para ver cómo funciona. Vamos a explorar cómo puede usar técnicas de ingeniería rápidas para optimizar el rendimiento del modelo.
Aplicar patrones de solicitud para optimizar la salida del modelo
La calidad de las preguntas que envía al modelo de lenguaje influye directamente en la calidad de las respuestas que recibe. Puede construir cuidadosamente su pregunta, o preguntar, para recibir respuestas mejores y más interesantes. El proceso de diseño y optimización de avisos para mejorar el rendimiento del modelo también se conoce como ingeniería rápida.
La ingeniería rápida requiere que los usuarios hagan preguntas relevantes, específicas, inequívocas y bien estructuradas, lo que indica al modelo que genere respuestas más precisas. Para comprender cómo crear avisos bien definidos, vamos a explorar algunos patrones que le ayudarán a mejorar la salida de un modelo:
- Indique al modelo que actúe como una persona.
- Guíe el modelo para sugerir mejores preguntas.
- Proporcione una plantilla para generar la salida en un formato específico.
- Entienda cómo razona un modelo pidiéndole que reflexione.
- Agregue contexto para mejorar la precisión de la salida del modelo.
Nota:
Los patrones enumerados aquí se basan en el trabajo de White et al., (2023) que construyó un catálogo de patrones de avisos.
Como desarrollador, un enfoque eficaz consiste en agregar instrucciones al modelo implementado en forma de mensaje del sistema. La solicitud del sistema establece el comportamiento del modelo y le permite guiar el modelo sin exponer al usuario final a las instrucciones. Los mejores resultados se obtienen a menudo mediante la asignación de una solicitud explícita del sistema y de orientaciones (o plantillas) que ayuden a los usuarios a enviar indicaciones que reflejen las pautas aquí descritas.
Instruir al modelo para que actúe como una persona
Cuando desee que el modelo tome una perspectiva específica al responder a una pregunta, puede pedirle que actúe como una persona.
Por ejemplo, puede pedir al modelo que responda como si fuera un profesional de marketing experimentado si trabaja en ventas y necesita información sobre un nuevo software CRM.
| No se ha especificado ninguna persona | Con la persona especificada | |
|---|---|---|
| Solicitud del sistema | None | Eres un profesional de marketing experimentado que escribe la copia de publicidad para un público de clientes técnicos. |
| Solicitud del usuario | Escriba una descripción de una frase de un producto CRM. | Escriba una descripción de una frase de un producto CRM. |
| Respuesta del modelo | Un producto CRM es una herramienta de software diseñada para administrar las interacciones de una empresa con clientes actuales y potenciales, que abarcan ventas, marketing, servicio al cliente y soporte técnico. | Experimente una administración sin problemas de relaciones con el cliente con nuestro producto CRM, diseñado para simplificar sus operaciones empresariales, mejorar las interacciones de los clientes e impulsar el crecimiento de las ventas con su interfaz intuitiva y herramientas de análisis sólidas. |
Puede crear diferentes personas para diferentes funciones empresariales. Piense en roles como un administrador de productos, analista de datos, experto en servicios al cliente o profesor. Defina la persona y agregue más detalles sobre lo que espera que esa persona sepa o haga para obtener respuestas personalizadas y basadas en el contexto.
Solicitar mejores sugerencias de preguntas
Cuando desee que el modelo ayude a refinar la pregunta, puede pedirle que sugiera mejores formas de formular frases en la consulta. También puede pedirle que proporcione contexto adicional.
Por ejemplo, si busca consejos sobre cómo cocinar una comida, puede pedir al modelo que le indique que indique preguntas aclaradas para ayudarle a obtener una respuesta más específica.
| No se proporcionan sugerencias | Con sugerencias dadas | |
|---|---|---|
| Solicitud del sistema | Eres un chef de Inteligencia Artificial que puede aconsejar sobre los menús. | Eres un chef de Inteligencia Artificial que puede aconsejar sobre los menús. Usted es accesible y siempre quiere proporcionar el mejor consejo que puede. |
| Solicitud del usuario | Tengo que organizar una fiesta para cuatro personas. ¿Qué debo cocinar? | Tengo que organizar una fiesta para cuatro personas. ¿Qué debo cocinar? ¿Qué otra información necesita para ayudarme a planear una excelente comida para mis invitados? |
| Respuesta del modelo | Hospedar una cena para cuatro es una oportunidad maravillosa para mostrar sus habilidades culinarias. Este es un menú sugerido de tres platos que equilibra los sabores y proporciona una experiencia gastronómica agradable: Aperitivo Brochetas de Ensalada Caprese - Ingredientes: Tomates cherry, bolas de mozzarella frescas, hojas de albahaca frescas, glaseado balsámico, aceite de oliva, sal y pimienta. - Instrucciones: Ensarta un tomate cherry, una hoja de albahaca y una bola de mozzarella en brochetas pequeñas. Rociar con aceite de oliva y glaseado balsámico, luego sazonar con sal y pimienta. Este plato es ligero, refrescante y fácil de preparar con antelación. Curso principal Salmón con costra de hierbas y espárragos al limón - Ingredientes: filetes de salmón, hierbas frescas (como perejil, eneldo y tomillo), pan rallado, limón, espárragos, aceite de oliva, sal y pimienta. - Instrucciones: Precalentar el horno a 400°F (200°C). Mezcla pan rallado con hierbas frescas picadas y un poco de aceite de oliva para formar una pasta. Presione esta mezcla sobre los filetes de salmón y sazone con sal y pimienta. Coloque salmón en una hoja de hornear y hornear durante unos 15-20 minutos, o hasta que se cocine. En los últimos 10 minutos de cocción, mezcle los espárragos con aceite de oliva, ralladura de limón, sal y pimienta, y áselos junto con el salmón. Sirve con una pizca de jugo de limón fresco sobre el salmón y los espárragos. Postre Mousse de chocolate con bayas frescas - Ingredientes: Chocolate oscuro, huevos, azúcar, crema pesada, extracto de vainilla y bayas mixtas (como fresas, arándanos y frambuesas). - Instrucciones: Derrite el chocolate sobre una caldera doble y deja que se enfríe ligeramente. Separa las yemas de huevo y las blancas. Bata las claras de huevo a picos suaves y luego agregue el azúcar gradualmente para hacer un merengue. Montar la nata espesa hasta que se formen picos suaves y mezclar con el extracto de vainilla. Incorpora el chocolate derretido en las yemas de huevo, luego incorpora suavemente la crema batida y el merengue hasta que estén combinados. Coloca el mousse en platos de servir y refrigera por al menos 2 horas. Sírvalo con bayas frescas para darle un toque de color y frescura. Sugerencias adicionales - Maridajes: Considere la posibilidad de servir un vino blanco ligero con el aperitivo y el curso principal, y quizás un vino de postre con el mousse de chocolate. - Tiempo: prepare el aperitivo y el postre con antelación para minimizar el estrés de última hora. El plato principal tardará más tiempo en el horno, así que planifique adecuadamente. Este menú está diseñado para ser elegante y accesible, asegurándose de que sus huéspedes disfruten tanto de la comida como de la experiencia. ¡Disfruta de tu fiesta de cena! |
Hospedar una cena es una oportunidad maravillosa para mostrar sus habilidades culinarias y crear experiencias memorables para sus invitados. Para ayudarle a planear una gran comida, estas son algunas preguntas que pueden guiarle en la elección del menú perfecto:
Con esta información, puedo sugerir un menú personalizado. Esta es una idea general que se puede adaptar en función de sus respuestas: Starter
Curso principal
Platos secundarios
Postre
Bebidas
No dude en compartir más detalles, y puedo ayudar a refinar aún más el menú! |
Al animar al modelo a sugerir aclaraciones o detalles adicionales, puede ayudarle a formular las preguntas adecuadas y a lograr respuestas mejores y más precisas en menos interacciones.
Especificar el formato deseado para las respuestas
** Cuando quiera que el modelo genere el resultado en un formato específico, puede proporcionar una plantilla o una estructura en la instrucción.
Por ejemplo, si es un periodista deportivo que redacta un artículo histórico, puede solicitar que el modelo siga una plantilla específica, que incluye encabezados, puntos de viñetas y desgloses de datos.
| Ninguna plantilla especificada | Con la plantilla especificada | |
|---|---|---|
| Solicitud del sistema | Eres un asistente de inteligencia artificial útil. | Eres un asistente de inteligencia artificial útil para los periodistas deportivos. |
| Solicitud del usuario | ¿Qué pasó en la final de la Copa Mundial de Fútbol de 2018? | ¿Qué pasó en la final de la Copa Mundial de Fútbol de 2018? Formatee el resultado para mostrar la fecha del partido, el lugar y los dos equipos que compiten. A continuación, la puntuación final y, finalmente, los eventos importantes que ocurrieron durante el partido. |
| Respuesta del modelo | La final de la Copa Mundial de la FIFA de 2018 tuvo lugar el 15 de julio de 2018 en el Estadio Luzhniki en Moscú, Rusia. Francia se enfrentó a Croacia en el partido. Francia salió victorioso con una victoria de 4-2. Los goles para Francia fueron anotados por Mario Mandzukic (propio gol), Antoine Griezmann (penal), Paul Pogba y Kylian Mbappé. Los goles de Croacia fueron anotados por Ivan Perišić y Mandzukic. Kylian Mbappé, a solo 19 años, se convirtió en el segundo jugador más joven para puntuar en una final de la Copa Mundial, después de Pelé. Esta victoria marcó el segundo título de la Copa Mundial de Francia, siendo el primero en 1998. |
Fecha del partido: 15 de julio de 2018 Ubicación: Estadio Luzhniki, Moscú, Rusia Equipos que compiten: Francia frente a Croacia Puntuación final: Francia 4, Croacia 2 Eventos importantes:
|
Puede aplicar este enfoque a otros escenarios en los que se necesita un formato específico, como generar correos electrónicos, resúmenes, propuestas o incluso código y scripts. Defina claramente la plantilla de formato y proporcione detalles sobre cómo desea que la salida estructurada obtenga respuestas coherentes y organizadas.
También puede usar un enfoque de una sola toma o de pocas tomas proporcionando uno o varios ejemplos para ayudar al modelo a identificar un patrón deseado.
Pedir una explicación del razonamiento
Cuando desee que el modelo explique el razonamiento subyacente a sus respuestas, puede pedir al modelo que refleje automáticamente su justificación y suposiciones después de proporcionar una respuesta.
Por ejemplo, si está trabajando en un problema matemático, puede pedir al modelo que explique el razonamiento detrás de cálculos específicos.
| Sin reflexión especificada | Con la reflexión especificada | |
|---|---|---|
| Solicitud del sistema | Usted es un asistente matemático de IA. | Usted es un asistente matemático de IA. Siempre explicas tus respuestas. |
| Solicitud del usuario | Un triángulo con ángulo derecho tiene un lado hipotenusa de longitud 3 cm y una longitud lateral adyacente de 2 cm. ¿Cuál es la longitud del lado restante? | Un triángulo con ángulo derecho tiene un lado hipotenusa de longitud 3 cm y una longitud lateral adyacente de 2 cm. ¿Cuál es la longitud del lado restante? |
| Respuesta del modelo | Aproximadamente 2,24 cm. | Podemos usar el teorema pythagoriano para resolver este problema. El teorema pythagoriano indica que en un triángulo con ángulo derecho, el cuadrado de la longitud de la hipotenusa (el lado opuesto al ángulo derecho) es igual a la suma de los cuadrados de las longitudes de los otros dos lados. Matemáticamente, esto se puede escribir como: c² = a² + b² donde c es la longitud de la hipotenusa, y a y b son las longitudes de los otros dos lados. En este problema, se nos da la longitud de la hipotenusa (c = 3 cm) y la longitud de uno de los otros lados (a = 2 cm). Es necesario encontrar la longitud del lado restante (b). Conectando los valores especificados al teorema pythagoriano, obtenemos: 3² = 2² + b² 9 = 4 + b² Ahora, podemos resolver para b²: b² = 9 - 4 b² = 5 Por último, tomamos la raíz cuadrada de ambos lados para encontrar la longitud del lado restante: b = √5 ≈ 2,24 cm Por lo tanto, la longitud del lado restante es de aproximadamente 2,24 cm. |
Puede aplicar este enfoque cuando desee explicaciones en el análisis de datos, la estrategia de marketing o la solución de problemas técnicos. Cuando se le pide al modelo que defina su razonamiento, se usa una técnica denominada cadena de pensamiento para que piense paso a paso.
Agregar contexto
Cuando desee que el modelo se centre en temas específicos, puede especificar el contexto que se debe tener en cuenta. También puede indicar al modelo que ignore la información irrelevante.
Por ejemplo, si va a planear un viaje, puede proporcionar al modelo más contexto para ayudar a mejorar la relevancia de su respuesta.
| Ningún contexto especificado | Con el contexto especificado | |
|---|---|---|
| Solicitud del sistema | Eres un asistente de viajes de IA. | Eres un asistente de viajes de IA. |
| Pregunta del usuario | ¿Cuándo debo visitar Edimburgo? | ¿Cuándo debo visitar Edimburgo? Estoy especialmente interesado en asistir a los partidos en casa de Escocia en el torneo de rugby De las Seis Naciones. |
| Respuesta del modelo | Edimburgo, la capital de Escocia, es un destino maravilloso con una rica historia y una cultura vibrante. El mejor momento para visitar Edimburgo depende en gran medida de sus preferencias para el clima, los eventos y las multitudes turísticas.
En resumen, el mejor momento para visitar Edimburgo depende de sus preferencias. Primavera y otoño ofrecen un clima agradable y menos multitudes, mientras que el verano es ideal para actividades al aire libre y festivales. El invierno puede ser una experiencia más tranquila y mágica, con eventos festivos para disfrutar. |
El torneo de rugby de Las Seis Naciones se ejecuta normalmente desde finales de enero hasta principios de marzo. Edimburgo, como ciudad anfitrión, a menudo tiene partidos en el estadio Murrayfield, que es el estadio nacional de Escocia. Para asegurarte de que no te pierdas los partidos en casa de Escocia en las Seis Naciones, recomiendo planear tu visita durante este período. Sin embargo, tenga en cuenta que las fechas y horas de partido pueden variar, por lo que es una buena idea comprobar el sitio web oficial de Six Nations o el sitio web de la Escocesa Rugby Union para obtener el calendario exacto de partidos. Además, Edimburgo tiene mucho que ofrecer más allá del rugby, con su rica historia, impresionante arquitectura y vibrante escena cultural, por lo que podría considerar ampliar su estancia para explorar la ciudad antes o después del torneo. Además, recuerde que visitar durante el torneo puede significar grandes multitudes y alojamientos más ocupados, así que reserve sus vuelos, hotel y transporte con antelación para garantizar una experiencia sin problemas. Disfrute de su viaje a Edimburgo y el emocionante ambiente de los partidos de rugby de las Seis Naciones! |
Al definir en qué debe enfocarse o debe pasar por alto el modelo, puede asegurarse de que la conversación se mantenga en el buen camino y genere respuestas más relevantes y adaptadas.
Usted puede especificar el contexto describiendo qué debe o no debe incluir, y puede conectar el modelo a las fuentes de datos de las que debería recuperar el contexto antes de generar una respuesta.
Aplicación de estrategias de optimización de modelos
Nota:
Esta sección trata de las opciones y consideraciones para la optimización del modelo que puede tener en cuenta más allá de la ingeniería de solicitudes. Una exploración completa de cómo aplicar estas estrategias de optimización está fuera del ámbito de este módulo.
La ingeniería de solicitudes puede ser una forma eficaz de optimizar las respuestas de los modelos, pero en algunos casos puede que no proporcione suficiente contexto u orientación para satisfacer siempre sus necesidades exactas. Como desarrollador, puede considerar las siguientes estrategias de optimización adicionales para mejorar la relevancia de las respuestas de la aplicación de IA generativa:
- Generación aumentada de recuperación (RAG):técnica que implica el uso de un origen de datos para proporcionar contexto de fundamento a las solicitudes. RAG puede ser un enfoque útil cuando necesita que el modelo responda a preguntas basadas en un dominio de conocimiento específico o cuando necesite que el modelo tenga en cuenta la información relacionada con los eventos que se produjeron después de los datos de entrenamiento en los que se basa el modelo.
- Ajuste preciso: técnica que implica extender el entrenamiento de un modelo de base al proporcionar indicaciones de ejemplo y respuestas que reflejen el estilo y el formato de salida deseados.
Ambos enfoques implican desafíos adicionales de costo, complejidad y mantenimiento, por lo que, como regla general, es mejor iniciar los esfuerzos de optimización a través de la ingeniería rápida y, a continuación, considerar estrategias adicionales si es necesario.
La estrategia que debe elegir como desarrollador depende de sus requisitos:
- Optimizar para contexto: Cuando el modelo carece de conocimiento contextual y desea maximizar la precisión de las respuestas.
- Optimice el modelo: Cuando quiera mejorar el formato de respuesta, el estilo o la voz maximizando la coherencia del comportamiento.
Para optimizar el contexto, puede aplicar un patrón de generación aumentada de recuperación (RAG). Con RAG, usted fundamenta sus datos recuperando primero el contexto de una fuente de datos antes de generar una respuesta. Por ejemplo, quiere que los empleados hagan preguntas sobre los procesos y los límites de las reclamaciones de gastos basándose en la documentación de la política de gastos de su propia corporación.
Cuando desee que el modelo responda en un estilo o formato específico, puede indicar al modelo que lo haga agregando instrucciones en el mensaje del sistema. Cuando observe que el comportamiento del modelo no es coherente, puede aplicar más coherencia en el comportamiento ajustando un modelo. Con el ajuste fino, entrenará un modelo de lenguaje base en un conjunto de datos de indicaciones y respuestas de ejemplo antes de integrarlo en su aplicación, con el resultado de que el modelo ajustado finamente generará respuestas que sean coherentes con los ejemplos del conjunto de datos de entrenamiento de ajuste fino.
Puede usar cualquier combinación de estrategias de optimización, por ejemplo, la ingeniería de solicitudes, RAG y un modelo optimizado para mejorar la aplicación de lenguaje.