
Última actualización: 1/15/2025
Comprendiendo los Hiperparámetros: Clave para Optimizar el uso de ChatGPT
Por: Miguel Oviedo
Fecha: Abril 16, 2023
¿Qué son los hiperparámetros?
Los hiperparámetros son configuraciones o variables que influyen en la forma en la que ChatGPT se comporta. Estas variables controlan cómo aprende el modelo y pueden tener un impacto significativo en el rendimiento del modelo.
¿Por qué son importantes los hiperparámetros?
Los hiperparámetros afectan el comportamiento y el rendimiento del modelo durante el proceso de entrenamiento y/o obtención de resultados. Son ajustes que puedes modificar para optimizar el desempeño del modelo y adaptarlo a tus necesidades específicas.
Hiperparámetros que se utilizan en el API para interactuar con los modelos de ChatGPT
MODE: Especifica el modo de funcionamiento del modelo al interactuar con el API de OpenAI. Puede tener los siguientes valores:
- Complete: Para obtener predicciones de “completación” de texto a partir de un prompt dado. El modelo generará una o más opciones de completación.
- Chat: Para llevar a cabo conversaciones con el modelo. Se proporciona una lista de mensajes que describen una conversación, y el modelo genera una respuesta adecuada.
- Edit: Para realizar tareas de edición en prompts, ajustando el texto según las instrucciones proporcionadas.
- Insert: Permite insertar texto dentro de otro texto, útil para escribir textos de larga duración, transiciones entre párrafos o guiar al modelo hacia un final.
MODEL: Selecciona una versión específica del modelo de lenguaje de ChatGPT, como "text-davinci-003" o "text-curie-001". Cada modelo tiene diferentes capacidades y costos asociados, por lo que es importante elegir el modelo adecuado para tu caso de uso.
Temperature: Controla la aleatoriedad de las respuestas generadas por el modelo.
- Un valor más alto (por ejemplo, 0.8) produce respuestas más creativas y variadas.
- Un valor más bajo (por ejemplo, 0.2) produce respuestas más determinísticas y coherentes.
Stop sequences: Lista de secuencias de texto que indican al modelo que detenga la generación cuando las encuentre. Esto ayuda a controlar dónde termina la respuesta.
Top_p: También conocido como "nucleus sampling", controla la diversidad de las respuestas.
- Valor entre 0 y 1. Un valor más alto (por ejemplo, 0.8) permite considerar más opciones, generando respuestas más creativas.
- Se recomienda usar este parámetro o Temperature, pero no ambos.
Frequency_penalty: Penaliza la repetición de palabras en la salida.
- Un valor más alto (por ejemplo, 2.0) hará que el modelo evite repetir palabras con frecuencia.
Best_of: Especifica el número de respuestas alternativas que el modelo debe generar.
- Genera varias respuestas y devuelve la mejor según su criterio.
- Ten cuidado al usarlo, ya que puede consumir tokens más rápidamente.
Inject_start_text: Proporciona un texto inicial adicional que se agrega al comienzo de la conversación. Útil para establecer un contexto o introducción específica.
Inject_restart_text: Proporciona un texto adicional al reiniciar una conversación después de una interrupción, permitiendo retomar la interacción con el modelo desde un punto anterior.
Show_probabilities: Cuando está en "true", muestra las probabilidades de las palabras generadas por el modelo. Esto es útil para evaluar la confianza del modelo en sus respuestas.
Comprender y ajustar estos hiperparámetros te permitirá optimizar el uso de ChatGPT para diferentes aplicaciones, desde tareas creativas hasta análisis detallados, maximizando su potencial para cumplir con tus objetivos específicos.