Comprendiendo los Hiperparámetros: Clave para Optimizar el uso de ChatGPT

Por: Miguel Oviedo
Fecha: Abril 16, 2023

¿Qué son los hiperparámetros?

Los hiperparámetros son configuraciones o variables que influyen en la forma en la que ChatGPT se comporta. Estas variables controlan cómo aprende el modelo y pueden tener un impacto significativo en el rendimiento del modelo.

ChatGPT en español

¿Por qué son importantes los hiperparámetros?

Los hiperparámetros afectan el comportamiento y el rendimiento del modelo durante el proceso de entrenamiento y/o obtención de resultados. Son ajustes que puedes modificar para optimizar el desempeño del modelo y adaptarlo a tus necesidades específicas.

Hiperparámetros que se utilizan en el API para interactuar con los modelos de ChatGPT

MODE: Especifica el modo de funcionamiento del modelo al interactuar con el API de OpenAI. Puede tener los siguientes valores:

Complete: Para obtener predicciones de “completación” de texto a partir de un prompt dado. El modelo generará una o más opciones de completación.
Chat: Para llevar a cabo conversaciones con el modelo. Se proporciona una lista de mensajes que describen una conversación, y el modelo genera una respuesta adecuada.
Edit: Para realizar tareas de edición en prompts, ajustando el texto según las instrucciones proporcionadas.
Insert: Permite insertar texto dentro de otro texto, útil para escribir textos de larga duración, transiciones entre párrafos o guiar al modelo hacia un final.

ChatGPT en español

MODEL: Selecciona una versión específica del modelo de lenguaje de ChatGPT, como "text-davinci-003" o "text-curie-001". Cada modelo tiene diferentes capacidades y costos asociados, por lo que es importante elegir el modelo adecuado para tu caso de uso.

Temperature: Controla la aleatoriedad de las respuestas generadas por el modelo.

Un valor más alto (por ejemplo, 0.8) produce respuestas más creativas y variadas.
Un valor más bajo (por ejemplo, 0.2) produce respuestas más determinísticas y coherentes.

Stop sequences: Lista de secuencias de texto que indican al modelo que detenga la generación cuando las encuentre. Esto ayuda a controlar dónde termina la respuesta.

Top_p: También conocido como "nucleus sampling", controla la diversidad de las respuestas.

Valor entre 0 y 1. Un valor más alto (por ejemplo, 0.8) permite considerar más opciones, generando respuestas más creativas.
Se recomienda usar este parámetro o Temperature, pero no ambos.

Frequency_penalty: Penaliza la repetición de palabras en la salida.

Un valor más alto (por ejemplo, 2.0) hará que el modelo evite repetir palabras con frecuencia.

Hiper parámetros ChatGPT

Best_of: Especifica el número de respuestas alternativas que el modelo debe generar.

Genera varias respuestas y devuelve la mejor según su criterio.
Ten cuidado al usarlo, ya que puede consumir tokens más rápidamente.

Inject_start_text: Proporciona un texto inicial adicional que se agrega al comienzo de la conversación. Útil para establecer un contexto o introducción específica.

Inject_restart_text: Proporciona un texto adicional al reiniciar una conversación después de una interrupción, permitiendo retomar la interacción con el modelo desde un punto anterior.

Show_probabilities: Cuando está en "true", muestra las probabilidades de las palabras generadas por el modelo. Esto es útil para evaluar la confianza del modelo en sus respuestas.

Comprender y ajustar estos hiperparámetros te permitirá optimizar el uso de ChatGPT para diferentes aplicaciones, desde tareas creativas hasta análisis detallados, maximizando su potencial para cumplir con tus objetivos específicos.