Veracidad
Los LLMs tienen una tendencia a generar respuestas que suenan coherentes y convincentes, pero a veces pueden ser inventadas. Mejorar las instrucciones puede ayudar a mejorar el modelo para generar respuestas más precisas/factuales y reducir la probabilidad de generar respuestas inconsistentes e inventadas.
Algunas soluciones pueden incluir:
- proporcionar verdades fundamentales (por ejemplo, un párrafo de un artículo relacionado o una entrada de Wikipedia) como parte del contexto para reducir la probabilidad de que el modelo produzca texto inventado.
- configurar el modelo para producir respuestas menos diversas disminuyendo los parámetros de probabilidad e instruyéndolo a admitir (por ejemplo, "No lo sé") cuando no sepa la respuesta.
- proporcionar en las instrucciones una combinación de ejemplos de preguntas y respuestas que pueda conocer o no.
Veamos un ejemplo sencillo:
Prompt:
P: ¿Qué es un átomo?
R: Un átomo es una partícula diminuta que lo conforma todo.
P: ¿Quién es Alvan Muntz?
R: ?
P: ¿Qué es Kozar-09?
R: ?
P: ¿Cuántas lunas tiene Marte?
R: Dos, Fobos y Deimos.
P: ¿Quién es Neto Beto Roberto?
Salida:
R: ?
Inventé el nombre "Neto Beto Roberto", por lo que el modelo es correcto en este caso. Intenta cambiar la pregunta un poco y ve si puedes hacer que funcione. Hay diferentes formas de mejorar esto aún más basándose en todo lo que has aprendido hasta ahora.