En cada llamada a un modelo, puedes enviar una configuración del modelo para controlar cómo el modelo genera una respuesta. Cada modelo ofrece diferentes opciones de configuración.
Puedes experimentar con instrucciones y parámetros de configuración de modelos, y iterar rápidamente con Vertex AI Studio.
Gemini Ir a las opciones de configuración de Imagen Ir a las opciones de configuración de
Opciones de configuración para modelos Gemini
En esta sección, se muestra cómo configurar una configuración para usar con modelos Gemini y se proporciona una descripción de cada parámetro.
Configura un modelo para modelos Gemini
Puedes encontrar una descripción de cada parámetro en la siguiente sección de esta página.
Descripción de cada parámetro para usar con modelos Gemini
A continuación, se incluye una descripción general de alto nivel de los parámetros disponibles, según corresponda. Puedes encontrar una lista completa de los parámetros y sus valores en la documentación de Google Cloud.
Parámetro | Descripción | Valor predeterminado |
---|---|---|
Marca de tiempo de audio
audioTimestamp
|
Es un valor booleano que habilita la comprensión de marcas de tiempo para archivos de entrada de solo audio. Solo se aplica cuando se usan llamadas |
false |
Penalización por frecuencia
frequencyPenalty
|
Controla la probabilidad de incluir tokens que aparecen repetidamente en la respuesta generada. Los valores positivos penalizan los tokens que aparecen repetidamente en el contenido generado, lo que disminuye la probabilidad de repetir contenido. |
--- |
Cantidad máxima de tokens de salida
maxOutputTokens
|
Cantidad máxima de tokens que se pueden generar en la respuesta. | --- |
Penalización por presencia
presencePenalty
|
Controla la probabilidad de incluir tokens que ya aparecen en la respuesta generada. Los valores positivos penalizan los tokens que ya aparecen en el contenido generado, lo que aumenta la probabilidad de generar contenido más diverso. |
--- |
Secuencias de detención
stopSequences
|
Especifica una lista de cadenas que le indica al modelo que deje de generar contenido si se encuentra una de las cadenas en la respuesta. | --- |
Temperatura
temperature
|
Controla el grado de aleatorización en la respuesta. Las temperaturas más bajas generan respuestas más deterministas, y las temperaturas más altas generan respuestas más diversas o creativas. |
Depende del modelo |
Top-K
topK
|
Limita la cantidad de palabras con mayor probabilidad que se usan en el contenido generado. Un valor Top-K de 1 significa que el siguiente token seleccionado debe ser
el más probable entre todos los tokens del vocabulario del modelo, mientras que un valor Top-K de n significa que el siguiente token debe ser seleccionado entre los n tokens más probables (todo según la temperatura establecida).
|
Depende del modelo |
Top-P
topP
|
Controla la diversidad del contenido generado. Los tokens se eligen del más probable (consulta Top-K más arriba) al menos probable, hasta que la suma de sus probabilidades sea igual al valor de Top-P. |
Depende del modelo |
Opciones de configuración para modelos Imagen
En esta sección, se muestra cómo configurar una configuración para usar con modelos Imagen y se proporciona una descripción de cada parámetro.
Configura un modelo para modelos Imagen
Puedes encontrar una descripción de cada parámetro en la siguiente sección de esta página.
Descripción de cada parámetro para usar con modelos Imagen
A continuación, se incluye una descripción general de alto nivel de los parámetros disponibles, según corresponda. Puedes encontrar una lista completa de los parámetros y sus valores en la documentación de Google Cloud.
Parámetro | Descripción | Valor predeterminado |
---|---|---|
Consigna negativa
negativePrompt
|
Una descripción de lo que deseas omitir en las imágenes generadas
|
--- |
Cantidad de resultados
numberOfImages
|
Es la cantidad de imágenes generadas que se muestran para cada solicitud. | El valor predeterminado es una imagen para los modelos Imagen 3. |
Relación de aspecto
aspectRatio
|
Es la proporción entre el ancho y la altura de las imágenes generadas. | el valor predeterminado es cuadrado (1:1) |
Formato de imagen
imageFormat
|
Las opciones de salida, como el formato de imagen (tipo MIME) y el nivel de compresión de las imágenes generadas | El tipo MIME predeterminado es PNG La compresión predeterminada es 75 (si el tipo MIME se establece en JPEG) |
Marca de agua
addWatermark
|
Si se debe agregar una marca de agua digital no visible (denominada SynthID) a las imágenes generadas | El valor predeterminado es true para los modelos Imagen 3.
|
Generación de personas
personGeneration
|
Si se permite que el modelo genere personas | El valor predeterminado depende del modelo. |
Otras opciones para controlar la generación de contenido
- Obtén más información sobre el diseño de instrucciones para influir en el modelo y generar resultados específicos para tus necesidades.
- Usa la configuración de seguridad para ajustar la probabilidad de recibir respuestas que se puedan considerar dañinas, como incitación al odio o a la violencia y contenido sexual explícito.
- Establece instrucciones del sistema para guiar el comportamiento del modelo. Esta función es como un "preámbulo" que agregas antes de que el modelo se exponga a otras instrucciones del usuario final.
- Pasa un esquema de respuesta junto con la instrucción para especificar un esquema de salida específico. Esta función se usa con mayor frecuencia cuando se genera un resultado JSON, pero también se puede usar para tareas de clasificación (como cuando deseas que el modelo use etiquetas específicas).