Trang này mô tả các tuỳ chọn cấu hình sau:
Sử dụng cấu hình mô hình để kiểm soát phản hồi, chẳng hạn như nhiệt độ
Bạn cũng có thể tạo đầu ra có cấu trúc, bao gồm JSON và enum.
Trước khi bắt đầu
Đảm bảo rằng bạn đã hoàn tất hướng dẫn bắt đầu xây dựng trải nghiệm kết hợp.
Đặt chế độ suy luận
Các ví dụ trong hướng dẫn bắt đầu sử dụng chế độ PREFER_ON_DEVICE, nhưng
đây chỉ là một trong 4 chế độ
suy luận hiện có.
PREFER_ON_DEVICE: Sử dụng mô hình trên thiết bị nếu có; nếu không, hãy dự phòng cho mô hình được lưu trữ trên đám mây.const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_ON_DEVICE });ONLY_ON_DEVICE: Sử dụng mô hình trên thiết bị nếu có; nếu không, hãy gây ra ngoại lệ.const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_ON_DEVICE });PREFER_IN_CLOUD: Sử dụng mô hình được lưu trữ trên đám mây nếu có; nếu không, hãy dự phòng cho mô hình trên thiết bị.const model = getGenerativeModel(ai, { mode: InferenceMode.PREFER_IN_CLOUD });ONLY_IN_CLOUD: Sử dụng mô hình được lưu trữ trên đám mây nếu có; nếu không, hãy gây ra ngoại lệ.const model = getGenerativeModel(ai, { mode: InferenceMode.ONLY_IN_CLOUD });
Xác định xem suy luận trên thiết bị hay trong đám mây đã được sử dụng
Nếu bạn sử dụng chế độ suy luận PREFER_ON_DEVICE hoặc PREFER_IN_CLOUD, thì bạn nên biết chế độ nào đã được sử dụng cho các yêu cầu nhất định. Thông tin này được cung cấp bởi thuộc tính inferenceSource của mỗi phản hồi (có từ SDK JS v12.5.0).
Khi bạn truy cập vào thuộc tính này, giá trị trả về sẽ là ON_DEVICE hoặc IN_CLOUD.
// ...
console.log('You used: ' + result.response.inferenceSource);
console.log(result.response.text());
Ghi đè mô hình dự phòng mặc định
Mô hình mặc định được lưu trữ trên đám mây là
gemini-2.5-flash-lite
Mô hình này là mô hình dự phòng được lưu trữ trên đám mây khi bạn sử dụng chế độ PREFER_ON_DEVICE. Đây cũng là mô hình mặc định khi bạn sử dụng chế độ ONLY_IN_CLOUD hoặc chế độ PREFER_IN_CLOUD.
Bạn có thể sử dụng tuỳ chọn cấu hình
inCloudParams
để chỉ định một mô hình dự phòng mặc định được lưu trữ trên đám mây.
const model = getGenerativeModel(ai, {
mode: InferenceMode.INFERENCE_MODE,
inCloudParams: {
model: "GEMINI_MODEL_NAME"
}
});
Tìm tên mô hình cho tất cả các mô hình Gemini được hỗ trợ.
Sử dụng cấu hình mô hình để kiểm soát phản hồi
Trong mỗi yêu cầu gửi đến một mô hình, bạn có thể gửi kèm theo cấu hình mô hình để kiểm soát cách mô hình tạo phản hồi. Mô hình được lưu trữ trên đám mây và mô hình trên thiết bị cung cấp các tuỳ chọn cấu hình khác nhau.
Cấu hình được duy trì trong suốt thời gian tồn tại của thực thể. Nếu bạn muốn sử dụng một cấu hình khác, hãy tạo một thực thể GenerativeModel mới bằng cấu hình đó.
Định cấu hình mô hình được lưu trữ trên đám mây
Sử dụng tuỳ chọn
inCloudParams
để định cấu hình mô hình Gemini được lưu trữ trên đám mây. Tìm hiểu về
các tham số hiện có.
const model = getGenerativeModel(ai, {
mode: InferenceMode.INFERENCE_MODE,
inCloudParams: {
model: "GEMINI_MODEL_NAME"
temperature: 0.8,
topK: 10
}
});
Định cấu hình mô hình trên thiết bị
Xin lưu ý rằng suy luận bằng mô hình trên thiết bị sử dụng API lời nhắc từ Chrome.
Sử dụng tuỳ chọn
onDeviceParams
để định cấu hình mô hình trên thiết bị. Tìm hiểu về
các tham số hiện có.
const model = getGenerativeModel(ai, {
mode: InferenceMode.INFERENCE_MODE,
onDeviceParams: {
createOptions: {
temperature: 0.8,
topK: 8
}
}
});