Các tệp đầu vào được hỗ trợ và các yêu cầu đối với Vertex AI Gemini API

Khi gọi Vertex AI Gemini API từ ứng dụng của bạn bằng Vertex AI cho Firebase SDK, bạn có thể đặt câu lệnh để mô hình Gemini tạo văn bản dựa trên dữ liệu đầu vào đa phương thức. Câu lệnh đa phương thức có thể bao gồm nhiều phương thức (hoặc loại đầu vào), như văn bản cùng với hình ảnh, PDF, video và âm thanh.

Đối với các phần không phải văn bản của nội dung đầu vào (như tệp đa phương tiện), bạn cần sử dụng được hỗ trợ, hãy chỉ định loại MIME được hỗ trợ và đảm bảo rằng tệp và yêu cầu đa phương thức đáp ứng các yêu cầu và tuân theo các phương pháp hay nhất.

  • Các tệp dữ liệu đầu vào được hỗ trợ sẽ khác nhau tuỳ theo mô hình và có thể bao gồm hình ảnh, PDF, video và âm thanh.

    • Xin lưu ý rằng đầu vào video được hỗ trợ cũng thay đổi tuỳ theo mẫu máy và có thể bao gồm chỉ có khung hình hoặc khung có âm thanh.
  • Yêu cầu và phương pháp hay nhất đối với tệp đầu vào và yêu cầu đa phương thức:

    • Ngang bằng Tìm hiểu về các mô hình Gemini, bạn có thể xem thông tin tóm tắt nhanh về các yêu cầu đối với tệp được hỗ trợ mô hình (ví dụ: số lượng tệp tối đa và kích thước tệp tối đa).

    • Trong tài liệu về Google Cloud, bạn có thể tìm hiểu thông tin chi tiết về yêu cầucác phương pháp hay nhất đối với các tệp đầu vào và yêu cầu đa phương thức (ví dụ: loại MIME được hỗ trợ và thời điểm cung cấp tệp đầu vào trong yêu cầu).

Các yêu cầu dành riêng cho SDK Vertex AI cho Firebase

Đối với các SDK Vertex AI cho Firebase, kích thước yêu cầu tối đa là 20 MB. Bạn gặp lỗi HTTP 413 nếu yêu cầu quá lớn.