Đối với ứng dụng di động và web, SDK Firebase AI Logic cho phép bạn tương tác với các mô hình Gemini và mô hình Imagen được hỗ trợ ngay trong ứng dụng.
Mô hình Gemini được coi là đa phương thức vì có khả năng xử lý và thậm chí tạo nhiều phương thức, bao gồm văn bản, mã, tệp PDF, hình ảnh, video và âm thanh. Bạn có thể nhắc mô hình Imagen bằng văn bản để tạo hình ảnh.
Bảng sau đây là thông tin tổng quan ngắn gọn về các mô hình được hỗ trợ cho Firebase AI Logic và tên mô hình ổn định mới nhất của các mô hình đó. Bảng này cũng liệt kê các mô hình xem trước và thử nghiệm có sẵn cho các trường hợp sử dụng nguyên mẫu.
Mô hình Gemini
Mô hình | Mục nhập | Đầu ra | Mô tả |
---|---|---|---|
Mô hình Gemini có phiên bản ổn định | |||
Gemini 2.0 Flashgemini-2.0-flash-001
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Mô hình đa phương thức của chúng tôi với các tính năng thế hệ mới và khả năng cải tiến, bao gồm tốc độ vượt trội, sử dụng công cụ tích hợp và cửa sổ ngữ cảnh 1 triệu token |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Mô hình Flash nhanh nhất và tiết kiệm chi phí nhất của chúng tôi. Đây là lộ trình nâng cấp dành cho những người dùng Gemini 1.5 Flash muốn có chất lượng tốt hơn với cùng mức giá và tốc độ. |
Các mô hình Gemini chỉ có các phiên bản xem trước và thử nghiệm (chỉ nên dùng cho các trường hợp sử dụng nguyên mẫu) | |||
Gemini 2.5 Progemini-2.5-pro-preview-06-05
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Mô hình suy luận tiên tiến nhất của chúng tôi, có khả năng giải quyết các vấn đề phức tạp. |
Gemini 2.5 Flashgemini-2.5-flash-preview-05-20
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Mô hình tư duy của chúng tôi cung cấp các tính năng toàn diện và mạnh mẽ. Mục đích của phiên bản này là cân bằng giữa giá và hiệu suất. |
Gemini 2.0 Flash Image Generationgemini-2.0-flash-preview-image-generation
|
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | hình ảnh, văn bản và hình ảnh | Mô hình đa phương thức của chúng tôi hỗ trợ đầu vào đa phương thức và đầu ra hình ảnh. |
Gemini 2.0 Flash‑Live 1gemini-2.0-flash-live-preview-04-09
|
văn bản (truyền trực tuyến), âm thanh (truyền trực tuyến) |
văn bản (truyền trực tuyến), âm thanh (truyền trực tuyến) |
Mô hình đa phương thức của chúng tôi hỗ trợ truyền trực tuyến theo thời gian thực với độ trễ thấp của các đầu vào và đầu ra đa phương thức. |
1 Không được hỗ trợ khi sử dụng Gemini Developer API với SDK Firebase AI Logic.
Mô hình Imagen
Mô hình | Mục nhập | Đầu ra | Mô tả |
---|---|---|---|
Mô hình Imagen có phiên bản ổn định | |||
Imagen 3imagen-3.0-generate-002 |
văn bản | hình ảnh | Tạo hình ảnh chân thực, chất lượng cao từ các câu lệnh văn bản bằng ngôn ngữ tự nhiên |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
văn bản | hình ảnh | Tạo hình ảnh để tạo bản minh hoạ hoặc các trường hợp sử dụng có độ trễ thấp |
Các mô hình Imagen chỉ có các phiên bản xem trước và thử nghiệm (chỉ nên dùng cho các trường hợp sử dụng nguyên mẫu) | |||
Imagen 4 2imagen-4.0-generate-preview-06-06
|
văn bản | hình ảnh | Tạo hình ảnh chân thực, chất lượng cao từ các câu lệnh văn bản bằng ngôn ngữ tự nhiên |
Imagen 4 Fast 2imagen-4.0-fast-preview-06-06
|
văn bản | hình ảnh | Tạo hình ảnh để tạo bản minh hoạ hoặc các trường hợp sử dụng có độ trễ thấp |
Imagen 4 Ultra 2imagen-4.0-ultra-preview-06-06
|
văn bản | hình ảnh | Tạo hình ảnh chân thực, chất lượng cao từ các câu lệnh văn bản bằng ngôn ngữ tự nhiên |
2 Gemini Developer API không hỗ trợ mô hình Imagen này, bất kể bạn truy cập vào API theo cách nào.
Ngoài ra, hãy xem Câu hỏi thường gặp của chúng tôi về tất cả các mẫu mà Firebase AI Logic hỗ trợ và không hỗ trợ.
Phần còn lại của trang này cung cấp thông tin chi tiết về các mô hình mà Firebase AI Logic hỗ trợ.
-
- Đầu vào và đầu ra được hỗ trợ
- So sánh tổng quan về các chức năng được hỗ trợ
- Thông số kỹ thuật và giới hạn, ví dụ: số lượng mã thông báo đầu vào tối đa hoặc thời lượng tối đa của video đầu vào
Nội dung mô tả cách tạo phiên bản mô hình, cụ thể là các phiên bản ổn định, tự động cập nhật, xem trước và thử nghiệm
Danh sách tên mô hình có sẵn để đưa vào mã của bạn trong quá trình khởi chạy
Danh sách ngôn ngữ được hỗ trợ cho các mẫu
Ở cuối trang này, bạn có thể xem thông tin chi tiết về các mẫu cũ.
So sánh các mô hình
Mỗi mô hình có các chức năng khác nhau để hỗ trợ nhiều trường hợp sử dụng. Xin lưu ý rằng mỗi bảng trong phần này mô tả từng mô hình khi được sử dụng với Firebase AI Logic. Mỗi mô hình có thể có các tính năng bổ sung không có sẵn khi sử dụng SDK của chúng tôi.
Nếu không tìm thấy thông tin bạn đang tìm trong các tiểu mục sau, bạn có thể tìm thấy thêm thông tin trong tài liệu của nhà cung cấp API mà bạn đã chọn:
Gemini Developer API: mô hình Gemini và mô hình Imagen
Vertex AI Gemini API: mô hình Gemini và mô hình Imagen
Đầu vào và đầu ra được hỗ trợ
Đây là các loại đầu vào và đầu ra được hỗ trợ khi sử dụng từng mô hình với Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Tạo hình ảnh Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | ||
---|---|---|---|---|---|---|---|---|
Loại dữ liệu đầu vào | ||||||||
Văn bản | ||||||||
Văn bản (trực tuyến) | ||||||||
Mã | ||||||||
Tài liệu (PDF hoặc văn bản thuần tuý) |
||||||||
Hình ảnh | ||||||||
Video | ||||||||
Âm thanh | ||||||||
Âm thanh (truyền trực tuyến) | ||||||||
Loại đầu ra | ||||||||
Văn bản | ||||||||
Văn bản (trực tuyến) | ||||||||
Mã | ||||||||
Kết quả có cấu trúc (như JSON) |
||||||||
Hình ảnh | ||||||||
Âm thanh | ||||||||
Âm thanh (truyền trực tuyến) |
Để tìm hiểu về các loại tệp được hỗ trợ, hãy xem phần Yêu cầu và tệp đầu vào được hỗ trợ.
Các tính năng và chức năng được hỗ trợ
Sau đây là các tính năng và chức năng được hỗ trợ khi sử dụng từng mô hình với Firebase AI Logic:
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Tạo hình ảnh Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen | |
---|---|---|---|---|---|---|---|
Tạo văn bản từ dữ liệu đầu vào chỉ văn bản hoặc đa phương thức | xen kẽ hoặc là một phần của hình ảnh | chỉ phát trực tuyến | |||||
Tạo hình ảnh (Gemini hoặc Imagen) |
|||||||
Tạo bản âm thanh | chỉ phát trực tuyến | ||||||
Tạo đầu ra có cấu trúc
(chẳng hạn như JSON) |
|||||||
Phân tích tài liệu
(PDF hoặc văn bản thuần tuý) |
|||||||
Phân tích hình ảnh (thị giác) | |||||||
Phân tích video (thị giác) | |||||||
Phân tích âm thanh | chỉ phát trực tuyến | ||||||
Cuộc trò chuyện nhiều lượt | |||||||
Gọi hàm (công cụ) | |||||||
Tính số lượng mã thông báo | |||||||
Hướng dẫn về hệ thống | |||||||
Truyền phát đa phương thức hai chiều |
Thông số kỹ thuật và giới hạn
Dưới đây là thông số kỹ thuật và giới hạn khi sử dụng từng mô hình với Firebase AI Logic:
Tài sản |
<span="notranslate">Gemini 2.5 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Lite </span="notranslate"> |
<span="notranslate">Tạo hình ảnh Gemini 2.0 Flash </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen |
---|---|---|---|---|---|---|---|
Cửa sổ ngữ cảnh * Giới hạn tổng số mã thông báo (kết hợp đầu vào+đầu ra) |
1.048.576 mã thông báo | 1.048.576 mã thông báo | 1.048.576 mã thông báo | 1.048.576 mã thông báo | 32.768 mã thông báo | 32.768 mã thông báo | 480 mã thông báo |
Giới hạn mã thông báo đầu ra * | 65.536 mã thông báo | 65.536 mã thông báo | 8.192 mã thông báo | 8.192 mã thông báo | 8.192 mã thông báo | 8.192 mã thông báo | --- |
Ngày cắt kiến thức | Tháng 1 năm 2025 | Tháng 1 năm 2025 | Tháng 6 năm 2024 | Tháng 6 năm 2024 | Tháng 8 năm 2024 | Tháng 8 năm 2024 | --- |
Tệp PDF (theo yêu cầu) | |||||||
Số lượng tệp PDF đầu vào tối đa ** |
3.000 tệp | 3.000 tệp | 3.000 tệp | 3.000 tệp | 3.000 tệp | --- | --- |
Số trang tối đa trong mỗi tệp PDF đầu vào ** |
1.000 trang | 1.000 trang | 1.000 trang | 1.000 trang | 1.000 trang | --- | --- |
Kích thước tối đa cho mỗi tệp PDF đầu vào |
50 MB | 50 MB | 50 MB | 50 MB | 50 MB | --- | --- |
Hình ảnh (theo yêu cầu) | |||||||
Số lượng hình ảnh đầu vào tối đa |
3.000 hình ảnh | 3.000 hình ảnh | 3.000 hình ảnh | 3.000 hình ảnh | 3.000 hình ảnh | --- | --- |
Số lượng hình ảnh đầu ra tối đa |
--- | --- | --- | --- | 10 hình ảnh | --- | 4 hình ảnh |
Kích thước tối đa cho mỗi hình ảnh đầu vào được mã hoá base64 |
7 MB | 7 MB | 7 MB | 7 MB | 7 MB | --- | --- |
Video (theo yêu cầu) | |||||||
Số lượng tệp video đầu vào tối đa |
10 tệp | 10 tệp | 10 tệp | 10 tệp | 10 tệp | --- | --- |
Độ dài tối đa của tất cả video đầu vào (chỉ khung hình) |
Khoảng 60 phút | Khoảng 60 phút | Khoảng 60 phút | Khoảng 60 phút | Khoảng 60 phút | --- | --- |
Thời lượng tối đa của tất cả video đầu vào (khung hình + âm thanh) |
Khoảng 45 phút | Khoảng 45 phút | Khoảng 45 phút | Khoảng 45 phút | Khoảng 45 phút | --- | --- |
Âm thanh (theo mỗi yêu cầu) | |||||||
Số lượng tệp âm thanh đầu vào tối đa |
1 tệp | 1 tệp | 1 tệp | 1 tệp | 1 tệp | --- | --- |
Số lượng tệp âm thanh đầu ra tối đa |
--- | --- | --- | --- | --- | --- | --- |
Độ dài tối đa của tất cả âm thanh đầu vào |
~8,4 giờ | ~8,4 giờ | ~8,4 giờ | ~8,4 giờ | ~8,4 giờ | --- | --- |
Độ dài tối đa của tất cả âm thanh đầu ra |
--- | --- | --- | --- | --- | --- | --- |
*
Đối với tất cả các mô hình Gemini, một mã thông báo tương đương với khoảng 4 ký tự,
vì vậy, 100 mã thông báo tương đương với khoảng 60-80 từ tiếng Anh. Đối với các mô hình Gemini, bạn có thể xác định tổng số mã thông báo trong các yêu cầu bằng cách sử dụng countTokens
.
** Tệp PDF được coi là hình ảnh, vì vậy, một trang của tệp PDF được coi là một hình ảnh. Số trang được phép trong một yêu cầu bị giới hạn ở số lượng hình ảnh mà mô hình có thể hỗ trợ.
Tìm thêm thông tin chi tiết
Hạn mức và giá sẽ khác nhau tuỳ theo từng mô hình. Giá cũng phụ thuộc vào dữ liệu đầu vào và đầu ra.
Tìm hiểu về các loại tệp đầu vào được hỗ trợ, cách chỉ định loại MIME và cách đảm bảo rằng các tệp đầu vào và yêu cầu đa phương thức của bạn đáp ứng các yêu cầu và tuân theo các phương pháp hay nhất trong phần Các yêu cầu và tệp đầu vào được hỗ trợ.
Tên và phiên bản mô hình
Các mô hình được cung cấp ở phiên bản ổn định, xem trước và thử nghiệm. Để thuận tiện, các bí danh không có giá trị phiên bản rõ ràng sẽ được hỗ trợ.
Để tìm tên mô hình cụ thể để sử dụng trong mã, hãy xem phần "tên mô hình có sẵn" ở phần sau của trang này.
Loại phiên bản / Giai đoạn phát hành |
Mô tả | Mẫu tên mô hình | |
---|---|---|---|
Ổn định |
Các phiên bản Ổn định hiện đã có và được hỗ trợ để sử dụng trong môi trường sản xuất kể từ ngày phát hành.
Phiên bản mô hình ổn định thường được phát hành cùng với ngày ngừng hoạt động, cho biết ngày cuối cùng mà mô hình đó có hiệu lực. Sau ngày này, Google sẽ không còn hỗ trợ hoặc cho phép truy cập vào mô hình này. |
Tên mô hình của các phiên bản ổn định được thêm vào bằng một số phiên bản gồm ba chữ số cụ thể
Ví dụ: |
|
Tự động cập nhật bí danh ổn định | Các bí danh ổn định tự động cập nhật luôn trỏ đến phiên bản ổn định mới nhất của mô hình đó. Nếu một phiên bản ổn định mới được phát hành, thì bí danh tự động cập nhật sẽ tự động bắt đầu trỏ đến phiên bản ổn định mới đó. |
Tên mô hình của bí danh không có phần phụ thêm
Ví dụ: |
|
Xem trước |
Phiên bản Xem trước có các chức năng mới và được coi là không ổn định.
Các phiên bản xem trước luôn trỏ đến phiên bản xem trước mới nhất của mô hình đó. Nếu một phiên bản xem trước mới được phát hành, mọi phiên bản xem trước hiện có sẽ tự động bắt đầu trỏ đến phiên bản xem trước mới đó. Bạn không nên sử dụng các mô hình này cho mục đích sản xuất, vì chúng có giới hạn tỷ lệ nghiêm ngặt hơn và có thể có các yêu cầu về thanh toán. |
Tên mô hình của các phiên bản xem trước được thêm vào bằng
Ví dụ: |
|
Thử nghiệm |
Các phiên bản Thử nghiệm có các tính năng mới và được coi là không ổn định.
Bạn không nên sử dụng các mô hình này cho mục đích thương mại và các mô hình này có hạn mức tốc độ nghiêm ngặt hơn. Mô hình thử nghiệm được dùng để thu thập ý kiến phản hồi và thử nghiệm các tính năng mới nhất của chúng tôi. |
Tên mô hình của các phiên bản thử nghiệm được thêm vào bằng
Ví dụ: |
|
Đã nghỉ hưu |
Các phiên bản Ngừng hoạt động đã qua ngày ngừng hoạt động và đã bị vô hiệu hoá vĩnh viễn.
Google không còn hỗ trợ hoặc cho phép truy cập vào các mẫu đã ngừng hoạt động. Các yêu cầu tham chiếu đến mã nhận dạng mô hình đã ngừng hoạt động thường trả về lỗi 404. |
--- |
Tên mô hình hiện có
Tên mô hình là các giá trị rõ ràng mà bạn đưa vào mã của mình trong quá trình khởi chạy mô hình.
Liệt kê tất cả các mô hình có sẵn theo phương thức lập trình
Bạn có thể liệt kê tất cả tên mô hình có sẵn bằng API REST:
Gemini Developer API: Gọi điểm cuối
models.list
Vertex AI Gemini API: Gọi điểm cuối
publishers.models.list
Xin lưu ý rằng danh sách được trả về này sẽ bao gồm tất cả mô hình mà nhà cung cấp API hỗ trợ, nhưng Firebase AI Logic chỉ hỗ trợ mô hình Gemini và Imagen được mô tả trên trang này.
Ngoài ra, xin lưu ý rằng các bí danh được tự động cập nhật (ví dụ: gemini-2.0-flash
) không được liệt kê vì đó là bí danh thuận tiện cho mô hình cơ sở.
Tên mô hình Gemini
Để biết ví dụ về cách khởi chạy cho nền tảng của bạn, hãy xem hướng dẫn bắt đầu sử dụng.
Để biết thông tin chi tiết về các giai đoạn phát hành (đặc biệt là đối với các trường hợp sử dụng và thanh toán), hãy xem phần tạo phiên bản và mẫu đặt tên cho mô hình.
Tên mô hình Gemini 2.5 Pro
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
gemini-2.5-pro-preview-06-05 |
Phiên bản xem trước mới nhất của Gemini 2.5 Pro | Xem trước | 2025-06-05 | Sẽ được xác định sau |
gemini-2.5-pro-preview-05-06 |
Phiên bản xem trước của Gemini 2.5 Pro | Xem trước | 2025-05-06 | Sẽ được xác định sau |
gemini-2.5-pro-preview-03-25 |
Phiên bản xem trước trỏ đến gemini-2.5-pro-preview-05-06 |
Xem trước | 2025-03-25 | Sẽ được xác định sau |
Tên mô hình Gemini 2.5 Flash
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
gemini-2.5-flash-preview-05-20 |
Phiên bản xem trước mới nhất của Gemini 2.5 Flash | Xem trước | 2025-05-20 | Sẽ được xác định sau |
gemini-2.5-flash-preview-04-17 |
Phiên bản xem trước ban đầu của Gemini 2.5 Flash | Xem trước | 2025-04-17 | Sẽ được xác định sau |
Tên mô hình Gemini 2.0 Flash
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
gemini-2.0-flash-001 |
Phiên bản ổn định mới nhất của Gemini 2.0 Flash | Lò luyện | 2025-02-05 | Không sớm hơn 05/02/2026 |
gemini-2.0-flash |
Bí danh được tự động cập nhật trỏ đến phiên bản chính thức mới nhất của Flash 2.0 (hiện là gemini-2.0-flash-001 |
Lò luyện | 2025-02-10 | --- |
Tên mô hình Gemini 2.0 Flash‑Lite
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
gemini-2.0-flash-lite-001 |
Phiên bản ổn định mới nhất của Gemini 2.0 Flash‑Lite | Lò luyện | 2025-02-25 | Không sớm hơn 25/2/2026 |
gemini-2.0-flash-lite |
Bí danh tự động cập nhật trỏ đến phiên bản chính thức mới nhất của 2.0 Flash-Lite (hiện là gemini-2.0-flash-lite-001 |
Lò luyện | 2025-02-25 | --- |
Tên mô hình Gemini 2.0 Flash Image Generation
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
gemini-2.0-flash-preview-image-generation 1 |
Phiên bản xem trước cho Gemini 2.0 Flash Image Generation | Xem trước | 2025-05-06 | Sẽ được xác định sau |
Tên mô hình Gemini 2.0 Flash‑Live
Chỉ có sẵn khi bạn sử dụng Vertex AI Gemini API làm trình cung cấp API. |
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
gemini-2.0-flash-live-preview-04-09 1 |
Phiên bản xem trước cho Gemini 2.0 Flash‑Live | Xem trước | 2025-04-09 | Sẽ được xác định sau |
1 Không được hỗ trợ khi sử dụng Gemini Developer API với SDK Firebase AI Logic.
Tên mô hình Imagen
Để biết ví dụ về cách khởi chạy cho nền tảng của bạn, hãy xem hướng dẫn tạo hình ảnh bằng Imagen.
Để biết thông tin chi tiết về các giai đoạn phát hành (đặc biệt là đối với các trường hợp sử dụng và thanh toán), hãy xem phần tạo phiên bản và mẫu đặt tên cho mô hình.
Tên mô hình Imagen 4
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
imagen-4.0-generate-preview-06-06 2 |
Phiên bản xem trước của Imagen 4 | Xem trước | 2025-06-06 | Sẽ được xác định sau |
imagen-4.0-generate-preview-05-20 2 |
Phiên bản xem trước của Imagen 4 | Xem trước | 2025-05-20 | Không sớm hơn ngày 7 tháng 7 năm 2025 |
Tên mô hình Imagen 4 Fast
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
imagen-4.0-fast-generate-exp-06-06 2 |
Phiên bản thử nghiệm của Imagen 4 Fast | Xem trước | 2025-06-06 | Sẽ được xác định sau |
Tên mô hình Imagen 4 Ultra
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
imagen-4.0-ultra-generate-exp-06-06 2 |
Phiên bản thử nghiệm của Imagen 4 Ultra | Xem trước | 2025-06-06 | Sẽ được xác định sau |
imagen-4.0-ultra-generate-exp-05-20 2 |
Phiên bản thử nghiệm của Imagen 4 Ultra | Xem trước | 2025-05-20 | Không sớm hơn ngày 7 tháng 7 năm 2025 |
Tên mô hình Imagen 3
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
imagen-3.0-generate-002 |
Phiên bản ổn định mới nhất của Imagen 3 | Lò luyện | 2025-01-23 | Không sớm hơn ngày 23 tháng 1 năm 2026 |
imagen-3.0-generate-001 2 |
Phiên bản ổn định ban đầu của Imagen 3 | Lò luyện | 2024-07-31 | Không sớm hơn ngày 31 tháng 7 năm 2025 |
Tên mô hình Imagen 3 Fast
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
imagen-3.0-fast-generate-001 2 |
Phiên bản ổn định ban đầu của Imagen 3 Fast | Lò luyện | 2024-07-31 | Không sớm hơn ngày 31 tháng 7 năm 2025 |
2 Gemini Developer API không hỗ trợ bất kể cách bạn truy cập vào API.
Ngôn ngữ được hỗ trợ
Gemini
Tất cả mô hình Gemini đều có thể hiểu và trả lời bằng các ngôn ngữ sau:
Tiếng Ả Rập (ar), tiếng Bengali (bn), tiếng Bulgaria (bg), tiếng Trung giản thể và phồn thể (zh), tiếng Croatia (hr), tiếng Séc (cs), tiếng Đan Mạch (da), tiếng Hà Lan (nl), tiếng Anh (en), tiếng Estonia (et), tiếng Phần Lan (fi), tiếng Pháp (fr), tiếng Đức (de), tiếng Hy Lạp (el), tiếng Do Thái (iw), tiếng Hindi (hi), tiếng Hungary (hu), tiếng Indonesia (id), tiếng Ý (it), tiếng Nhật (ja), tiếng Hàn (ko), tiếng Latvia (lv), tiếng Lithuania (lt), tiếng Na Uy (no), tiếng Ba Lan (pl), tiếng Bồ Đào Nha (pt), tiếng Rumani (ro), tiếng Nga (ru), tiếng Serbia (sr), tiếng Slovak (sk), tiếng Slovenia (sl), tiếng Tây Ban Nha (es), tiếng Swahili (sw), tiếng Thuỵ Điển (sv), tiếng Thái (th), tiếng Thổ Nhĩ Kỳ (tr), tiếng Ukraina (uk), tiếng Việt (vi)
Mô hình Gemini 2.0 Flash, Gemini 1.5 Pro và Gemini 1.5 Flash có thể hiểu và phản hồi bằng các ngôn ngữ bổ sung sau:
Tiếng Afrikaans (af), tiếng Amharic (am), tiếng Assamese (as), tiếng Azerbaijan (az), tiếng Belarus (be), tiếng Bosnia (bs), tiếng Catalan (ca), tiếng Cebuano (ceb), tiếng Corse (co), tiếng xứ Wales (cy), tiếng Dhivehi (dv), tiếng Esperanto (eo), tiếng Basque (eu), tiếng Ba Tư (fa), tiếng Philippines (Tagalog) (fil), tiếng Frisian (fy), tiếng Ireland (ga), tiếng Gael Scotland (gd), tiếng Galicia (gl), tiếng Gujarati (gu), tiếng Hausa (ha), tiếng Hawaii (haw), tiếng Hmong (hmn), tiếng Haiti Creole (ht), tiếng Armenia (hy), tiếng Igbo (ig), tiếng Iceland (is), tiếng Java (jv), tiếng Gruzia (ka), tiếng Kazakh (kk), tiếng Khmer (km), tiếng Kannada (kn), tiếng Krio (kri), tiếng Kurd (ku), tiếng Kyrgyzstan (ky), tiếng Latin (la), tiếng Luxembourg (lb), tiếng Lào (lo), tiếng Malagasy (mg), tiếng Maori (mi), tiếng Macedonia (mk), tiếng Malayalam (ml), tiếng Mông Cổ (mn), tiếng Meiteilon (Manipuri) (mni-Mtei), tiếng Marathi (mr), tiếng Mã Lai (ms), tiếng Malta (mt), tiếng Myanmar (Miến Điện) (my), tiếng Nepal (ne), tiếng Nyanja (Chichewa) (ny), tiếng Odia (Oriya) (or), tiếng Punjabi (pa), tiếng Pashto (ps), tiếng Sindhi (sd), tiếng Sinhala (Sinhala) (si), tiếng Samoa (sm), tiếng Shona (sn), tiếng Somali (so), tiếng Albania (sq), tiếng Sesotho (st), tiếng Sunda (su), tiếng Tamil (ta), tiếng Telugu (te), tiếng Tajik (tg), tiếng Uyghur (ug), tiếng Urdu (ur), tiếng Uzbek (uz), tiếng Xhosa (xh), tiếng Yiddish (yi), tiếng Yoruba (yo), tiếng Zulu (zu)
Imagen
Phạm vi cung cấp chung: Tiếng Anh
Bản xem trước: Tiếng Trung (giản thể), tiếng Trung (phồn thể), tiếng Hindi, tiếng Nhật, tiếng Hàn, tiếng Bồ Đào Nha, tiếng Tây Ban Nha
Thông tin về các mô hình cũ
Firebase AI Logic hỗ trợ các mô hình Gemini đang hoạt động cũ (như các mô hình Gemini 1.5).
Firebase AI Logic không hỗ trợ các mô hình Imagen cũ (như Imagen 2).
Mô hình | Mục nhập | Đầu ra | Được tối ưu hoá cho |
---|---|---|---|
Gemini 1.5 Progemini-1.5-pro-002 |
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Hỗ trợ các nhiệm vụ suy luận phức tạp đòi hỏi nhiều trí tuệ hơn; Ngữ cảnh dài 2 triệu |
Gemini 1.5 Flashgemini-1.5-flash-002 |
văn bản, mã, tệp PDF, hình ảnh, video, âm thanh | văn bản, mã, JSON | Cung cấp hiệu suất nhanh và linh hoạt trên nhiều tác vụ |
gemini-1.0-pro-vision-001 |
|
||
gemini-1.0-pro-002 |
|
Xem đầu vào và đầu ra được hỗ trợ của các mẫu cũ
Đây là các loại đầu vào và đầu ra khi sử dụng từng mô hình với Firebase AI Logic:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | ||||
---|---|---|---|---|---|---|---|
Loại dữ liệu đầu vào | |||||||
Văn bản | |||||||
Mã | |||||||
Tài liệu (PDF hoặc văn bản thuần tuý) |
|||||||
Hình ảnh | |||||||
Video | |||||||
Âm thanh | |||||||
Âm thanh (truyền trực tuyến) | |||||||
Loại đầu ra | |||||||
Văn bản | |||||||
Mã | |||||||
Kết quả có cấu trúc (như JSON) |
|||||||
Hình ảnh, video và âm thanh |
Các tính năng và chức năng được hỗ trợ của các mẫu cũ
Dưới đây là các tính năng và chức năng khi sử dụng từng mô hình với Firebase AI Logic:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | |
---|---|---|---|---|
Tạo văn bản từ dữ liệu đầu vào chỉ có văn bản | ||||
Tạo văn bản từ dữ liệu đầu vào đa phương thức | ||||
Tạo hình ảnh | ||||
Tạo bản âm thanh | ||||
Tạo đầu ra có cấu trúc
(chẳng hạn như JSON) |
||||
Phân tích tài liệu
(PDF hoặc văn bản thuần tuý) |
||||
Phân tích hình ảnh (thị giác) | ||||
Phân tích video (thị giác) | ||||
Phân tích âm thanh | ||||
Cuộc trò chuyện nhiều lượt | ||||
Gọi hàm (công cụ) | ||||
Đếm mã thông báo và ký tự có thể tính phí | ||||
Hướng dẫn về hệ thống | ||||
Truyền phát đa phương thức hai chiều |
Thông số kỹ thuật và giới hạn của các mẫu cũ
Dưới đây là thông số kỹ thuật và giới hạn khi sử dụng từng mô hình với Firebase AI Logic:
<span="notranslate">Gemini 1.5 Pro </span="notranslate"> | <span="notranslate">Gemini 1.5 Flash </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro Vision </span="notranslate"> | <span="notranslate">Gemini 1.0 Pro </span="notranslate"> | ||||
---|---|---|---|---|---|---|---|
Cửa sổ ngữ cảnh * Giới hạn tổng số mã thông báo (kết hợp đầu vào+đầu ra) |
2.097.152 mã thông báo | 1.048.576 mã thông báo | 16.384 mã thông báo | 32.760 mã thông báo | |||
Giới hạn mã thông báo đầu ra * | 8.192 mã thông báo | 8.192 mã thông báo | 2.048 mã thông báo | 8.192 mã thông báo | |||
Ngày cắt kiến thức | Tháng 5 năm 2024 | Tháng 5 năm 2024 | Tháng 2 năm 2023 | Tháng 2 năm 2023 | |||
Tệp PDF (theo yêu cầu) | |||||||
Số lượng tệp PDF đầu vào tối đa ** |
3.000 tệp | 3.000 tệp | 16 tệp | --- | |||
Số trang tối đa trên mỗi tệp PDF đầu vào ** |
1.000 trang | 1.000 trang | 16 trang | --- | |||
Kích thước tối đa cho mỗi tệp PDF đầu vào |
50 MB | 50 MB | 50 MB | --- | |||
Hình ảnh (theo yêu cầu) | |||||||
Số lượng hình ảnh đầu vào tối đa |
3.000 hình ảnh | 3.000 hình ảnh | 16 hình ảnh | --- | |||
Số lượng hình ảnh đầu ra tối đa |
--- | --- | --- | --- | |||
Kích thước tối đa cho mỗi hình ảnh đầu vào được mã hoá base64 |
7 MB | 7 MB | 7 MB | --- | |||
Video (theo yêu cầu) | |||||||
Số lượng tệp video đầu vào tối đa |
10 tệp | 10 tệp | 1 tệp | --- | |||
Độ dài tối đa của tất cả video đầu vào (chỉ khung hình) |
Khoảng 60 phút | Khoảng 60 phút | 2 phút | --- | |||
Thời lượng tối đa của tất cả video đầu vào (khung hình + âm thanh) |
Khoảng 45 phút | Khoảng 45 phút | --- | --- | |||
Âm thanh (theo mỗi yêu cầu) | |||||||
Số lượng tệp âm thanh đầu vào tối đa |
1 tệp | 1 tệp | --- | --- | |||
Số lượng tệp âm thanh đầu ra tối đa |
--- | --- | --- | --- | |||
Độ dài tối đa của tất cả âm thanh đầu vào |
~8,4 giờ | ~8,4 giờ | --- | --- | |||
Độ dài tối đa của tất cả âm thanh đầu ra |
--- | --- | --- | --- |
*
Đối với tất cả các mô hình Gemini, một mã thông báo tương đương với khoảng 4 ký tự,
vì vậy, 100 mã thông báo tương đương với khoảng 60-80 từ tiếng Anh. Đối với các mô hình Gemini, bạn có thể xác định tổng số mã thông báo trong các yêu cầu bằng cách sử dụng countTokens
.
** Tệp PDF được coi là hình ảnh, vì vậy, một trang của tệp PDF được coi là một hình ảnh. Số trang được phép trong một yêu cầu bị giới hạn ở số lượng hình ảnh mà mô hình có thể hỗ trợ.
Tên mẫu hiện có của các mẫu cũ (bao gồm cả ngày ngừng hoạt động)
Tên mô hình là các giá trị rõ ràng mà bạn đưa vào mã của mình trong quá trình khởi chạy mô hình.
Tên mô hình Gemini 1.5 Pro
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
Phiên bản ổn định | ||||
gemini-1.5-pro-002 |
Phiên bản ổn định mới nhất của Gemini 1.5 Pro | Các thành phần sắp ngừng hoạt động | 2024-09-24 | 2025-09-24 |
gemini-1.5-pro-001 |
Phiên bản ổn định ban đầu của Gemini 1.5 Pro | Các thành phần sắp ngừng hoạt động | 2024-05-24 | 2025-05-24 |
Tự động cập nhật bí danh ổn định | ||||
gemini-1.5-pro |
Chỉ đến phiên bản ổn định mới nhất của 1.5 Pro (hiện là gemini-1.5-pro-002 |
Các thành phần sắp ngừng hoạt động | 2024-09-24 | 2025-09-24 |
Tên mô hình Gemini 1.5 Flash
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
Phiên bản ổn định | ||||
gemini-1.5-flash-002 |
Phiên bản ổn định mới nhất của Gemini 1.5 Flash | Các thành phần sắp ngừng hoạt động | 2024-09-24 | 2025-09-24 |
gemini-1.5-flash-001 |
Phiên bản ổn định ban đầu của Gemini 1.5 Flash | Các thành phần sắp ngừng hoạt động | 2024-05-24 | 2025-05-24 |
Tự động cập nhật bí danh ổn định | ||||
gemini-1.5-flash |
Chỉ đến phiên bản ổn định mới nhất của Flash 1.5 (hiện là gemini-1.5-flash-002 |
Các thành phần sắp ngừng hoạt động | 2024-09-24 | 2025-09-24 |
Tên mô hình Gemini 1.0 Pro Vision
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
Phiên bản ổn định | ||||
gemini-1.0-pro-vision-001 |
Phiên bản ổn định mới nhất của Gemini 1.0 Pro Vision | Ngừng thi đấu | 2024-02-15 | 2025-04-21 |
Tự động cập nhật bí danh ổn định | ||||
gemini-1.0-pro-vision |
Trỏ đến phiên bản ổn định mới nhất của 1.5 Pro Vision (hiện là gemini-1.5-pro-vision-001 |
Ngừng thi đấu | 2024-01-04 | 2025-04-21 |
Tên mô hình Gemini 1.0 Pro
Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
---|---|---|---|---|
Phiên bản ổn định | ||||
gemini-1.0-pro-002 |
Phiên bản ổn định mới nhất của Gemini 1.0 Pro | Ngừng thi đấu | 2024-04-09 | 2025-04-21 |
gemini-1.0-pro-001 |
Phiên bản ổn định của Gemini 1.0 Pro | Ngừng thi đấu | 2024-02-15 | 2025-04-21 |
Tự động cập nhật bí danh ổn định | ||||
gemini-1.0-pro |
Chỉ đến phiên bản ổn định mới nhất của 1.0 Pro (hiện là gemini-1.0-pro-002 |
Ngừng thi đấu | 2024-02-15 | 2025-04-21 |
Các bước tiếp theo
Thử các tính năng của Gemini API
- Xây dựng cuộc trò chuyện nhiều lượt (trò chuyện).
- Tạo văn bản từ câu lệnh chỉ có văn bản.
- Tạo văn bản bằng cách nhắc với nhiều loại tệp, chẳng hạn như hình ảnh, tệp PDF, video và âm thanh.
- Tạo kết quả có cấu trúc (như JSON) từ cả lời nhắc bằng văn bản và đa phương thức.
- Tạo hình ảnh từ câu lệnh dạng văn bản (Gemini hoặc Imagen).
- Đầu vào và đầu ra của luồng (bao gồm cả âm thanh) bằng Gemini Live API.
- Sử dụng tính năng gọi hàm để kết nối các mô hình tạo sinh với hệ thống và thông tin bên ngoài.