Đối với ứng dụng di động và ứng dụng web, các SDK Firebase AI Logic cho phép bạn tương tác với các mô hình Gemini và các mô hình Imagen được hỗ trợ ngay từ ứng dụng của bạn.
Các mô hình Gemini được coi là đa phương thức vì có khả năng xử lý và thậm chí tạo ra nhiều phương thức, bao gồm văn bản, mã, tệp PDF, hình ảnh, video và âm thanh. Bạn có thể dùng văn bản để nhắc mô hình Imagen tạo hình ảnh.
Ngoài ra, hãy xem Câu hỏi thường gặp của chúng tôi về tất cả các mô hình mà Firebase AI Logic hỗ trợ và không hỗ trợ.
Mô hình sử dụng chung
Chuyển đến phần so sánh mô hình
Gemini 3 Pro
gemini-3-pro-preview
Mô hình tốt nhất của chúng tôi về khả năng hiểu đa phương thức, đồng thời là mô hình tác nhân và mô hình mã hoá cảm xúc mạnh mẽ nhất từ trước đến nay, mang đến hình ảnh phong phú hơn và khả năng tương tác sâu sắc hơn, tất cả đều được xây dựng trên nền tảng suy luận tiên tiến hàng đầu.
Gemini 3 Flash
gemini-3-flash-preview
Mô hình thông minh nhất của chúng tôi được tối ưu hoá về tốc độ, hiệu quả và chi phí.
Nó cho phép thực hiện các tác vụ hằng ngày với khả năng suy luận được cải thiện, đồng thời vẫn có thể giải quyết các quy trình làm việc phức tạp nhất của tác nhân.
Gemini 2.5 Pro
gemini-2.5-pro
Mô hình tư duy hiện đại của chúng tôi có khả năng suy luận về các vấn đề phức tạp trong mã, toán học và STEM, cũng như phân tích các tập dữ liệu, cơ sở mã và tài liệu lớn bằng cách sử dụng ngữ cảnh dài.
Gemini 2.5 Flash
gemini-2.5-flash
Mô hình tốt nhất của chúng tôi về hiệu suất so với giá, cung cấp các chức năng toàn diện. 2.5 Flash phù hợp nhất với các tác vụ xử lý quy mô lớn, độ trễ thấp, khối lượng lớn đòi hỏi tư duy và các trường hợp sử dụng có tác nhân.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Mô hình flash nhanh nhất của chúng tôi, được tối ưu hoá để mang lại hiệu quả về chi phí và thông lượng cao.
Mô hình tạo hình ảnh
Bạn có thể tạo hình ảnh bằng mô hình Gemini hoặc Imagen.
Chuyển đến phần so sánh mô hình
Gemini
Hình ảnh Gemini 3 Pro (còn gọi là nano banana pro)
gemini-3-pro-image-preview
Được thiết kế để sản xuất nội dung chuyên nghiệp và hướng dẫn phức tạp. Mô hình này có tính năng liên kết với thế giới thực thông qua Google Tìm kiếm, quy trình "Suy nghĩ" mặc định giúp tinh chỉnh bố cục trước khi tạo và có thể tạo hình ảnh có độ phân giải lên đến 4K.
Hình ảnh Gemini 2.5 Flash (còn gọi là nano banana)
gemini-2.5-flash-image
Được thiết kế để tăng tốc độ và hiệu quả. Nó được tối ưu hoá cho các tác vụ có khối lượng lớn, độ trễ thấp và tạo ra hình ảnh ở độ phân giải 1024px.
Imagen
Imagen 4
imagen-4.0-generate-001
Tạo hình ảnh chân thực, chất lượng cao từ câu lệnh văn bản bằng ngôn ngữ tự nhiên.
Imagen 4 Fast
imagen-4.0-fast-generate-001
Tạo hình ảnh để tạo mẫu hoặc các trường hợp sử dụng có độ trễ thấp.
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
Tạo hình ảnh chân thực, chất lượng cao từ câu lệnh văn bản bằng ngôn ngữ tự nhiên.
Mô hình tạo âm thanh
Bạn có thể tạo âm thanh truyền trực tuyến bằng các mô hình hỗ trợ Gemini Live API.
Chuyển đến phần so sánh mô hình
Gemini 2.5 Flash có âm thanh gốc của Gemini Live API
Gemini Developer API: gemini-2.5-flash-native-audio-preview-12-2025
Vertex AI Gemini API: gemini-live-2.5-flash-native-audio
Cho phép tương tác bằng giọng nói và video theo thời gian thực với độ trễ thấp bằng mô hình Gemini hai chiều.
Các mô hình thế hệ trước
Các mô hình sau đây đang hoạt động nhưng là mô hình thế hệ trước. Bạn nên sử dụng một trong những mô hình mới nhất (nếu có thể).
Chuyển đến phần so sánh mô hình
Các mô hình Gemini
Gemini 2.0 Flash
gemini-2.0-flash-001
Mô hình nền tảng thế hệ thứ hai của chúng tôi, với cửa sổ ngữ cảnh 1 triệu token. Cung cấp các tính năng thế hệ mới và khả năng cải tiến, bao gồm tốc độ vượt trội và khả năng sử dụng công cụ gốc.
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
Mô hình nhỏ nhưng mạnh mẽ thế hệ thứ hai của chúng tôi, với cửa sổ ngữ cảnh 1 triệu token. Được tối ưu hoá để tiết kiệm chi phí và giảm độ trễ.
Phần còn lại của trang này cung cấp thông tin chi tiết về các mô hình mà Firebase AI Logic hỗ trợ.
-
- Đầu vào và đầu ra được hỗ trợ
- So sánh tổng quan về các chức năng được hỗ trợ
- Quy cách và giới hạn, chẳng hạn như số lượng mã thông báo đầu vào tối đa hoặc độ dài tối đa của video đầu vào
Nội dung mô tả về cách các mô hình được phân phiên bản, cụ thể là các phiên bản ổn định, tự động cập nhật, xem trước và thử nghiệm
Danh sách tên mẫu thiết bị hiện có để đưa vào mã của bạn trong quá trình khởi chạy
Danh sách các ngôn ngữ được hỗ trợ cho các mô hình
Ở cuối trang này, bạn có thể xem thông tin chi tiết về các mẫu thế hệ trước.
So sánh các mô hình
Mỗi mô hình có những khả năng khác nhau để hỗ trợ nhiều trường hợp sử dụng. Xin lưu ý rằng mỗi bảng trong phần này mô tả từng mô hình khi được dùng với Firebase AI Logic. Mỗi mô hình có thể có thêm các chức năng không có sẵn khi sử dụng SDK của chúng tôi.
Nếu không tìm thấy thông tin bạn cần trong các mục phụ sau, bạn có thể tìm thêm thông tin trong tài liệu của nhà cung cấp API mà bạn chọn:
Gemini Developer API: Các mô hình Gemini và các mô hình Imagen
Vertex AI Gemini API: Các mô hình Gemini và các mô hình Imagen
Đầu vào và đầu ra được hỗ trợ
Đây là các loại đầu vào và đầu ra được hỗ trợ khi sử dụng từng mô hình với Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro, Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Hình ảnh </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash – Live *** </span="notranslate"> |
Imagen (tạo) | Imagen (khả năng) | |
|---|---|---|---|---|---|---|---|
| Loại dữ liệu đầu vào | |||||||
| Văn bản | (truyền trực tuyến) | ||||||
| Mã | |||||||
| Tài liệu (PDF hoặc văn bản thuần tuý) |
|||||||
| Hình ảnh | |||||||
| Video | (truyền trực tuyến) | ||||||
| Âm thanh | (truyền trực tuyến) | ||||||
| Loại đầu ra | |||||||
| Văn bản | |||||||
| Văn bản (phát trực tuyến) | (bản chép lời) | ||||||
| Mã | |||||||
| Đầu ra có cấu trúc (chẳng hạn như JSON) |
|||||||
| Hình ảnh | |||||||
| Âm thanh | (truyền trực tuyến) | ||||||
Để tìm hiểu về các loại tệp được hỗ trợ, hãy xem phần Các tệp đầu vào được hỗ trợ và yêu cầu.
Các tính năng và chức năng được hỗ trợ
Sau đây là các chức năng và tính năng được hỗ trợ khi sử dụng từng mô hình với Firebase AI Logic:
|
<span="notranslate">Gemini 3 Pro, Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Hình ảnh </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash – Live *** </span="notranslate"> |
Imagen (tạo) | Imagen (khả năng) | |
|---|---|---|---|---|---|---|---|
| Tư duy | |||||||
| Tạo văn bản từ dữ liệu đầu vào chỉ có văn bản hoặc dữ liệu đầu vào đa phương thức | xen kẽ hoặc là một phần của hình ảnh | xen kẽ hoặc là một phần của hình ảnh | chỉ có bản chép lời | ||||
|
Tạo hình ảnh (Gemini hoặc Imagen) |
|||||||
|
Chỉnh sửa hình ảnh (Gemini hoặc Imagen) |
|||||||
| Tạo âm thanh | chỉ phát trực tuyến | ||||||
|
Tạo đầu ra có cấu trúc
(chẳng hạn như JSON) |
|||||||
|
Phân tích tài liệu
(tệp PDF hoặc văn bản thuần tuý) |
|||||||
| Phân tích hình ảnh (thị giác) | |||||||
| Phân tích video (thị giác) | chỉ phát trực tuyến | ||||||
| Phân tích âm thanh | chỉ phát trực tuyến | ||||||
| Cuộc trò chuyện nhiều lượt | chỉ phát trực tuyến | ||||||
| Truyền trực tuyến đa phương thức hai chiều | |||||||
| Gọi hàm | |||||||
| Thực thi mã | |||||||
| Cung cấp thông tin cơ bản bằng Google Tìm kiếm | |||||||
| Hướng dẫn về hệ thống | |||||||
| Đếm số lượng mã thông báo |
Quy cách và giới hạn
Đây là các quy cách và hạn chế khi sử dụng từng mô hình với Firebase AI Logic:
| Tài sản |
<span="notranslate">Gemini 3 Pro, Flash </span="notranslate"> |
<span="notranslate">Gemini 3 Pro Hình ảnh </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash – Live *** </span="notranslate"> |
Imagen (tạo) | Imagen (khả năng) |
|---|---|---|---|---|---|---|---|
| Giới hạn mã thông báo đầu vào * | 1.048.576 mã thông báo | 65.536 mã thông báo | 1.048.576 mã thông báo | 32.768 mã thông báo | 32.000 mã thông báo (mặc định; có thể nâng cấp lên 128.000) | 480 mã thông báo | 480 mã thông báo |
| Giới hạn mã thông báo đầu ra * | 65.536 mã thông báo | 32.768 mã thông báo | 65.536 mã thông báo | 8.192 mã thông báo | 64.000 mã thông báo | --- | --- |
| Ngày cắt kiến thức | Tháng 1 năm 2025 | Tháng 1 năm 2025 | Tháng 1 năm 2025 | Tháng 6 năm 2025 | Tháng 1 năm 2025 | --- | --- |
| Tệp PDF (theo yêu cầu) | |||||||
| Số lượng tối đa tệp PDF đầu vào ** |
900 tệp | 14 tệp | 3.000 tệp | 3 tệp | --- | --- | --- |
| Số trang tối đa cho mỗi tệp PDF đầu vào ** |
900 trang | 14 trang | 1.000 trang | 3 trang | --- | --- | --- |
| Kích thước tối đa cho mỗi tệp PDF đầu vào |
50 MB | 50 MB | 50 MB | 50 MB | --- | --- | --- |
| Hình ảnh (mỗi yêu cầu) | |||||||
| Số lượng tối đa hình ảnh đầu vào |
1.000 hình ảnh | 14 hình ảnh | 3.000 hình ảnh | 3 hình ảnh | --- | --- | 4 hình ảnh |
| Số lượng tối đa hình ảnh đầu ra |
--- | 10 hình ảnh | --- | 10 hình ảnh | --- | 4 hình ảnh | 4 hình ảnh |
| Kích thước tối đa cho mỗi hình ảnh đầu vào được mã hoá base64 |
7 MB | 7 MB | 7 MB | 7 MB | --- | --- | --- |
| Video (theo mỗi yêu cầu) | |||||||
| Số lượng tối đa tệp video đầu vào |
10 tệp | --- | 10 tệp | --- | --- | --- | --- |
| Độ dài tối đa của tất cả video đầu vào (chỉ khung hình) |
Khoảng 60 phút | --- | Khoảng 60 phút | --- | --- | --- | --- |
| Độ dài tối đa của tất cả video đầu vào (khung hình + âm thanh) |
Khoảng 45 phút | --- | Khoảng 45 phút | --- | --- | --- | --- |
| Âm thanh (theo mỗi yêu cầu) | |||||||
| Số lượng tối đa tệp âm thanh đầu vào |
1 tệp | --- | 1 tệp | --- | --- | --- | --- |
| Số lượng tối đa tệp âm thanh đầu ra |
--- | --- | --- | --- | --- | --- | --- |
| Độ dài tối đa của tất cả âm thanh đầu vào |
Khoảng 8,4 giờ | --- | Khoảng 8,4 giờ | --- | --- | --- | --- |
| Độ dài tối đa của tất cả âm thanh đầu ra |
--- | --- | --- | --- | --- | --- | --- |
*
Đối với tất cả các mô hình Gemini, một mã thông báo tương đương với khoảng 4 ký tự, vì vậy 100 mã thông báo tương đương với khoảng 60 đến 80 từ tiếng Anh. Đối với các mô hình Gemini, bạn có thể xác định tổng số mã thông báo trong các yêu cầu của mình bằng cách sử dụng countTokens.
** Tệp PDF được coi là hình ảnh, vì vậy một trang của tệp PDF được coi là một hình ảnh. Số lượng trang được phép trong một yêu cầu bị giới hạn ở số lượng hình ảnh mà mô hình có thể hỗ trợ.
*** Các mô hình Gemini 2.5 Flash-Live là các mô hình âm thanh gốc hỗ trợ Gemini Live API.
Tìm thêm thông tin chi tiết
Hạn mức và giá của mỗi mô hình sẽ khác nhau. Giá cũng phụ thuộc vào dữ liệu đầu vào và đầu ra.
Tìm hiểu về các loại tệp đầu vào được hỗ trợ, cách chỉ định loại MIME và cách đảm bảo rằng các tệp đầu vào và yêu cầu đa phương thức của bạn đáp ứng các yêu cầu và tuân theo các phương pháp hay nhất trong phần Các tệp đầu vào được hỗ trợ và yêu cầu.
Mẫu đặt tên và tạo phiên bản mô hình
Các mô hình được cung cấp ở phiên bản ổn định, xem trước và thử nghiệm. Để thuận tiện, các bí danh không có giá trị phiên bản rõ ràng sẽ được hỗ trợ.
Để tìm tên mẫu cụ thể cần dùng trong mã, hãy xem phần "tên mẫu có sẵn" ở phần sau của trang này.
| Loại phiên bản / Giai đoạn phát hành |
Mô tả | Mẫu tên mô hình | |
|---|---|---|---|
| Ổn định |
Ổn định: Các phiên bản này có sẵn và được hỗ trợ để sử dụng trong bản phát hành chính thức kể từ ngày phát hành.
|
|
|
| Bí danh ổn định được cập nhật tự động (Chỉ dành cho các mẫu Gemini 2.0) |
Tự động cập nhật: Các bí danh ổn định luôn trỏ đến phiên bản ổn định mới nhất của mô hình đó.
|
Chỉ có các mô hình
Ví dụ: |
|
| Xem trước |
Bản xem trước có các chức năng mới và được coi là không ổn định.
|
Tên mô hình của các phiên bản xem trước được thêm
Ví dụ: |
|
| Thử nghiệm |
Thử nghiệm có các phiên bản có chức năng mới và được coi là không ổn định.
|
Tên mẫu của các phiên bản thử nghiệm được thêm
Ví dụ: |
|
| Đã nghỉ hưu |
Các phiên bản đã ngừng hoạt động là những phiên bản đã quá ngày ngừng hoạt động và đã bị vô hiệu hoá vĩnh viễn.
|
--- |
|
Tên mẫu thiết bị hiện có
Tên mô hình là những giá trị rõ ràng mà bạn đưa vào mã của mình trong quá trình khởi tạo mô hình.
Chuyển đến Gemini tên mẫu Chuyển đến Imagen tên mẫu
Liệt kê tất cả các mô hình có sẵn theo phương thức lập trình
Bạn có thể liệt kê tất cả tên mô hình có sẵn bằng cách sử dụng REST API:
Gemini Developer API: Gọi điểm cuối
models.listVertex AI Gemini API: Gọi điểm cuối
publishers.models.list
Xin lưu ý rằng danh sách được trả về này sẽ bao gồm tất cả các mẫu mà nhà cung cấp API hỗ trợ, nhưng Firebase AI Logic chỉ hỗ trợ các mẫu Gemini và Imagen được mô tả trên trang này.
Cũng lưu ý rằng các bí danh được cập nhật tự động (ví dụ: gemini-2.0-flash) không được liệt kê vì chúng là bí danh tiện lợi cho mô hình cơ sở.
Tên mẫu Gemini
Để xem các ví dụ về quá trình khởi chạy cho nền tảng của bạn, hãy xem hướng dẫn bắt đầu sử dụng.
Để biết thông tin chi tiết về các giai đoạn phát hành (đặc biệt là đối với các trường hợp sử dụng, việc thanh toán và việc ngừng cung cấp), hãy xem mẫu đặt tên và lập phiên bản mô hình.
Tên mẫu Gemini 3 Pro
Yêu cầu Gói giá linh hoạt (trả tiền theo mức dùng) bất kể nhà cung cấp Gemini API của bạn là ai.
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-3-pro-preview |
Phiên bản xem trước của Gemini 3 Pro | Xem trước | 2025-11-18 | Sẽ được xác định sau |
Tên mẫu Gemini 3 Flash
Không yêu cầu gói giá linh hoạt (trả tiền theo mức dùng) nếu bạn đang sử dụng Gemini Developer API (thường thì các mô hình xem trước yêu cầu gói có tính phí).
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-3-flash-preview |
Phiên bản xem trước của Gemini 3 Flash | Xem trước | 2025-12-17 | Sẽ được xác định sau |
Tên mô hình Gemini 3 Pro Image (còn gọi là "nano banana pro")
Yêu cầu Gói giá linh hoạt (trả tiền theo mức dùng) bất kể nhà cung cấp Gemini API của bạn là ai.
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-3-pro-image-preview |
Phiên bản xem trước của Gemini 3 Pro Image (còn gọi là "nano banana pro") |
Xem trước | 2025-11-20 | Sẽ được xác định sau |
Tên mẫu Gemini 2.5 Pro
Không yêu cầu gói giá linh hoạt (trả tiền theo mức dùng) nếu bạn đang sử dụng Gemini Developer API.
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-2.5-pro |
Phiên bản ổn định của Gemini 2.5 Pro | Lò luyện | 2025-06-17 | Không sớm hơn 17/6/2026 |
Tên mẫu Gemini 2.5 Flash
Không yêu cầu gói giá linh hoạt (trả tiền theo mức dùng) nếu bạn đang sử dụng Gemini Developer API.
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-2.5-flash |
Phiên bản ổn định của Gemini 2.5 Flash | Lò luyện | 2025-06-17 | Không sớm hơn 17/6/2026 |
Tên mẫu Gemini 2.5 Flash‑Lite
Không yêu cầu gói giá linh hoạt (trả tiền theo mức dùng) nếu bạn đang sử dụng Gemini Developer API.
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Phiên bản ổn định của Gemini 2.5 Flash‑Lite | Lò luyện | 2025-07-22 | Không sớm hơn 2026-07-22 |
Tên mô hình Gemini 2.5 Flash Image (còn gọi là "nano banana")
Yêu cầu Gói giá linh hoạt (trả tiền theo mức dùng) bất kể nhà cung cấp Gemini API của bạn là ai.
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-2.5-flash-image |
Phiên bản ổn định cho Gemini 2.5 Flash Image (còn gọi là "nano banana") | Lò luyện | 2025-10-02 | Không sớm hơn 2026-10-02 |
Tên mẫu Gemini 2.5 Flash Live
Không yêu cầu gói giá linh hoạt (trả tiền theo mức dùng) nếu bạn đang sử dụng Gemini Developer API (thường thì các mô hình xem trước yêu cầu gói có tính phí).
Gemini 2.5 Flash Live là các mô hình âm thanh gốc hỗ trợ Gemini Live API. Mặc dù mô hình có các tên mô hình khác nhau tuỳ thuộc vào nhà cung cấp API Gemini, nhưng hành vi và các tính năng của mô hình này là giống nhau.
| Gemini Developer API Tên mẫu thiết bị |
Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-2.5-flash-native-audio-preview-12-2025 1 |
Phiên bản xem trước mới nhất cho Live API trên Gemini Developer API | Xem trước | 2025-12-12 | Sẽ được xác định sau |
gemini-2.5-flash-native-audio-preview-09-2025 1 |
Phiên bản xem trước ban đầu cho Live API trên Gemini Developer API | Xem trước | 2025-09-18 | Sẽ được xác định sau |
| Vertex AI Gemini API Tên mẫu thiết bị |
Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
gemini-live-2.5-flash-native-audio 2 |
Phiên bản ổn định của Live API trên Vertex AI Gemini API | Lò luyện | 2025-12-12 | Không sớm hơn 12/12/2026 |
gemini-live-2.5-flash-preview-native-audio-09-2025 2 |
Phiên bản xem trước của Live API trên Vertex AI Gemini API | Xem trước | 2025-09-18 | Sẽ được xác định sau |
1 Chỉ được Gemini Developer API hỗ trợ.
Ngoài ra, mặc dù đây là các mô hình xem trước, nhưng chúng có trong "bậc miễn phí" của Gemini Developer API.
2 Chỉ được hỗ trợ bởi Vertex AI Gemini API.
Ngoài ra, các mô hình này không được hỗ trợ ở vị trí global.
Tên mẫu Imagen
Để xem các ví dụ về cách khởi chạy cho nền tảng của bạn, hãy xem hướng dẫn tạo hình ảnh bằng Imagen.
Để biết thông tin chi tiết về các giai đoạn phát hành (đặc biệt là đối với các trường hợp sử dụng, việc thanh toán và việc ngừng cung cấp), hãy xem mẫu đặt tên và lập phiên bản mô hình.
Tên mẫu Imagen 4
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Phiên bản ổn định của Imagen 4 | Lò luyện | 2025-08-14 | Không sớm hơn ngày 14/8/2026 |
Tên mẫu Imagen 4 Fast
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Phiên bản ổn định của Imagen 4 Fast | Lò luyện | 2025-08-14 | Không sớm hơn ngày 14/8/2026 |
Tên mẫu Imagen 4 Ultra
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Phiên bản ổn định của Imagen 4 Ultra | Lò luyện | 2025-08-14 | Không sớm hơn ngày 14/8/2026 |
Tên mẫu Imagen 3 Capability
| Tên mẫu thiết bị | Nội dung mô tả | Giai đoạn phát hành | Ngày phát hành | Ngày ngừng hoạt động |
|---|---|---|---|---|
imagen-3.0-capability-001 2 |
Phiên bản ổn định ban đầu của Imagen 3 Capability | Lò luyện | 2024-12-10 | Không sớm hơn ngày 10/12/2025 |
2 Không được Gemini Developer API hỗ trợ dù bạn truy cập bằng cách nào.
Ngôn ngữ được hỗ trợ
Gemini
Tất cả các mô hình Gemini đều có thể hiểu và phản hồi bằng các ngôn ngữ sau:
Tiếng Ả Rập (ar), tiếng Bengali (bn), tiếng Bulgaria (bg), tiếng Trung giản thể và phồn thể (zh), tiếng Croatia (hr), tiếng Séc (cs), tiếng Đan Mạch (da), tiếng Hà Lan (nl), tiếng Anh (en), tiếng Estonia (et), tiếng Phần Lan (fi), tiếng Pháp (fr), tiếng Đức (de), tiếng Hy Lạp (el), tiếng Do Thái (iw), tiếng Hindi (hi), tiếng Hungary (hu), tiếng Indonesia (id), tiếng Ý (it), tiếng Nhật (ja), tiếng Hàn (ko), tiếng Latvia (lv), tiếng Litva (lt), tiếng Na Uy (no), tiếng Ba Lan (pl), tiếng Bồ Đào Nha (pt), tiếng Romania (ro), tiếng Nga (ru), tiếng Serbia (sr), tiếng Slovak (sk), tiếng Slovenia (sl), tiếng Tây Ban Nha (es), tiếng Swahili (sw), tiếng Thuỵ Điển (sv), tiếng Thái (th), tiếng Thổ Nhĩ Kỳ (tr), tiếng Ukraina (uk), tiếng Việt (vi)
Các mô hình Gemini 2.0 Flash, Gemini 1.5 Pro và Gemini 1.5 Flash có thể hiểu và phản hồi bằng những ngôn ngữ bổ sung sau đây:
Tiếng Afrikaans (af), tiếng Amharic (am), tiếng Assam (as), tiếng Azerbaijan (az), tiếng Belarus (be), tiếng Bosnia (bs), tiếng Catalan (ca), tiếng Cebuano (ceb), tiếng Corsica (co), tiếng Wales (cy), tiếng Dhivehi (dv), tiếng Esperanto (eo), tiếng Basque (eu), tiếng Ba Tư (fa), tiếng Philippines (tiếng Tagalog) (fil), tiếng Frisia (fy), tiếng Ireland (ga), tiếng Gael Scotland (gd), tiếng Galicia (gl), tiếng Gujarati (gu), tiếng Hausa (ha), tiếng Hawaii (haw), tiếng Hmong (hmn), tiếng Haiti (ht), tiếng Armenia (hy), tiếng Igbo (ig), tiếng Iceland (is), tiếng Java (jv), tiếng Gruzia (ka), tiếng Kazakh (kk), tiếng Khmer (km), tiếng Kannada (kn), tiếng Krio (kri), tiếng Kurd (ku), tiếng Kyrgyz (ky), tiếng Latinh (la), tiếng Luxembourg (lb), tiếng Lào (lo), tiếng Malagasy (mg), tiếng Maori (mi), tiếng Macedonia (mk), tiếng Malayalam (ml), tiếng Mông Cổ (mn), tiếng Meiteilon (tiếng Manipuri) (mni-Mtei), tiếng Marathi (mr), tiếng Mã Lai (ms), tiếng Malta (mt), tiếng Myanmar (tiếng Miến Điện) (my), tiếng Nepal (ne), tiếng Nyanja (tiếng Chichewa) (ny), tiếng Odia (tiếng Oriya) (or), tiếng Punjabi (pa), tiếng Pashto (ps), tiếng Sindhi (sd), tiếng Sinhala (tiếng Sinhala) (si), tiếng Samoa (sm), tiếng Shona (sn), tiếng Somali (so), tiếng Albania (sq), tiếng Sesotho (st), tiếng Sundan (su), tiếng Tamil (ta), tiếng Telugu (te), tiếng Tajik (tg), tiếng Uyghur (ug), tiếng Urdu (ur), tiếng Uzbek (uz), tiếng Xhosa (xh), tiếng Yiddish (yi), tiếng Yoruba (yo), tiếng Zulu (zu)
Imagen
Phạm vi cung cấp chung: Tiếng Anh
Xem trước: Tiếng Trung (giản thể), tiếng Trung (phồn thể), tiếng Hindi, tiếng Nhật, tiếng Hàn, tiếng Bồ Đào Nha, tiếng Tây Ban Nha
Thông tin về các mẫu trước đây
Các mô hình sau đây đang hoạt động nhưng là mô hình thế hệ trước. Bạn nên sử dụng một trong những mô hình mới nhất (nếu có thể).
Mẫu xe Gemini
gemini-2.0-flash-001(và bí danh được cập nhật tự động của miền này làgemini-2.0-flash)gemini-2.0-flash-lite-001(và bí danh được cập nhật tự động của miền này làgemini-2.0-flash-lite)
Để biết thông tin về các mô hình Gemini Live API cũ, hãy xem tài liệu về nhà cung cấp Gemini API:
Mẫu xe Imagen
imagen-3.0-generate-002imagen-3.0-fast-generate-001
Các bước tiếp theo
Dùng thử các chức năng của Gemini API
- Xây dựng cuộc trò chuyện nhiều lượt (chat).
- Tạo văn bản từ câu lệnh chỉ có văn bản.
- Tạo văn bản bằng cách đưa ra câu lệnh với nhiều loại tệp, chẳng hạn như hình ảnh, tệp PDF, video và tệp âm thanh.
- Tạo đầu ra có cấu trúc (chẳng hạn như JSON) từ cả văn bản và câu lệnh đa phương thức.
- Tạo hình ảnh từ câu lệnh dạng văn bản (Gemini hoặc Imagen).
- Đầu vào và đầu ra của luồng (bao gồm cả âm thanh) bằng cách sử dụng Gemini Live API.
- Sử dụng các công cụ (như lệnh gọi hàm và cơ sở dữ liệu với Google Tìm kiếm) để kết nối mô hình Gemini với các phần khác trong ứng dụng, hệ thống và thông tin bên ngoài.