모바일 및 웹 앱의 경우 Firebase AI Logic SDK를 사용하면 앱에서 지원되는 Gemini 모델 및 Imagen 모델과 직접 상호작용할 수 있습니다.
Gemini 모델은 텍스트, 코드, PDF, 이미지, 동영상, 오디오를 비롯한 여러 모달리티를 처리하고 생성할 수 있으므로 멀티모달로 간주됩니다. Imagen 모델은 텍스트로 프롬프트를 지정하여 이미지를 생성할 수 있습니다.
Firebase AI Logic에서 지원하는 모델과 지원하지 않는 모델에 관한 FAQ도 검토하세요.
추천 모델
Gemini 3 Pro
gemini-3-pro-preview
멀티모달 이해를 위한 최고의 모델이자 지금까지 가장 강력한 에이전트 및 분위기 코딩 모델로, 최첨단 추론을 기반으로 더 풍부한 시각적 요소와 더 깊은 상호작용을 제공합니다. (결제 필요)
Gemini 2.5 Pro
gemini-2.5-pro
코드, 수학, STEM의 복잡한 문제를 추론할 수 있으며 긴 컨텍스트를 사용하여 대규모 데이터 세트, 코드베이스, 문서를 분석할 수 있는 최첨단 사고 모델입니다.
Gemini 2.5 Flash
gemini-2.5-flash
최고의 가격 대비 성능을 갖추었으며 다양한 기능을 제공하는 모델 2.5 Flash는 대규모 처리, 짧은 지연 시간, 사고력이 필요한 대량 작업, 에이전트 사용 사례에 가장 적합합니다.
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
비용 효율성과 높은 처리량에 최적화된 가장 빠른 Flash 모델입니다.
이미지 생성 모델
Gemini 또는 Imagen 모델로 이미지를 생성할 수 있습니다.
Gemini
Gemini 2.5 Flash Image (일명 nano banana)
gemini-2.5-flash-image
이미지 생성 및 대화형 멀티턴 수정 기능을 포함한 빠른 창작 워크플로를 위해 업그레이드된 표준 Flash 모델입니다. (결제 필요)
Imagen
Imagen 4
imagen-4.0-generate-001
자연어 텍스트 프롬프트에서 사실적이고 고품질의 이미지를 생성합니다. (결제 필요)
Imagen 4 Fast
imagen-4.0-fast-generate-001
프로토타입 제작 또는 지연 시간이 짧은 사용 사례를 위한 이미지를 생성합니다. (결제 필요)
Imagen 4 Ultra
imagen-4.0-ultra-generate-001
자연어 텍스트 프롬프트에서 사실적이고 고품질의 이미지를 생성합니다. (결제 필요)
이전 세대 모델
다음은 활성 상태이지만 이전 세대 모델입니다. 가능한 경우 최신 모델 중 하나를 대신 사용하는 것이 좋습니다.
Gemini 모델
Gemini 2.0 Flash
gemini-2.0-flash-001
1백만 개의 토큰 컨텍스트 윈도우를 갖춘 2세대 워크호스 모델입니다. 빠른 속도, 네이티브 도구 사용 등 차세대 기능과 향상된 기능을 제공합니다.
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite-001
1백만 개의 토큰 컨텍스트 윈도우를 갖춘 2세대 소형 워크호스 모델입니다. 비용 효율성과 짧은 지연 시간에 최적화되어 있습니다.
이 페이지의 나머지 부분에서는 Firebase AI Logic에서 지원하는 모델에 관한 자세한 정보를 제공합니다.
-
- 지원되는 입력 및 출력
- 지원되는 기능의 대략적인 비교
- 사양 및 제한사항(예: 최대 입력 토큰 수 또는 입력 동영상의 최대 길이)
모델의 버전 관리 방법, 특히 안정, 자동 업데이트, 미리보기, 실험 버전 설명
초기화 중에 코드에 포함할 사용 가능한 모델 이름 목록
모델의 지원되는 언어 목록
이 페이지 하단에서 이전 세대 모델에 관한 자세한 정보를 확인할 수 있습니다.
모델 비교
각 모델에는 다양한 사용 사례를 지원하는 여러 기능이 있습니다. 이 섹션의 각 표에서는 Firebase AI Logic와 함께 사용될 때 각 모델을 설명합니다. 각 모델에는 SDK를 사용할 때는 사용할 수 없는 추가 기능이 있을 수 있습니다.
다음 하위 섹션에서 원하는 정보를 찾을 수 없는 경우 선택한 API 제공업체 문서에서 자세한 내용을 확인할 수 있습니다.
지원되는 입력 및 출력
Firebase AI Logic로 각 모델을 사용할 때 지원되는 입력 및 출력 유형은 다음과 같습니다.
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (생성) | Imagen (기능) | |
|---|---|---|---|---|---|---|
| 입력 유형 | ||||||
| 텍스트 | ||||||
| 텍스트 (스트리밍) | ||||||
| 코드 | ||||||
| 문서 (PDF 또는 일반 텍스트) |
||||||
| 이미지 | ||||||
| 동영상 | ||||||
| 오디오 | ||||||
| 오디오 (스트리밍) | ||||||
| 출력 유형 | ||||||
| 텍스트 | ||||||
| 텍스트 (스트리밍) | ||||||
| 코드 | ||||||
| 구조화된 출력 (예: JSON) |
||||||
| 이미지 | ||||||
| 오디오 | ||||||
| 오디오 (스트리밍) | ||||||
지원되는 파일 형식에 대해 알아보려면 지원되는 입력 파일 및 요구사항을 참고하세요.
지원되는 기능
Firebase AI Logic과 함께 각 모델을 사용할 때 지원되는 기능은 다음과 같습니다.
|
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (생성) | Imagen (기능) | |
|---|---|---|---|---|---|---|
| 사고 | ||||||
| 텍스트 전용 또는 멀티모달 입력에서 텍스트 생성 | 인터리브 또는 이미지의 일부 | 스트리밍만 | ||||
|
이미지 생성 (Gemini 또는 Imagen) |
||||||
|
이미지 수정 (Gemini 또는 Imagen) |
||||||
| 오디오 생성 | 스트리밍만 | |||||
|
구조화된 출력 생성
(예: JSON) |
||||||
|
문서 분석
(PDF 또는 일반 텍스트) |
||||||
| 이미지 분석 (vision) | ||||||
| 동영상 분석 (비전) | ||||||
| 오디오 분석 | 스트리밍만 | |||||
| 멀티턴 채팅 | ||||||
| 양방향 멀티모달 스트리밍 | ||||||
| 함수 호출 | ||||||
| 코드 실행 | ||||||
| Google 검색으로 그라운딩 | ||||||
| 시스템 안내 | ||||||
| 토큰 수 계산 |
사양 및 제한사항
Firebase AI Logic로 각 모델을 사용할 때의 사양 및 제한사항은 다음과 같습니다.
| 속성 |
<span="notranslate">Gemini 3 Pro </span="notranslate"> |
<span="notranslate">Gemini 2.5 Pro, Flash, Flash-Lite </span="notranslate"> |
<span="notranslate">Gemini 2.5 Flash Image </span="notranslate"> |
<span="notranslate">Gemini 2.0 Flash- Live </span="notranslate"> |
Imagen (생성) | Imagen (기능) |
|---|---|---|---|---|---|---|
| 컨텍스트 윈도우 * 총 토큰 한도 (입력+출력 합계) |
토큰 100만 개 | 토큰 1,048,576개 | 토큰 32,768개 | 토큰 32,768개 | 토큰 480개 | 토큰 480개 |
| 출력 토큰 한도* | 토큰 64,000개 | 토큰 65,536개 | 토큰 8,192개 | 토큰 8,192개 | --- | --- |
| 지식 단절 날짜 | 2025년 1월 | 2025년 1월 | June 2025 | 2024년 8월 | --- | --- |
| PDF (요청 시) | ||||||
| 최대 입력 PDF 파일 수 ** |
900개 파일 | 파일 3,000개 | 파일 3개 | --- | --- | --- |
| 입력 PDF 파일당 최대 페이지 수 ** |
900페이지 | 1,000페이지 | 3페이지 | --- | --- | --- |
| 입력 PDF 파일당 최대 크기 |
50MB | 50MB | 50MB | --- | --- | --- |
| 이미지 (요청당) | ||||||
| 최대 입력 이미지 수 |
이미지 1,000개 | 이미지 3,000개 | 이미지 3개 | --- | --- | 이미지 4개 |
| 최대 출력 이미지 수 |
--- | --- | 이미지 10개 | --- | 이미지 4개 | 이미지 4개 |
| 입력 base64로 인코딩된 이미지당 최대 크기 |
7 MB | 7 MB | 7 MB | --- | --- | --- |
| 동영상 (요청당) | ||||||
| 최대 입력 동영상 파일 수 |
10개 파일 | 10개 파일 | --- | --- | --- | --- |
| 모든 입력 동영상(프레임만 해당)의 최대 길이 |
약 60분 | 약 60분 | --- | --- | --- | --- |
| 모든 입력 동영상(프레임+오디오)의 최대 길이 |
약 45분 | 약 45분 | --- | --- | --- | --- |
| 오디오 (요청 시) | ||||||
| 최대 입력 오디오 파일 수 |
파일 1개 | 파일 1개 | --- | --- | --- | --- |
| 최대 출력 오디오 파일 수 |
--- | --- | --- | --- | --- | --- |
| 모든 입력 오디오의 최대 길이 |
약 8.4시간 | 약 8.4시간 | 약 8.4시간 | --- | --- | --- |
| 모든 출력 오디오의 최대 길이 |
--- | --- | --- | --- | --- | --- |
*
모든 Gemini 모델에서 토큰은 약 4자에 해당하므로 100개의 토큰은 약 60~80개의 영어 단어에 해당합니다. Gemini 모델의 경우 countTokens을 사용하여 요청의 총 토큰 수를 확인할 수 있습니다.
** PDF는 이미지로 취급되므로 PDF의 한 페이지는 하나의 이미지로 취급됩니다. 요청에서 허용되는 페이지 수는 모델이 지원할 수 있는 이미지 수로 제한됩니다.
추가 세부정보 찾기
지원되는 입력 파일 형식, MIME 유형 지정 방법, 입력 파일과 멀티모달 요청이 지원되는 입력 파일 및 요구사항의 요구사항을 충족하고 권장사항을 따르는지 확인하는 방법을 알아보세요.
모델 버전 관리 및 이름 지정 패턴
모델은 안정화, 미리보기, 실험 버전으로 제공됩니다. 편의를 위해 명시적 버전 값이 없는 별칭이 지원됩니다.
코드에서 사용할 특정 모델 이름을 찾으려면 이 페이지의 '사용 가능한 모델 이름' 섹션을 참고하세요.
| 버전 유형 / 출시 단계 |
설명 | 모델 이름 패턴 | |
|---|---|---|---|
| 안정화 |
안정 버전은 출시일 이후 프로덕션 용도로 사용 가능하며 지원됩니다.
|
|
|
| 자동 업데이트 안정 버전 별칭 (Gemini 2.0 모델만 해당) |
자동 업데이트 안정화 버전 별칭은 항상 해당 모델의 최신 안정화 버전을 가리킵니다.
|
Gemini 2.0 모델만 해당
예: |
|
| 미리보기 |
미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다.
|
미리보기 버전의 모델 이름에는
예: |
|
| 실험용 |
실험용 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다.
|
실험 버전의 모델 이름에는 모델 출시일 (
예: |
|
| 은퇴자 |
지원 중단됨 버전은 지원 중단 일자가 지난 버전으로, 영구적으로 비활성화됩니다.
|
--- |
|
사용 가능한 모델 이름
모델 이름은 모델 초기화 중에 코드에 포함하는 명시적 값입니다.
Gemini 모델 이름으로 이동 Imagen 모델 이름으로 이동
사용 가능한 모든 모델을 프로그래매틱 방식으로 나열
REST API를 사용하여 사용 가능한 모든 모델 이름을 나열할 수 있습니다.
Gemini Developer API:
models.list엔드포인트 호출Vertex AI Gemini API:
publishers.models.list엔드포인트 호출
반환된 목록에는 API 제공업체에서 지원하는 모든 모델이 포함되지만 Firebase AI Logic는 이 페이지에 설명된 Gemini 및 Imagen 모델만 지원합니다.
또한 자동 업데이트 별칭 (예: gemini-2.0-flash)은 기본 모델의 편의 별칭이므로 나열되지 않습니다.
Gemini 모델 이름
플랫폼의 초기화 예는 시작 가이드를 참고하세요.
출시 단계 (특히 사용 사례, 결제, 지원 중단)에 관한 자세한 내용은 모델 버전 관리 및 이름 지정 패턴을 참고하세요.
또한 Vertex AI Gemini API을 사용하는 경우 2025년 6월 이후 출시된 모든 Gemini 3 및 Gemini 2.5 미리보기 모델은
global 위치에서만 사용할 수 있습니다.
Gemini 3 Pro 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
gemini-3-pro-preview |
Gemini 3 Pro 미리보기 버전 | 미리보기 | 2025-11-18 | 미정 |
Gemini 2.5 Pro 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
gemini-2.5-pro |
Gemini 2.5 Pro의 안정화 버전 | 정식 | 2025-06-17 | 2026년 6월 17일 이후 |
Gemini 2.5 Flash 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
gemini-2.5-flash |
Gemini 2.5 Flash의 안정화 버전 | 정식 | 2025-06-17 | 2026년 6월 17일 이후 |
Gemini 2.5 Flash‑Lite 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
gemini-2.5-flash-lite |
Gemini 2.5 Flash‑Lite의 안정화 버전 | 정식 | 2025-07-22 | 2026년 7월 22일 이후 |
Gemini 2.5 Flash Image 모델 이름('nano banana'라고도 함)
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
gemini-2.5-flash-image |
Gemini 2.5 Flash Image('nano banana') 안정화 버전 | 정식 | 2025-10-02 | 2026년 10월 2일 이전 |
Gemini 2.5 Flash Live 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
gemini-live-2.5-flash |
Gemini 2.5 Flash Live 안정화 버전 | 안정화 버전 (비공개 GA) 1 |
2025-06-01 | 2026년 6월 1일 이후 |
gemini-live-2.5-flash-preview 2 |
Gemini 2.5 Flash Live 미리보기 버전 | 미리보기 | 2025-06-01 | 미정 |
Firebase AI Logic는 아직 네이티브 오디오 모델 (예: gemini-2.5-flash-native-audio-preview-09-2025)을 지원하지 않습니다.
1 Google Cloud 계정팀 담당자에게 문의하여 액세스 권한을 요청합니다. 2 액세스 방식과 관계없이 Vertex AI Gemini API에서 지원되지 않습니다.
Gemini 2.0 Flash Live 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
gemini-2.0-flash-live-001 2 |
Gemini 2.0 Flash Live 안정화 버전 | 정식 | 2025-04-01 | 2026년 4월 1일 이후 |
gemini-2.0-flash-live-preview-04-09 |
Gemini 2.0 Flash Live 미리보기 버전 | 미리보기 | 2025-04-09 | 미정 |
2 액세스 방식과 관계없이 Vertex AI Gemini API에서는 지원되지 않습니다.
Imagen 모델 이름
플랫폼의 초기화 예시는 Imagen로 이미지 생성 가이드를 참고하세요.
출시 단계 (특히 사용 사례, 결제, 지원 중단)에 관한 자세한 내용은 모델 버전 관리 및 이름 지정 패턴을 참고하세요.
Imagen 4 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
imagen-4.0-generate-001 |
Imagen 4의 안정화 버전 | 정식 | 2025-08-14 | 2026년 8월 14일 이후 |
Imagen 4 Fast 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
imagen-4.0-fast-generate-001 |
Imagen 4 Fast의 안정화 버전 | 정식 | 2025-08-14 | 2026년 8월 14일 이후 |
Imagen 4 Ultra 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
imagen-4.0-ultra-generate-001 |
Imagen 4 Ultra의 안정화 버전 | 정식 | 2025-08-14 | 2026년 8월 14일 이후 |
Imagen 3 Capability 모델 이름
| 모델 이름 | 설명 | 출시 단계 | 출시일 | 중단일 |
|---|---|---|---|---|
imagen-3.0-capability-001 3 |
Imagen 3 Capability의 초기 안정화 버전 | 정식 | 2024-12-10 | 2025년 12월 10일 이전 |
3 액세스 방식과 관계없이 Gemini Developer API에서는 지원되지 않습니다.
지원 언어
Gemini
모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.
한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)
Gemini 2.0 Flash, Gemini 1.5 Pro, Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.
아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)
Imagen
정식 버전: 영어
미리보기: 중국어 (간체), 중국어 (번체), 힌디어, 일본어, 한국어, 포르투갈어, 스페인어
이전 모델에 관한 정보
다음은 활성 상태이지만 이전 세대 모델입니다. 가능한 경우 최신 모델 중 하나를 대신 사용하는 것이 좋습니다.
모델 Gemini개
| 모델 | 입력 | 출력 | 설명 |
|---|---|---|---|
Gemini 2.0 Flashgemini-2.0-flash-001
|
텍스트, 코드, PDF, 이미지, 동영상, 오디오 | 텍스트, 코드, JSON | 빠른 속도, 기본 제공 도구 사용, 토큰 컨텍스트 윈도우 100만 개 등 차세대 기능과 향상된 기능을 갖춘 멀티모달 모델 |
Gemini 2.0 Flash‑Litegemini-2.0-flash-lite-001
|
텍스트, 코드, PDF, 이미지, 동영상, 오디오 | 텍스트, 코드, JSON | 가장 빠르고 비용 효율적인 Flash 모델입니다. 동일한 가격과 속도로 더 나은 품질을 원하는 1.5 Flash 사용자를 위한 업그레이드 경로입니다. |
모델 Imagen개
| 모델 | 입력 | 출력 | 설명 |
|---|---|---|---|
Imagen 3imagen-3.0-generate-002 |
텍스트 | 이미지 | 자연어 텍스트 프롬프트에서 사실적이고 고품질의 이미지를 생성합니다. |
Imagen 3 Fast 2imagen-3.0-fast-generate-001
|
텍스트 | 이미지 | 프로토타입 제작 또는 지연 시간이 짧은 사용 사례를 위한 이미지를 생성합니다. |
2 액세스 방식과 관계없이 Gemini Developer API에서는 지원되지 않습니다.
다음 단계
Gemini API의 기능을 사용해 보세요
- 멀티턴 대화 (채팅)를 빌드합니다.
- 텍스트 전용 프롬프트에서 텍스트를 생성합니다.
- 이미지, PDF, 동영상, 오디오와 같은 다양한 파일 유형으로 프롬프트를 표시하여 텍스트를 생성합니다.
- 텍스트 프롬프트와 멀티모달 프롬프트 모두에서 구조화된 출력 (예: JSON)을 생성합니다.
- 텍스트 프롬프트에서 이미지 생성(Gemini 또는 Imagen)
- Gemini Live API를 사용하여 스트림 입력 및 출력 (오디오 포함)
- 함수 호출 및 Google 검색을 통한 그라운딩과 같은 도구를 사용하여 Gemini 모델을 앱의 다른 부분과 외부 시스템 및 정보에 연결합니다.