지원되는 모델 알아보기

모바일 및 웹 앱의 경우 Firebase AI Logic SDK를 사용하면 앱에서 지원되는 Gemini 모델Imagen 모델과 직접 상호작용할 수 있습니다.

Gemini 모델은 텍스트, 코드, PDF, 이미지, 동영상, 오디오를 비롯한 여러 모달리티를 처리하고 생성할 수 있으므로 멀티모달로 간주됩니다. Imagen 모델은 텍스트로 프롬프트를 지정하여 이미지를 생성할 수 있습니다.

Firebase AI Logic에서 지원하는 모델과 지원하지 않는 모델에 관한 FAQ도 검토하세요.

모델 비교로 이동

가장 지능적인 모델

gemini-3-pro-preview

멀티모달 이해를 위한 최고의 모델이자 지금까지 가장 강력한 에이전트 및 분위기 코딩 모델로, 최첨단 추론을 기반으로 더 풍부한 시각적 요소와 더 깊은 상호작용을 제공합니다. (결제 필요)


Google의 고급 사고 모델

gemini-2.5-pro

코드, 수학, STEM의 복잡한 문제를 추론할 수 있으며 긴 컨텍스트를 사용하여 대규모 데이터 세트, 코드베이스, 문서를 분석할 수 있는 최첨단 사고 모델입니다.

빠르고 스마트함

gemini-2.5-flash

최고의 가격 대비 성능을 갖추었으며 다양한 기능을 제공하는 모델 2.5 Flash는 대규모 처리, 짧은 지연 시간, 사고력이 필요한 대량 작업, 에이전트 사용 사례에 가장 적합합니다.

초고속

gemini-2.5-flash-lite

비용 효율성과 높은 처리량에 최적화된 가장 빠른 Flash 모델입니다.

이미지 생성 모델

Gemini 또는 Imagen 모델로 이미지를 생성할 수 있습니다.

모델 비교로 이동

Gemini

gemini-2.5-flash-image

이미지 생성 및 대화형 멀티턴 수정 기능을 포함한 빠른 창작 워크플로를 위해 업그레이드된 표준 Flash 모델입니다. (결제 필요)

Imagen

imagen-4.0-generate-001

자연어 텍스트 프롬프트에서 사실적이고 고품질의 이미지를 생성합니다. (결제 필요)

imagen-4.0-fast-generate-001

프로토타입 제작 또는 지연 시간이 짧은 사용 사례를 위한 이미지를 생성합니다. (결제 필요)

imagen-4.0-ultra-generate-001

자연어 텍스트 프롬프트에서 사실적이고 고품질의 이미지를 생성합니다. (결제 필요)

이전 세대 모델

다음은 활성 상태이지만 이전 세대 모델입니다. 가능한 경우 최신 모델 중 하나를 대신 사용하는 것이 좋습니다.

모델 비교로 이동

Gemini 모델

2세대 워크호스 모델

gemini-2.0-flash-001

1백만 개의 토큰 컨텍스트 윈도우를 갖춘 2세대 워크호스 모델입니다. 빠른 속도, 네이티브 도구 사용 등 차세대 기능과 향상된 기능을 제공합니다.

2세대 빠른 모델

gemini-2.0-flash-lite-001

1백만 개의 토큰 컨텍스트 윈도우를 갖춘 2세대 소형 워크호스 모델입니다. 비용 효율성과 짧은 지연 시간에 최적화되어 있습니다.


이 페이지의 나머지 부분에서는 Firebase AI Logic에서 지원하는 모델에 관한 자세한 정보를 제공합니다.

이 페이지 하단에서 이전 세대 모델에 관한 자세한 정보를 확인할 수 있습니다.



모델 비교

각 모델에는 다양한 사용 사례를 지원하는 여러 기능이 있습니다. 이 섹션의 각 표에서는 Firebase AI Logic와 함께 사용될 때 각 모델을 설명합니다. 각 모델에는 SDK를 사용할 때는 사용할 수 없는 추가 기능이 있을 수 있습니다.

다음 하위 섹션에서 원하는 정보를 찾을 수 없는 경우 선택한 API 제공업체 문서에서 자세한 내용을 확인할 수 있습니다.

지원되는 입력 및 출력

Firebase AI Logic로 각 모델을 사용할 때 지원되는 입력 및 출력 유형은 다음과 같습니다.

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (생성) Imagen (기능)
입력 유형
텍스트
텍스트 (스트리밍)
코드
문서
(PDF 또는 일반 텍스트)
이미지
동영상
오디오
오디오 (스트리밍)
출력 유형
텍스트
텍스트 (스트리밍)
코드
구조화된 출력
(예: JSON)
이미지
오디오
오디오 (스트리밍)

지원되는 파일 형식에 대해 알아보려면 지원되는 입력 파일 및 요구사항을 참고하세요.

지원되는 기능

Firebase AI Logic과 함께 각 모델을 사용할 때 지원되는 기능은 다음과 같습니다.

<span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (생성) Imagen (기능)
사고
텍스트 전용 또는 멀티모달 입력에서 텍스트 생성 인터리브 또는 이미지의 일부 스트리밍만
이미지 생성
(Gemini 또는 Imagen)
이미지 수정
(Gemini 또는 Imagen)
오디오 생성 스트리밍만
구조화된 출력 생성
(예: JSON)
문서 분석
(PDF 또는 일반 텍스트)
이미지 분석 (vision)
동영상 분석 (비전)
오디오 분석 스트리밍만
멀티턴 채팅
양방향 멀티모달 스트리밍
함수 호출
코드 실행
Google 검색으로 그라운딩
시스템 안내
토큰 수 계산

사양 및 제한사항

Firebase AI Logic로 각 모델을 사용할 때의 사양 및 제한사항은 다음과 같습니다.

속성 <span="notranslate">Gemini
3 Pro </span="notranslate">
<span="notranslate">Gemini
2.5 Pro, Flash, Flash-Lite </span="notranslate">
<span="notranslate">Gemini
2.5 Flash
Image </span="notranslate">
<span="notranslate">Gemini
2.0 Flash-
Live </span="notranslate">
Imagen (생성) Imagen (기능)
컨텍스트 윈도우 *
총 토큰 한도
(입력+출력 합계)
토큰 100만 개 토큰 1,048,576개 토큰 32,768개 토큰 32,768개 토큰 480개 토큰 480개
출력 토큰 한도* 토큰 64,000개 토큰 65,536개 토큰 8,192개 토큰 8,192개 --- ---
지식 단절 날짜 2025년 1월 2025년 1월 June 2025 2024년 8월 --- ---
PDF (요청 시)
최대 입력 PDF 파일 수
**
900개 파일 파일 3,000개 파일 3개 --- --- ---
입력 PDF 파일당
최대 페이지 수
**
900페이지 1,000페이지 3페이지 --- --- ---
입력 PDF 파일당 최대 크기
50MB 50MB 50MB --- --- ---
이미지 (요청당)
최대 입력 이미지 수
이미지 1,000개 이미지 3,000개 이미지 3개 --- --- 이미지 4개
최대 출력 이미지 수
--- --- 이미지 10개 --- 이미지 4개 이미지 4개
입력 base64로 인코딩된 이미지당 최대 크기
7 MB 7 MB 7 MB --- --- ---
동영상 (요청당)
최대 입력 동영상 파일 수
10개 파일 10개 파일 --- --- --- ---
모든 입력 동영상(프레임만 해당)의 최대 길이

약 60분 약 60분 --- --- --- ---
모든 입력 동영상(프레임+오디오)의 최대 길이

약 45분 약 45분 --- --- --- ---
오디오 (요청 시)
최대 입력 오디오 파일 수
파일 1개 파일 1개 --- --- --- ---
최대 출력 오디오 파일 수
--- --- --- --- --- ---
모든 입력 오디오의 최대 길이
약 8.4시간 약 8.4시간 약 8.4시간 --- --- ---
모든 출력 오디오의 최대 길이
--- --- --- --- --- ---

* 모든 Gemini 모델에서 토큰은 약 4자에 해당하므로 100개의 토큰은 약 60~80개의 영어 단어에 해당합니다. Gemini 모델의 경우 countTokens을 사용하여 요청의 총 토큰 수를 확인할 수 있습니다.

** PDF는 이미지로 취급되므로 PDF의 한 페이지는 하나의 이미지로 취급됩니다. 요청에서 허용되는 페이지 수는 모델이 지원할 수 있는 이미지 수로 제한됩니다.

추가 세부정보 찾기



모델 버전 관리 및 이름 지정 패턴

모델은 안정화, 미리보기, 실험 버전으로 제공됩니다. 편의를 위해 명시적 버전 값이 없는 별칭이 지원됩니다.

코드에서 사용할 특정 모델 이름을 찾으려면 이 페이지의 '사용 가능한 모델 이름' 섹션을 참고하세요.

버전 유형 /
출시 단계
설명 모델 이름 패턴
안정화 안정 버전은 출시일 이후 프로덕션 용도로 사용 가능하며 지원됩니다.
  • 안정 모델 버전은 일반적으로 모델을 사용 가능한 마지막 일자를 나타내는 지원 중단 날짜와 함께 제공됩니다. 이 날짜 이후에는 모델을 더 이상 사용할 수 없고, Google에서 지원하지 않습니다.
  • Gemini 2.5 모델
    안정화 버전의 모델 이름에는 접미사가 없습니다.

    예: gemini-2.5-pro

  • Gemini 2.0Imagen 모델
    안정화 버전의 모델 이름에 특정 세 자리 버전 번호가 추가됩니다.

    예: gemini-2.0-flash-001
    예: imagen-3.0-generate-002

자동 업데이트 안정 버전 별칭
(Gemini 2.0 모델만 해당)
자동 업데이트 안정화 버전 별칭은 항상 해당 모델의 최신 안정화 버전을 가리킵니다.
  • 새 안정화 버전이 출시되면 auto-updated 별칭이 자동으로 새 안정화 버전을 가리키기 시작합니다.

Gemini 2.0 모델만 해당
별칭의 모델 이름에는 접미사가 없습니다.

예: gemini-2.0-flash

미리보기 미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다.
  • 이러한 모델은 프로덕션 용도로는 권장되지 않으며, 더 제한적인 비율 제한이 적용되고 결제 요구사항이 있을 수 있습니다.
  • 이러한 모델은 연결된 안정화 버전이 출시된 후 몇 주 또는 몇 개월 내에 지원이 중단됩니다.
  • Vertex AI Gemini API의 경우 2025년 6월 이후에 출시된 미리보기 모델은 일반적으로 모델의 위치를 global로 설정해야 합니다.

미리보기 버전의 모델 이름에는 -preview이 추가되며, 모델의 출시일 (이전 모델의 경우 -MM-DD, 최신 모델의 경우 -MM-YYYY)이 추가되는 경우도 많습니다.

예:
gemini-2.5-flash-preview-04-17
(2025년 4월 17일 출시)
또는
gemini-2.5-flash-preview-09-2025
(2025년 9월 출시)
또는
gemini-3-pro-preview
(2025년 11월 출시)

실험용 실험용 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다.
  • 이러한 모델은 프로덕션 용도로 권장되지 않으며 더 제한적인 비율 제한이 적용됩니다. 실험 버전 모델은 의견을 수집하고 최신 기능을 실험하기 위해 설계되었습니다.
  • 이러한 모델은 연결된 안정화 버전이 출시된 후 몇 주 또는 몇 개월 내에 지원이 중단됩니다.
  • Vertex AI Gemini API의 경우 2025년 6월 이후에 출시된 실험용 모델은 모델의 위치를 global로 설정해야 합니다.

실험 버전의 모델 이름에는 모델 출시일 (-MM-DD)과 함께 -exp이 추가됩니다.

예: gemini-2.5-pro-exp-03-25
(2025년 3월 25일 출시)

은퇴자 지원 중단됨 버전은 지원 중단 일자가 지난 버전으로, 영구적으로 비활성화됩니다.
  • 지원 중단된 모델은 더 이상 액세스할 수 없으며 Google에서 지원하지 않습니다. 지원 중단된 모델 이름을 사용하는 요청은 404 오류를 반환합니다.

---



사용 가능한 모델 이름

모델 이름은 모델 초기화 중에 코드에 포함하는 명시적 값입니다.

Gemini 모델 이름으로 이동 Imagen 모델 이름으로 이동

사용 가능한 모든 모델을 프로그래매틱 방식으로 나열

REST API를 사용하여 사용 가능한 모든 모델 이름을 나열할 수 있습니다.

반환된 목록에는 API 제공업체에서 지원하는 모든 모델이 포함되지만 Firebase AI Logic는 이 페이지에 설명된 GeminiImagen 모델만 지원합니다. 또한 자동 업데이트 별칭 (예: gemini-2.0-flash)은 기본 모델의 편의 별칭이므로 나열되지 않습니다.

Gemini 모델 이름

플랫폼의 초기화 예는 시작 가이드를 참고하세요.

출시 단계 (특히 사용 사례, 결제, 지원 중단)에 관한 자세한 내용은 모델 버전 관리 및 이름 지정 패턴을 참고하세요.

Gemini 3 Pro 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
gemini-3-pro-preview Gemini 3 Pro 미리보기 버전 미리보기 2025-11-18 미정

Gemini 2.5 Pro 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
gemini-2.5-pro Gemini 2.5 Pro의 안정화 버전 정식 2025-06-17
2026년 6월 17일 이후

Gemini 2.5 Flash 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
gemini-2.5-flash Gemini 2.5 Flash의 안정화 버전 정식 2025-06-17
2026년 6월 17일 이후

Gemini 2.5 Flash‑Lite 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
gemini-2.5-flash-lite Gemini 2.5 Flash‑Lite의 안정화 버전 정식 2025-07-22
2026년 7월 22일 이후

Gemini 2.5 Flash Image 모델 이름('nano banana'라고도 함)

모델 이름 설명 출시 단계 출시일 중단일
gemini-2.5-flash-image Gemini 2.5 Flash Image('nano banana') 안정화 버전 정식 2025-10-02
2026년 10월 2일 이전

Gemini 2.5 Flash Live 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
gemini-live-2.5-flash Gemini 2.5 Flash Live 안정화 버전 안정화 버전
(비공개 GA) 1
2025-06-01
2026년 6월 1일 이후
gemini-live-2.5-flash-preview 2 Gemini 2.5 Flash Live 미리보기 버전 미리보기 2025-06-01 미정

Firebase AI Logic는 아직 네이티브 오디오 모델 (예: gemini-2.5-flash-native-audio-preview-09-2025)을 지원하지 않습니다.

1 Google Cloud 계정팀 담당자에게 문의하여 액세스 권한을 요청합니다. 2 액세스 방식과 관계없이 Vertex AI Gemini API에서 지원되지 않습니다.

Gemini 2.0 Flash Live 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
gemini-2.0-flash-live-001 2 Gemini 2.0 Flash Live 안정화 버전 정식 2025-04-01
2026년 4월 1일 이후
gemini-2.0-flash-live-preview-04-09 Gemini 2.0 Flash Live 미리보기 버전 미리보기 2025-04-09 미정

2 액세스 방식과 관계없이 Vertex AI Gemini API에서는 지원되지 않습니다.

Imagen 모델 이름

플랫폼의 초기화 예시는 Imagen로 이미지 생성 가이드를 참고하세요.

출시 단계 (특히 사용 사례, 결제, 지원 중단)에 관한 자세한 내용은 모델 버전 관리 및 이름 지정 패턴을 참고하세요.

Imagen 4 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
imagen-4.0-generate-001 Imagen 4의 안정화 버전 정식 2025-08-14 2026년 8월 14일 이후

Imagen 4 Fast 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
imagen-4.0-fast-generate-001 Imagen 4 Fast의 안정화 버전 정식 2025-08-14 2026년 8월 14일 이후

Imagen 4 Ultra 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
imagen-4.0-ultra-generate-001 Imagen 4 Ultra의 안정화 버전 정식 2025-08-14 2026년 8월 14일 이후

Imagen 3 Capability 모델 이름

모델 이름 설명 출시 단계 출시일 중단일
imagen-3.0-capability-001 3 Imagen 3 Capability의 초기 안정화 버전 정식 2024-12-10 2025년 12월 10일 이전

3 액세스 방식과 관계없이 Gemini Developer API에서는 지원되지 않습니다.



지원 언어

Gemini

  • 모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.

    한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)

  • Gemini 2.0 Flash, Gemini 1.5 Pro, Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.

    아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)

Imagen

  • 정식 버전: 영어

  • 미리보기: 중국어 (간체), 중국어 (번체), 힌디어, 일본어, 한국어, 포르투갈어, 스페인어



이전 모델에 관한 정보

다음은 활성 상태이지만 이전 세대 모델입니다. 가능한 경우 최신 모델 중 하나를 대신 사용하는 것이 좋습니다.

모델 Gemini

모델 입력 출력 설명
Gemini 2.0 Flash
gemini-2.0-flash-001
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 빠른 속도, 기본 제공 도구 사용, 토큰 컨텍스트 윈도우 100만 개 등 차세대 기능과 향상된 기능을 갖춘 멀티모달 모델
Gemini 2.0 Flash‑Lite
gemini-2.0-flash-lite-001
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 가장 빠르고 비용 효율적인 Flash 모델입니다. 동일한 가격과 속도로 더 나은 품질을 원하는 1.5 Flash 사용자를 위한 업그레이드 경로입니다.

모델 Imagen

모델 입력 출력 설명
Imagen 3
imagen-3.0-generate-002
텍스트 이미지 자연어 텍스트 프롬프트에서 사실적이고 고품질의 이미지를 생성합니다.
Imagen 3 Fast 2
imagen-3.0-fast-generate-001
텍스트 이미지 프로토타입 제작 또는 지연 시간이 짧은 사용 사례를 위한 이미지를 생성합니다.

2 액세스 방식과 관계없이 Gemini Developer API에서는 지원되지 않습니다.



다음 단계

Gemini API의 기능을 사용해 보세요