지원되는 모델 알아보기

모바일 및 웹 앱의 경우 Vertex AI in Firebase SDK를 사용하면 앱에서 지원되는 Gemini 모델과 직접 상호작용할 수 있습니다.

Gemini 모델은 텍스트, 코드, PDF, 이미지, 동영상, 오디오를 비롯한 여러 모달을 처리하고 생성할 수 있으므로 멀티모달로 간주됩니다.

다음은 Vertex AI in Firebase에서 지원되는 모델과 최신 안정화 버전에 관한 간략한 개요입니다. 이 페이지의 뒷부분에 있는 섹션에서는 더 자세한 비교 및 정보를 제공합니다.

모델 입력 출력 최적화 목표
Gemini 모델
Gemini 2.0 Flash
gemini-2.0-flash-001
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON
(이미지 및 오디오는 곧 제공 예정!)
다양한 작업을 위한 차세대 기능, 속도, 멀티모달 생성
Gemini 1.5 Pro
gemini-1.5-pro-002
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 더 많은 지능이 필요한 복잡한 추론 작업
Gemini 1.5 Flash
gemini-1.5-flash-002
텍스트, 코드, PDF, 이미지, 동영상, 오디오 텍스트, 코드, JSON 다양한 작업에서 빠르고 다재다능한 성능


이 페이지의 나머지 부분에서는 Vertex AI in Firebase에서 지원하는 모델에 관한 자세한 정보를 제공합니다.

이 페이지 하단에서 이전 모델에 관한 자세한 정보를 확인할 수 있습니다.



모델 비교

각 모델은 다양한 사용 사례를 지원하기 위해 서로 다른 기능을 제공합니다. 이 섹션의 각 표는 Vertex AI in Firebase와 함께 사용할 때 각 모델을 설명합니다. 각 모델에는 Google SDK를 사용할 때 사용할 수 없는 추가 기능이 있을 수 있습니다.

Gemini 모델에 관한 자세한 내용은 Google Cloud 문서를 참고하세요.

지원되는 입력 및 출력

다음은 각 모델을 Vertex AI in Firebase와 함께 사용할 때 지원되는 입력 및 출력 유형입니다.

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
입력 유형
텍스트
코드
문서 (PDF 또는 일반 텍스트)
이미지, 동영상, 오디오
오디오 (스트리밍) 제공 예정
출력 유형
텍스트
구조화된 출력 (예: JSON)
코드
이미지 제공 예정
오디오 제공 예정
오디오 (스트리밍) 제공 예정

지원되는 파일 형식에 관한 자세한 내용은 지원되는 입력 파일 및 에 관한 요구사항을 참고하세요.Vertex AI Gemini API

지원되는 기능

다음은 Vertex AI in Firebase과 함께 각 모델을 사용할 때 지원되는 기능입니다.

Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
텍스트 또는 멀티모달 입력에서 텍스트 생성
이미지 생성 제공 예정
오디오 생성 제공 예정
구조화된 출력 생성(예: JSON)
이미지 및 동영상 분석 (비전)
오디오 분석
문서 (PDF 또는 일반 텍스트) 분석
멀티턴 채팅
함수 호출(도구)
기본 함수 호출
병렬 함수 호출
함수 호출 모드
토큰 및 청구 가능한 문자 수 계산
시스템 안내
Multimodal Live API (양방향 스트리밍) 제공 예정

사양 및 제한사항

Vertex AI in Firebase와 함께 각 모델을 사용할 때의 사양 및 제한사항은 다음과 같습니다.

속성 Gemini 2.0 Flash Gemini 1.5 Pro Gemini 1.5 Flash
컨텍스트 창 *
총 토큰 한도 (입력+출력 합산)
토큰 1,048,576개 토큰 2,097,152개 토큰 1,048,576개
출력 토큰 한도 * 토큰 8,192개 토큰 8,192개 토큰 8,192개
지식 마감일 2024년 6월 2024년 5월 2024년 5월
이미지 (요청당)
최대 입력 이미지 수 이미지 3,000개 이미지 3,000개 이미지 3,000개
최대 출력 이미지 수 제공 예정 --- ---
입력 base64 인코딩 이미지당 최대 크기 7 MB 7 MB 7 MB
PDF (요청 시)
최대 입력 PDF 파일 수 ** 파일 3,000개 파일 3,000개 파일 3,000개
입력 PDF 파일당 최대 페이지 수 ** 1,000페이지 1,000페이지 1,000페이지
입력 PDF 파일당 최대 크기 50MB 50MB 50MB
동영상 (요청당)
최대 입력 동영상 파일 수 파일 10개 파일 10개 파일 10개
모든 입력 동영상의 최대 길이 (프레임만 해당) ~60분 ~60분 ~60분
모든 입력 동영상의 최대 길이 (프레임+오디오) 약 45분 약 45분 약 45분
오디오 (요청 시)
최대 입력 오디오 파일 수 파일 1개 파일 1개 파일 1개
출력 오디오 파일의 최대 개수 제공 예정 --- ---
모든 입력 오디오의 최대 길이 최대 8.4시간 최대 8.4시간 최대 8.4시간
모든 출력 오디오의 최대 길이 제공 예정 --- ---

* 모든 모델에서 토큰은 약 4자와 같으므로 토큰 100개는 영어 단어 약 60~80개에 해당합니다. Gemini 모델의 경우 countTokens를 사용하여 요청의 총 토큰 수를 확인할 수 있습니다.

** PDF는 이미지로 취급되므로 PDF의 한 페이지는 하나의 이미지로 취급됩니다. 요청에서 허용되는 페이지 수는 모델이 지원할 수 있는 이미지 수로 제한됩니다.

추가 세부정보 찾기



모델 버전 관리 및 이름 지정 패턴

모델은 안정화, 자동 업데이트, 미리보기 버전으로 제공됩니다.

  • 안정화 버전은 정식 버전으로 간주됩니다.

    • 안정화 버전에는 특정 세 자리 버전 번호(예: gemini-2.0-flash-001)가 모델 이름에 추가됩니다.
  • 자동 업데이트 버전은 항상 해당 모델의 최신 안정화 버전을 가리킵니다. 새 안정화 버전이 출시되면 자동 업데이트 버전이 새 안정화 버전을 자동으로 가리키기 시작합니다.

    • 자동 업데이트 버전에는 추가 항목이 없는 모델 이름이 있습니다(예: gemini-2.0-flash).
  • 미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다. 미리보기 버전은 항상 해당 모델의 최신 미리보기 버전을 가리킵니다. 새 미리보기 버전이 출시되면 기존 미리보기 버전이 자동으로 새 미리보기 버전을 가리키기 시작합니다.

    • 미리보기 버전에는 모델 이름에 모델의 최초 출시일(-MMDD)과 함께 -preview이 추가됩니다(예: gemini-1.5-pro-preview-0409(2024년 4월 9일에 출시됨)).

사용 가능한 모델 버전과 수명 주기에 관한 자세한 내용은 Google Cloud 문서(Gemini)를 참고하세요.



사용 가능한 모델 이름

모델 이름은 생성형 모델을 초기화하는 동안 코드에 포함하는 명시적 값입니다 (Gemini API를 호출하는 데 필요한 단계임).

publishers.models.list 엔드포인트를 사용하여 사용 가능한 모든 모델 이름을 나열할 수 있습니다. 반환된 목록에는 Vertex AI에서 지원하는 모든 모델이 포함되지만 Vertex AI in Firebase는 이 페이지에 설명된 Gemini 모델만 지원합니다. 또한 자동 업데이트 버전 (예: gemini-2.0-flash)은 기본 안정화 모델의 편의 별칭이므로 표시되지 않습니다.

Gemini 모델 이름

사용 중인 언어의 초기화 예는 시작 가이드를 참고하세요.

Gemini 2.0 Flash 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-2.0-flash-001 Gemini 2.0 Flash의 최신 안정화 버전 정식 버전 2025-02-05 미정
자동 업데이트 버전
gemini-2.0-flash 2.0 Flash
최신 안정화 버전을 가리킵니다(현재 gemini-2.0-flash-001).
정식 버전 2025-02-10 ---

Gemini 1.5 Pro 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-pro-002 Gemini 1.5 Pro의 최신 안정화 버전 정식 버전 2024-09-24 2025년 9월 24일 이후
gemini-1.5-pro-001 Gemini 1.5 Pro의 초기 안정화 버전 정식 버전 2024-05-24 2025년 5월 24일 이후
자동 업데이트 버전
gemini-1.5-pro 1.5 Pro
최신 안정화 버전을 가리킵니다(현재 gemini-1.5-pro-002).
정식 버전 2024-09-24 ---

Gemini 1.5 Flash 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-flash-002 Gemini 1.5 Flash의 최신 안정화 버전 정식 버전 2024-09-24 2025년 9월 24일 이후
gemini-1.5-flash-001 Gemini 1.5 Flash의 초기 안정화 버전 정식 버전 2024-05-24 2025년 5월 24일 이후
자동 업데이트 버전
gemini-1.5-flash 1.5 Flash의 최신 안정화 버전을 가리킵니다.
(현재 gemini-1.5-flash-002)
정식 버전 2024-09-24 ---



지원되는 언어

Gemini

  • 모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.

    한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)

  • Gemini 1.5 ProGemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 응답할 수 있습니다.

    아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)



이전 모델에 대한 정보

Vertex AI in FirebaseGemini 1.0 ProGemini 1.0 Pro Vision과 같은 이전 모델을 비롯한 모든 Gemini 모델을 지원합니다. 하지만 Google SDK와 함께 최신 모델을 사용하는 것이 좋습니다. 이러한 이전 Gemini 모델은 지원 중단일이 다가오고 있으며 최신 모델의 일부 기능을 제공하지 않습니다.



다음 단계

Gemini API의 기능 사용해 보기