Gemini 모델에 대해 자세히 알아보기

Gemini 모델 제품군은 이미지, 동영상, 텍스트 등 여러 형식의 정보를 처리할 수 있으므로 멀티모달로 간주됩니다. 예를 들어 Gemini 모델에 쿠키 접시 사진을 전송하고 해당 쿠키의 레시피를 요청할 수 있습니다.

프롬프트 응답

이 쿠키의 레시피를 알려주세요.

초콜릿 칩 쿠키 여러 개 사진
**재료**
- 1컵. (2 스틱) 무염 버터, 실온
- 3/4컵 정제 설탕
- 3/4컵 갈색 설탕, 팩
- 1티스푼 바닐라 추출물
- 큰 계란 2개
- 2와 1/4컵 다목적 밀가루
- 1티스푼 베이킹 소다
- 1티스푼 소금
...

Google CloudVertex AI에서 제공하는 Gemini API를 사용하여 Gemini 모델 제품군과 상호작용할 수 있습니다. 모바일 및 웹 앱의 경우 Vertex AI in Firebase SDK를 사용하여 Gemini API를 호출하고 앱에서 직접 Gemini 모델과 상호작용할 수 있습니다.

이 페이지에서는 Gemini 모델에 대해 다음 정보를 제공합니다.

사용 가능한 모델

Vertex AI in Firebase와 함께 다음 Gemini 모델을 사용할 수 있습니다.

  • Gemini 1.5 Flash
    1.5 Pro와 동일한 입력 및 출력 유형을 지원하지만 100만 개의 토큰으로 긴 컨텍스트 이해를 제공하는 멀티모달 모델입니다. Gemini 1.5 Flash는 비용 효율적인 대용량 애플리케이션을 위해 특별히 설계되었습니다.

  • Gemini 1.5 Pro
    텍스트 또는 코드 응답을 위해 텍스트 또는 채팅 프롬프트에 이미지, 오디오, 동영상, PDF 파일을 추가할 수 있는 멀티모달 모델입니다. 또한 2백만 개의 토큰으로 긴 컨텍스트 이해를 지원합니다.

  • Gemini 1.0 Pro Vision
    텍스트 또는 코드 응답을 위해 텍스트와 이미지, 동영상을 처리하도록 설계된 멀티모달 모델입니다. 채팅에는 사용할 수 없습니다.

  • Gemini 1.0 Pro
    자연어 태스크, 텍스트 및 코드로 된 멀티턴 채팅, 코드 생성을 처리하도록 설계된 모델입니다.

코드에 포함할 모델 이름으로 이동

각 모델의 사용 사례 및 기능

각 Gemini 모델은 다양한 사용 사례를 지원하기 위해 서로 다른 기능을 갖추고 있습니다. 각 Gemini 모델에 관한 자세한 내용은 Google Cloud 문서를 참고하세요.

각 모델에 지원되는 입력 및 출력

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
입력 유형
텍스트
코드
이미지
PDF
동영상(프레임만 해당)
동영상 (프레임 및 오디오)
오디오
출력 유형
텍스트
응답 스키마를 사용하는 구조화된 출력 (예: JSON)
코드

지원되는 파일 형식에 관한 자세한 내용은 지원되는 입력 파일 및 Vertex AI Gemini API 요구사항을 참고하세요.

각 모델에 지원되는 기능 및 일반적인 기능

Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
텍스트 전용 입력에서 텍스트 생성
멀티모달 입력에서 텍스트 생성
응답 스키마를 사용한 구조화된 출력 (예: JSON)
멀티턴 채팅
함수 호출
기본 함수 호출
병렬 함수 호출
함수 호출 모드
토큰 및 청구 가능한 문자 수 계산
시스템 안내

각 모델에 관한 세부정보

속성 Gemini 1.5 Flash Gemini 1.5 Pro Gemini 1.0 Pro Vision Gemini 1.0 Pro
총 토큰 한도 (입력 및 출력 합계) * 토큰 1,048,576개 토큰 2,097,152개 토큰 16,384개 토큰 32,760개
출력 토큰 한도 * 토큰 8,192개 토큰 8,192개 토큰 2,048개 토큰 8,192개
요청당 최대 이미지 수 이미지 3,000개 이미지 3,000개 이미지 16개 해당 사항 없음
base64로 인코딩된 최대 이미지 크기 7 MB 7 MB 7MB 해당 사항 없음
최대 PDF 크기 30MB 30MB 30MB 해당 사항 없음
요청당 최대 동영상 파일 수 동영상 파일 10개 동영상 파일 10개 동영상 파일 1개 해당 사항 없음
최대 동영상 길이 (프레임만 해당) 동영상 약 60분 동영상 약 60분 2분 해당 사항 없음
최대 동영상 길이 (프레임 및 오디오) 동영상 약 45분 동영상 약 45분 해당 사항 없음 해당 사항 없음
요청당 최대 오디오 파일 수 오디오 파일 1개 오디오 파일 1개 해당 사항 없음 해당 사항 없음
최대 오디오 길이 오디오 최대 8.4시간 오디오 최대 8.4시간 해당 사항 없음 해당 사항 없음

* 모든 Gemini 모델에서 토큰은 약 4자(영문 기준)에 해당하므로 토큰 100개는 약 60~80개의 영어 단어에 해당합니다. countTokens를 사용하여 요청의 총 토큰 수를 확인할 수 있습니다.

지원되는 입력 파일 및 Vertex AI Gemini API 요구사항에서 지원되는 파일 형식, MIME 유형을 지정하는 방법, 파일 및 다중 모드 요청이 요구사항을 충족하고 권장사항을 따르는지 확인하는 방법을 알아보세요.

모델 버전 관리

Gemini 모델은 안정화 버전, 자동 업데이트 버전, 미리보기 버전으로 제공됩니다.

  • 안정화 버전은 정식 버전으로 간주됩니다.

    • 안정화 버전에는 특정 세 자리 버전 번호(예: gemini-1.5-pro-002)가 추가된 모델 이름이 있습니다.
  • 자동 업데이트 버전은 항상 해당 모델의 최신 안정화 버전을 가리킵니다. 새 안정화 버전이 출시되면 자동 업데이트 버전이 새 안정화 버전을 자동으로 가리키기 시작합니다.

    • 자동 업데이트 버전에는 추가 항목이 없는 모델 이름이 있습니다(예: gemini-1.5-pro).
  • 미리보기 버전에는 새로운 기능이 있으며 안정적이지 않은 것으로 간주됩니다. 미리보기 버전은 항상 해당 모델의 최신 미리보기 버전을 가리킵니다. 새 미리보기 버전이 출시되면 기존 미리보기 버전이 자동으로 새 미리보기 버전을 가리키기 시작합니다.

    • 미리보기 버전에는 모델 이름에 모델의 최초 출시일(-MMDD)과 함께 -preview이 추가됩니다(예: gemini-1.5-pro-preview-0409(2024년 4월 9일에 출시됨)).

Google Cloud 문서에서 사용 가능한 Gemini 모델 버전과 수명 주기에 대해 자세히 알아보세요.

사용 가능한 모델 이름

모델 이름은 생성형 모델을 초기화하는 동안 코드에 포함하는 명시적 값입니다(Gemini API를 호출하는 데 필요한 단계임). 사용 중인 언어의 초기화 예시는 시작 가이드를 참고하세요.

Gemini 1.5 Flash 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-flash-002 Gemini 1.5 Flash의 최신 안정화 버전 정식 버전 2024-09-24 2025-09-24 이전
gemini-1.5-flash-001 Gemini 1.5 Flash의 초기 안정화 버전 정식 버전 2024-05-24 2025년 5월 24일 이후
자동 업데이트 버전
gemini-1.5-flash gemini-1.5-flash-001를 가리킵니다.

gemini-1.5-flash-002에 액세스하려면 자동 업데이트 버전 대신 명시적 안정화 모델 이름을 사용하세요.
정식 버전 2024-05-24 ---

Gemini 1.5 Pro 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.5-pro-002 Gemini 1.5 Pro의 최신 안정화 버전 정식 버전 2024-09-24 2025-09-24 이전
gemini-1.5-pro-001 Gemini 1.5 Pro의 초기 안정화 버전 정식 버전 2024-05-24 2025-05-24 이전
자동 업데이트된 버전
gemini-1.5-pro gemini-1.5-pro-001를 가리킵니다.

gemini-1.5-pro-002에 액세스하려면 자동 업데이트 버전 대신 명시적 안정화 모델 이름을 사용하세요.
정식 버전 2024-05-24 ---

Gemini 1.0 Pro Vision 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.0-pro-vision-001 Gemini 1.0 Pro Vision의 최신 안정화 버전 정식 버전 2024-02-15 2025년 2월 15일 이전
자동 업데이트 버전
gemini-1.0-pro-vision 1.5 Pro Vision의 최신 안정화 버전
(현재 gemini-1.5-pro-vision-001)을 가리킵니다.
정식 버전 2024-01-04 ---

Gemini 1.0 Pro 모델 이름

모델 이름 설명 출시 단계 최초 출시일 지원 중단 날짜
안정화 버전
gemini-1.0-pro-002 Gemini 1.0 Pro의 최신 안정화 버전 정식 버전 2024-04-09 2025년 4월 9일 이후
gemini-1.0-pro-001 Gemini 1.0 Pro의 안정화 버전 정식 버전 2024-02-15 2025년 2월 15일 이후
자동 업데이트 버전
gemini-1.0-pro 1.0 Pro
최신 안정화 버전(현재 gemini-1.0-pro-002)을 가리킵니다.
정식 버전 2024-02-15 ---

지원 언어

  • 모든 Gemini 모델은 다음 언어를 이해하고 응답할 수 있습니다.

    한국어(ko), 아랍어(ar), 벵골어(bn), 불가리아어(bg), 중국어 간체 및 번체(zh), 크로아티아어(hr), 체코어(cs), 덴마크어(da), 네덜란드어(nl), 영어(en), 에스토니아(et), 핀란드어(fi), 프랑스어(fr), 독일어(de), 그리스어(el), 히브리어(iw), 힌디어(hi), 헝가리어(hu), 인도네시아어(id), 이탈리아어(it), 일본어(ja), 라트비아어(lv), 리투아니아어(lt), 노르웨이어(no), 폴란드어(pl), 포르투갈어(pt), 루마니아어(ro), 러시아어(ru), 세르비아어(sr), 슬로바키아어(sk), 슬로베니아어(sl), 스페인어(es), 스와힐리어(sw), 스웨덴어(sv), 태국어(th), 튀르키예어(tr), 우크라이나어(uk), 베트남어(vi)

  • Gemini 1.5 Pro 및 Gemini 1.5 Flash 모델은 다음 추가 언어를 이해하고 대답할 수 있습니다.

    아프리칸스어(af), 암하라어(am), 아삼어(as), 아제르바이잔어(az), 벨라루스어(be), 보스니아어(bs), 카탈루냐어(ca), 세부아노(ceb), 코르시카어(co), 웨일즈어(cy), 디베히어(dv), 에스페란토(eo), 바스크어(eu), 페르시아어(fa), 필리핀어(타갈로그어)(fil), 프리지아어(fy), 아일랜드(ga), 스코틀랜드 게일어(gd), 갈리시아어(gl), 구자라트어(gu), 하우사(ha), 하와이어(haw), 몽어(hmn), 하이티어(ht), 아르메니아(hy), 이그보어(ig), 아이슬란드어(is), 자바어(jv), 조지아어(ka), 카자흐어(kk), 크메르(km), 칸나다어(kn), 크리오(kri), 쿠르드어(ku), 키르기스어(ky) 라틴어(la), 룩셈부르크어(lb), 라오어(lo), 말라가시어(mg), 마오리어(mi), 마케도니아어(mk), 말라얄람어(ml), 몽골어(mn), 메이테이어(마니푸르어)(mni-Mtei), 마라티어(mr), 말레이어(ms), 몰타어(mt), 미얀마(버마어)(my), 네팔어(ne), 니안자(치셰와)(ny), 오리디아(오리야어)(or), 펀자브어(pa), 파슈토(ps), 신디어(sd), 싱할라어(싱할라어)(si), 사모아어(sm), 쇼나(sn), 소말리어(so), 알바니아어(sq), 세소토어(st), 순다어(su), 타밀어(ta), 텔루구(te), 타지크(tg), 위구르(ug), 우르두어(ur), 우즈베크(uz), 코사어(xh), 이디시어(yi), 요루바어(yo), 줄루어(zu)

다음 단계

Gemini API의 기능 사용해 보기