นับโทเค็นและตัวละครที่เรียกเก็บเงินได้สำหรับโมเดล Gemini

โมเดล Generative จะแบ่งข้อมูลออกเป็นหน่วยที่เรียกว่าโทเค็นเพื่อประมวลผล แต่ละรูปแบบมีจำนวนโทเค็นสูงสุดที่รองรับในพรอมต์และคำตอบ

หน้านี้จะแสดงวิธีใช้ Count Tokens API เพื่อรับจำนวนโทเค็นโดยประมาณและจำนวนอักขระที่เรียกเก็บเงินได้สำหรับคำขอไปยังโมเดล Gemini ไม่มี API สำหรับการรับจำนวนโทเค็นโดยประมาณในการตอบกลับ

โปรดทราบว่า Count Tokens API ใช้ไม่ได้กับโมเดล Imagen

ข้อมูลใดบ้างที่ระบุไว้ในจํานวน

โปรดทราบข้อมูลต่อไปนี้เกี่ยวกับการนับโทเค็นและจำนวนอักขระที่เรียกเก็บเงินได้

  • การนับโทเค็นทั้งหมด

    • จํานวนนี้มีประโยชน์ในการช่วยให้มั่นใจว่าคําขอของคุณจะไม่เกินกรอบเวลาบริบทที่อนุญาต

    • จํานวนโทเค็นจะแสดงขนาดของไฟล์ทั้งหมด (เช่น รูปภาพ) ที่ระบุไว้เป็นส่วนหนึ่งของอินพุตคําขอ แต่จะไม่นับจำนวนรูปภาพหรือจำนวนวินาทีในวิดีโอ

    • สำหรับโมเดล Gemini ทั้งหมด โทเค็นจะเท่ากับประมาณ 4 อักขระ โทเค็น 100 รายการมีความยาวประมาณ 60-80 คำภาษาอังกฤษ

  • การนับอักขระทั้งหมดที่เรียกเก็บเงินได้

    • จำนวนนี้มีประโยชน์ในการทำความเข้าใจและควบคุมต้นทุน เนื่องจากสำหรับ Vertex AI จำนวนอักขระเป็นส่วนหนึ่งของการคำนวณราคา

    • จำนวนอักขระที่เรียกเก็บเงินได้จะแสดงจำนวนอักขระในข้อความที่ระบุไว้เป็นส่วนหนึ่งของอินพุตคำขอ

สำหรับรุ่น Gemini รุ่นเก่า โทเค็นจะไม่เป็นส่วนหนึ่งของการคำนวณราคา แต่สำหรับรุ่น Gemini 2.0 ระบบจะใช้โทเค็นในการคำนวณราคา ดูข้อมูลเพิ่มเติมเกี่ยวกับขีดจํากัดโทเค็นต่อรุ่นและราคาต่อรุ่น

การกำหนดราคาและโควต้าสำหรับการนับโทเค็นและอักขระที่เรียกเก็บเงินได้

ไม่มีค่าใช้จ่ายหรือข้อจำกัดโควต้าในการใช้ CountTokens API โควต้าสูงสุดสำหรับ CountTokens API คือ 3,000 คำขอต่อนาที (RPM)

ตัวอย่างโค้ด

การป้อนข้อความเท่านั้น

อินพุตหลายโมดัล