โมเดล Generative AI (เช่น โมเดล Gemini) จะแบ่งข้อมูลออกเป็นหน่วยที่เรียกว่าโทเค็นเพื่อการประมวลผล โมเดล Gemini แต่ละโมเดลมีโทเค็นถึงจำนวนสูงสุด ที่สามารถจัดการในพรอมต์และการตอบกลับได้
หน้านี้แสดงวิธีรับค่าประมาณของจำนวนโทเค็นและจำนวนอักขระที่เรียกเก็บเงินได้สำหรับคำขอ
จำนวนข้อมูลมีอะไรบ้าง
สิ่งที่ควรทราบเกี่ยวกับการนับโทเค็นและอักขระที่เรียกเก็บเงินได้มีดังนี้
การนับโทเค็นทั้งหมด
จำนวนนี้มีประโยชน์ในการตรวจสอบว่าคำขอไม่พ้นกรอบเวลาบริบทที่อนุญาต
จำนวนโทเค็นจะแสดงขนาดของไฟล์ทั้งหมด (เช่น รูปภาพ) ที่ระบุเป็นส่วนหนึ่งของอินพุตคําขอ แต่จะไม่นับจำนวนรูปภาพหรือจำนวนวินาทีในวิดีโอ
สำหรับ Gemini ทุกรุ่น โทเค็นจะมีจำนวนอักขระประมาณ 4 ตัว โทเค็น 100 รายการ เท่ากับคำภาษาอังกฤษประมาณ 60-80 คำ
การนับจำนวนอักขระทั้งหมดที่เรียกเก็บเงินได้
การนับนี้มีประโยชน์ในการทำความเข้าใจและการควบคุมค่าใช้จ่าย เนื่องจากสำหรับ Vertex AI จำนวนอักขระเป็นส่วนหนึ่งของการคำนวณราคา
จำนวนอักขระที่เรียกเก็บเงินได้จะแสดงจำนวนอักขระในข้อความที่ให้ไว้ในอินพุตคำขอ
สำหรับ Vertex AI โทเค็นไม่ได้เป็นส่วนหนึ่งของการคำนวณราคา ดูข้อมูลเพิ่มเติมเกี่ยวกับขีดจำกัดโทเค็นต่อรุ่นและการกำหนดราคาต่อรุ่น
ราคาและโควต้าสำหรับการนับโทเค็นและอักขระที่เรียกเก็บเงินได้
ไม่มีค่าใช้จ่ายหรือการจำกัดโควต้าสำหรับการใช้ API ของ CountTokens
โควต้าสูงสุดสำหรับ API ของ CountTokens
คือ 3,000 คำขอต่อนาที