জেমিনি মডেলগুলো টোকেন নামক এককে ইনপুট ও আউটপুট প্রক্রিয়াকরণ করে।
টোকেনগুলো z মতো একক অক্ষর অথবা cat মতো সম্পূর্ণ শব্দ হতে পারে। দীর্ঘ শব্দগুলোকে কয়েকটি টোকেনে বিভক্ত করা হয়। মডেল দ্বারা ব্যবহৃত সমস্ত টোকেনের সেটকে শব্দভান্ডার বলা হয় এবং টেক্সটকে টোকেনে বিভক্ত করার প্রক্রিয়াকে টোকেনাইজেশন বলা হয়।
জেমিনি মডেলের ক্ষেত্রে, একটি টোকেন প্রায় ৪টি অক্ষরের সমান। ১০০টি টোকেন প্রায় ৬০-৮০টি ইংরেজি শব্দের সমান।
প্রতিটি মডেলের একটি প্রম্পট এবং রেসপন্সে পরিচালনা করার জন্য সর্বোচ্চ সংখ্যক টোকেন থাকে। আপনার প্রম্পটের টোকেন সংখ্যা জানা থাকলে আপনি এই সীমা অতিক্রম করেছেন কিনা তা জানতে পারবেন। এছাড়াও, একটি রিকোয়েস্টের খরচ আংশিকভাবে ইনপুট এবং আউটপুট টোকেনের সংখ্যার উপর নির্ভর করে, তাই টোকেন গণনা করার পদ্ধতি জানা সহায়ক হতে পারে।
সমর্থিত মডেল
-
gemini-3.1-pro-preview -
gemini-3-flash-preview -
gemini-3.1-flash-lite-preview -
gemini-3-pro-image-preview -
gemini-3.1-flash-image-preview -
gemini-2.5-pro -
gemini-2.5-flash -
gemini-2.5-flash-lite -
gemini-2.0-flash-001(এবং এর স্বয়ংক্রিয়ভাবে আপডেট হওয়া উপনামgemini-2.0-flash) -
gemini-2.0-flash-lite-001(এবং এর স্বয়ংক্রিয়ভাবে আপডেট হওয়া উপনামgemini-2.0-flash-lite)
টোকেন গণনার বিকল্পগুলি
জেমিনি এপিআই- এর সমস্ত ইনপুট এবং আউটপুট টোকেনাইজ করা হয়, যার মধ্যে টেক্সট, ইমেজ ফাইল এবং অন্যান্য নন-টেক্সট মাধ্যম অন্তর্ভুক্ত। টোকেন গণনার জন্য বিকল্পগুলো নিচে দেওয়া হলো:
- শুধুমাত্র আপনার অনুরোধগুলোর টোকেন সংখ্যা যাচাই করুন (মডেলে পাঠানোর আগে)।
- মডেলে পাঠানোর আগে রিকোয়েস্টের ইনপুট দিয়ে
countTokensকল করুন। এটি নিম্নলিখিত ফলাফল দেবে:-
total_tokens: শুধুমাত্র ইনপুটের টোকেন সংখ্যা
-
- আপনার অনুরোধ এবং প্রতিক্রিয়া উভয়ের টোকেন সংখ্যা যাচাই করুন।
- রেসপন্স অবজেক্টে
usageMetadataঅ্যাট্রিবিউটটি অ্যাক্সেস করুন। এর মধ্যে রয়েছে:-
prompt_token_count: শুধুমাত্র ইনপুটের টোকেন সংখ্যা -
candidates_token_count: শুধুমাত্র আউটপুটের টোকেন সংখ্যা (চিন্তাশীল টোকেন অন্তর্ভুক্ত নয়) -
thoughts_token_count: প্রতিক্রিয়া তৈরি করতে ব্যবহৃত যেকোনো চিন্তার টোকেনের সংখ্যা -
total_token_count: ইনপুট এবং আউটপুট উভয়ের জন্য মোট টোকেনের সংখ্যা (যেকোনো চিন্তাশীল টোকেন সহ)
আউটপুট স্ট্রিমিং করার সময়,
usageMetadataঅ্যাট্রিবিউটটি শুধুমাত্র স্ট্রিমের শেষ চাঙ্কে প্রদর্শিত হয়। মধ্যবর্তী চাঙ্কগুলোর জন্য এরnil। -
উপরের বিকল্পগুলো সম্পর্কে নিম্নলিখিত বিষয়গুলো লক্ষ্য করুন:
- তারা ইনপুট ইমেজের সংখ্যা অথবা ভিডিও বা অডিও ইনপুট ফাইলের সেকেন্ড সংখ্যা গণনা করবে না । তবে, এই প্রতিটি মোডালিটির জন্য টোকেন সংখ্যা এই মানগুলোর সাথে সঙ্গতিপূর্ণ হবে।
- ইনপুট টোকেন গণনার মধ্যে প্রম্পট (টেক্সট এবং যেকোনো ইনপুট ফাইল) এবং সেইসাথে যেকোনো সিস্টেম নির্দেশাবলী ও টুল অন্তর্ভুক্ত থাকে।
- আউটপুট টোকেন গণনায় কোনো থিঙ্কিং টোকেন অন্তর্ভুক্ত থাকে না; সেগুলো একটি পৃথক ফিল্ডে প্রদান করা হয়।
- এই পৃষ্ঠার পরবর্তী অংশে প্রতিটি অনুরোধের ধরন সম্পর্কিত নির্দিষ্ট অতিরিক্ত তথ্য পর্যালোচনা করুন।
- Gemini Live API মডেলগুলো
countTokensসমর্থন করে না । এছাড়াও, Firebase AI Logic এখনও Live API মডেলের রেসপন্সেusageMetadataঅ্যাট্রিবিউটটি সমর্থন করে না, তবে এটি শীঘ্রই আসছে!
এই বিকল্পগুলির মূল্য নির্ধারণ
countTokensকল করা:countTokens(কাউন্ট টোকেনস এপিআই) কল করার জন্য কোনো চার্জ নেই। কাউন্ট টোকেনস এপিআই-এর সর্বোচ্চ কোটা হলো প্রতি মিনিটে ৩০০০ রিকোয়েস্ট (আরপিএম)।usageMetadataঅ্যাট্রিবিউটের ব্যবহার: এই অ্যাট্রিবিউটটি সর্বদা রেসপন্সের অংশ হিসেবে ফেরত আসে এবং এর জন্য কোনো টোকেন খরচ হয় না বা নিজে কোনো চার্জ নেয় না।
অতিরিক্ত তথ্য
নির্দিষ্ট ধরনের অনুরোধ নিয়ে কাজ করার ক্ষেত্রে এখানে কিছু অতিরিক্ত তথ্য দেওয়া হলো।
টেক্সট ইনপুট টোকেন গণনা করুন
কোনো অতিরিক্ত তথ্য নেই।
একাধিক পালা (চ্যাট) টোকেন গণনা করুন
চ্যাট ব্যবহার করার সময় countTokens কল করার জন্য নিম্নলিখিত বিষয়গুলো লক্ষ্য করুন:
- আপনি যদি চ্যাট হিস্ট্রি দিয়ে
countTokensকল করেন, তাহলে এটি চ্যাটের উভয় রোলের মোট টোকেন সংখ্যা (total_tokens) ফেরত দেয়। - আপনার পরবর্তী কথোপকথনের পালা কতটা বড় হবে তা বোঝার জন্য,
countTokensকল করার সময় আপনাকে এটি ইতিহাসে যুক্ত করতে হবে।
মাল্টিমোডাল ইনপুট টোকেন গণনা করুন
মাল্টিমোডাল ইনপুটের মাধ্যমে টোকেন গণনা করার বিষয়ে নিম্নলিখিত বিষয়গুলো লক্ষ্য করুন:
- আপনি চাইলে টেক্সট এবং ফাইলের উপর আলাদাভাবে
countTokensকল করতে পারেন। - টোকেন গণনার উভয় বিকল্পের ক্ষেত্রেই, আপনি ফাইলটি ইনলাইন ডেটা হিসেবে দিন বা এর URL ব্যবহার করুন, একই টোকেন সংখ্যা পাবেন।
ছবির ইনপুট ফাইল
ইমেজ ইনপুট ফাইলগুলোকে তাদের ডাইমেনশনের উপর ভিত্তি করে টোকেনে রূপান্তর করা হয়:
- যেসব ছবির উভয় মাত্রা ৩৮৪ পিক্সেল বা তার কম, সেগুলোর ক্ষেত্রে প্রতিটি ছবিকে ২৫৮টি টোকেন হিসেবে গণনা করা হয়।
- এক বা উভয় দিকে বড় আকারের ছবির ক্ষেত্রে: প্রতিটি ছবিকে প্রয়োজন অনুযায়ী ক্রপ ও স্কেল করে ৭৬৮x৭৬৮ পিক্সেলের টাইলে পরিণত করা হয় এবং তারপর প্রতিটি টাইলকে ২৫৮টি টোকেন হিসেবে গণনা করা হয়।
ভিডিও এবং অডিও ইনপুট ফাইল
ভিডিও এবং অডিও ইনপুট ফাইলগুলো নিম্নলিখিত নির্দিষ্ট হারে টোকেনে রূপান্তরিত করা হয়:
- ভিডিও: প্রতি সেকেন্ডে ২৬৩ টোকেন
- অডিও: প্রতি সেকেন্ডে ৩২টি টোকেন
ডকুমেন্ট (যেমন পিডিএফ) ইনপুট ফাইল
পিডিএফ ইনপুট ফাইলগুলোকে ছবি হিসেবে গণ্য করা হয়, তাই পিডিএফ-এর প্রতিটি পৃষ্ঠাকেও ছবির মতোই টোকেনাইজ করা হয়।