এই পৃষ্ঠায় Live API এবং এর মডেলগুলো ব্যবহারের বিভিন্ন সীমাবদ্ধতা ও নির্দিষ্টকরণ বর্ণনা করা হয়েছে।
সেশন-সম্পর্কিত সীমা
Live API ক্ষেত্রে, সেশন বলতে এমন একটি স্থায়ী সংযোগকে বোঝায় যেখানে একই সংযোগের মাধ্যমে ইনপুট এবং আউটপুট অবিচ্ছিন্নভাবে প্রবাহিত হয়।
সেশনটি নিম্নলিখিত সীমাগুলোর কোনোটি অতিক্রম করলে, সংযোগটি বিচ্ছিন্ন হয়ে যায়।
সংযোগের মেয়াদ প্রায় ১০ মিনিট পর্যন্ত সীমিত।
সেশনের দৈর্ঘ্য ইনপুট পদ্ধতির উপর নির্ভর করে:
- শুধুমাত্র অডিও ইনপুট সেশন ১৫ মিনিটের মধ্যে সীমাবদ্ধ।
- ভিডিও ও অডিও ইনপুটের সময়সীমা ২ মিনিট।
সেশন কনটেক্সট উইন্ডো ১২৮কে টোকেনে সীমাবদ্ধ।
সংযোগ শেষ হওয়ার আগে আপনি একটি বিদায়ী বিজ্ঞপ্তি পাবেন, যা আপনাকে পরবর্তী পদক্ষেপ নেওয়ার সুযোগ দেবে।
সেশন ব্যবস্থাপনা সম্পর্কে আরও জানুন।
হারের সীমা
Live API প্রতিটি ফায়ারবেস প্রজেক্টের জন্য একযোগে সেশন এবং প্রতি মিনিটে টোকেন (TPM) উভয়েরই রেট লিমিট রয়েছে।
জেমিনি ডেভেলপার এপিআই :
- আপনার প্রোজেক্টের Gemini Developer API 'ব্যবহারের স্তর'-এর উপর ভিত্তি করে সীমা পরিবর্তিত হয় (তাদের রেট লিমিট সংক্রান্ত ডকুমেন্টেশন দেখুন)।
ভার্টেক্স এআই জেমিনি এপিআই :
- প্রতিটি ফায়ারবেস প্রোজেক্টে ১,০০০টি যুগপৎ সেশন
- প্রতি মিনিটে ৪ মিলিয়ন টোকেন
অডিও ফরম্যাট
Live API নিম্নলিখিত অডিও ফরম্যাটগুলো সমর্থন করে:
- ইনপুট অডিও ফরম্যাট: ১৬ কিলোহার্টজ লিটল-এন্ডিয়ানে র ১৬ বিট পিসিএম অডিও
আউটপুট অডিও ফরম্যাট: ২৪ কিলোহার্টজ লিটল-এন্ডিয়ানে র ১৬ বিট পিসিএম অডিও
সমর্থিত MIME টাইপসমূহ :
audio/x-aac,audio/flac,audio/mp3,audio/m4a,audio/mpeg,audio/mpga,audio/mp4,audio/ogg,audio/pcm,audio/wav,audio/webm
ইনপুট অডিওর স্যাম্পল রেট জানাতে, অডিও ধারণকারী প্রতিটি Blob-এর MIME টাইপকে audio/pcm;rate=16000 এর মতো কোনো মানে সেট করুন।
ভিডিও ফরম্যাট
Live API একাধিক বিচ্ছিন্ন ইমেজ ফ্রেমের একটি ক্রম আশা করে এবং প্রতি সেকেন্ডে ১ ফ্রেম (FPS) হারে ভিডিও ফ্রেম ইনপুট সমর্থন করে।
সুপারিশকৃত ইনপুট : নেটিভ ৭৬৮x৭৬৮ রেজোলিউশন, ১ এফপিএস।
সমর্থিত MIME টাইপসমূহ :
video/x-flv,video/quicktime,video/mpeg,video/mpegs,video/mpg,video/mp4,video/webm,video/wmv,video/3gpp
উল্লেখ্য যে, এই স্পেসিফিকেশনটি Live API এমন সব ব্যবহারের ক্ষেত্রে অনুপযুক্ত করে তোলে যেখানে দ্রুত পরিবর্তনশীল ভিডিও বিশ্লেষণ করার প্রয়োজন হয়, যেমন দ্রুতগতির খেলাধুলার প্লে-বাই-প্লে ধারাভাষ্য।
প্রতিক্রিয়া কণ্ঠস্বর
Live API নিম্নলিখিত প্রতিক্রিয়া ভয়েস বিকল্পগুলি সমর্থন করে। প্রতিটি ভয়েস শুনতে কেমন তা জানতে, Chirp 3: HD voices দেখুন।
আপনি যদি কোনো প্রতিক্রিয়া কণ্ঠস্বর নির্দিষ্ট না করেন, তাহলে ডিফল্ট হিসেবে Puck ব্যবহৃত হয়।
প্রতিক্রিয়ার কণ্ঠস্বর কীভাবে নির্দিষ্ট করতে হয় তা জানুন।
Zephyr -- ব্রাইটKore -- ফার্মOrus -- ফার্মAutonoe -- BrightUmbriel -- সহজ-সরলErinome -- পরিষ্কারLaomedeia -- উচ্ছ্বসিতSchedar -- এমনকিAchird -- বন্ধুত্বপূর্ণSadachbia -- প্রাণবন্ত | Puck -- উচ্ছ্বসিতFenrir -- উত্তেজিতAoede -- BreezyEnceladus -- শ্বাসপ্রশ্বাসযুক্তAlgieba -- মসৃণAlgenib -- গ্র্যাভেলিAchernar -- নরমGacrux -- পরিপক্কZubenelgenubi -- CasualSadaltager -- জ্ঞানী | Charon -- তথ্যমূলকLeda -- যুবতীCallirrhoe -- সহজ-সরলIapetus -- পরিষ্কারDespina -- মসৃণRasalgethi -- তথ্যমূলকAlnilam -- ফার্মPulcherrima -- ফরোয়ার্ডVindemiatrix -- কোমলSulafat -- উষ্ণ |
ভাষা
Live API নিম্নলিখিত ভাষাগুলো সমর্থন করে। প্রতিক্রিয়ার ভাষা কীভাবে প্রভাবিত করা যায় তা জানুন।
| ভাষা | বিসিপি-৪৭ কোড | ভাষা | বিসিপি-৪৭ কোড |
|---|---|---|---|
| আরবি (মিশরীয়) | ar-EG | জার্মান (জার্মানি) | ডি-ডিই |
| ইংরেজি (মার্কিন যুক্তরাষ্ট্র) | en-US | স্প্যানিশ (মার্কিন যুক্তরাষ্ট্র) | es-US |
| ফরাসি (ফ্রান্স) | fr-FR | হিন্দি (ভারত) | হাই-ইন |
| ইন্দোনেশিয়ান (ইন্দোনেশিয়া) | আইডি-আইডি | ইতালীয় (ইতালি) | আইটি-আইটি |
| জাপানি (জাপান) | জা-জেপি | কোরিয়ান (কোরিয়া) | কো-কেআর |
| পর্তুগিজ (ব্রাজিল) | পিটি-বিআর | রাশিয়ান (রাশিয়া) | ru-RU |
| ডাচ (নেদারল্যান্ডস) | এনএল-এনএল | পোলিশ (পোল্যান্ড) | pl-PL |
| থাই (থাইল্যান্ড) | তম-টিএইচ | তুর্কি (তুরস্ক) | tr-TR |
| ভিয়েতনামী (ভিয়েতনাম) | ভি-ভিএন | রোমানিয়ান (রোমানিয়া) | ro-RO |
| ইউক্রেনীয় (ইউক্রেন) | ইউকে-ইউএ | বাংলা (বাংলাদেশ) | bn-BD |
| ইংরেজি (ভারত) | en-IN এবং hi-IN বান্ডেল | মারাঠি (ভারত) | মিঃ-আইএন |
| তামিল (ভারত) | তা-আইএন | তেলুগু (ভারত) | te-IN |