এই পৃষ্ঠায় Live API এবং এর মডেলগুলি ব্যবহারের জন্য বিভিন্ন সীমা এবং স্পেসিফিকেশন বর্ণনা করা হয়েছে।
সেশন-সম্পর্কিত সীমা
Live API ক্ষেত্রে, একটি সেশন বলতে একটি স্থায়ী সংযোগকে বোঝায় যেখানে ইনপুট এবং আউটপুট একই সংযোগের মাধ্যমে ক্রমাগত স্ট্রিম করা হয়।
যদি সেশনটি নিম্নলিখিত সীমা অতিক্রম করে, তাহলে সংযোগটি বন্ধ করে দেওয়া হবে।
সংযোগের দৈর্ঘ্য প্রায় ১০ মিনিটের মধ্যে সীমাবদ্ধ।
সেশনের দৈর্ঘ্য ইনপুট পদ্ধতির উপর নির্ভর করে:
- শুধুমাত্র অডিও ইনপুট সেশনগুলি ১৫ মিনিটের মধ্যে সীমাবদ্ধ।
- ভিডিও + অডিও ইনপুট 2 মিনিটের মধ্যে সীমাবদ্ধ।
সেশন কনটেক্সট উইন্ডো ১২৮,০০০ টোকেনের মধ্যে সীমাবদ্ধ।
হারের সীমা
Live API ফায়ারবেস প্রকল্পের জন্য সমসাময়িক সেশনের পাশাপাশি টোকেন প্রতি মিনিট (TPM) উভয়ের জন্যই হারের সীমা রয়েছে।
জেমিনি ডেভেলপার এপিআই :
- আপনার প্রকল্পের জেমিনি ডেভেলপার API "ব্যবহার স্তর" এর উপর ভিত্তি করে সীমা পরিবর্তিত হয় (তাদের হার সীমা ডকুমেন্টেশন দেখুন)
ভার্টেক্স এআই জেমিনি এপিআই :
- প্রতি ফায়ারবেস প্রকল্পে ৫,০০০টি একযোগে সেশন
- প্রতি মিনিটে ৪ মিলিয়ন টোকেন
অডিও ফর্ম্যাট
Live API নিম্নলিখিত অডিও ফর্ম্যাটগুলিকে সমর্থন করে:
- ইনপুট অডিও ফর্ম্যাট: ১৬kHz লিটল-এন্ডিয়ানে কাঁচা ১৬ বিট পিসিএম অডিও
- আউটপুট অডিও ফর্ম্যাট: 24kHz লিটল-এন্ডিয়ানে কাঁচা 16 বিট PCM অডিও
ইনপুট অডিওর নমুনা হার বোঝাতে, প্রতিটি অডিও-ধারণকারী Blob-এর MIME প্রকারকে audio/pcm;rate=16000 এর মতো একটি মানের উপর সেট করুন।
ভিডিও ফর্ম্যাট
Live API বিচ্ছিন্ন চিত্র ফ্রেমের একটি ক্রম আশা করে এবং প্রতি সেকেন্ডে ১ ফ্রেম (FPS) এ ভিডিও ফ্রেম ইনপুট সমর্থন করে। সেরা ফলাফলের জন্য, ১ FPS এ নেটিভ ৭৬৮x৭৬৮ রেজোলিউশন ব্যবহার করুন।
মনে রাখবেন যে এই স্পেসিফিকেশনটি দ্রুত পরিবর্তনশীল ভিডিও বিশ্লেষণের প্রয়োজন হয় এমন ব্যবহারের ক্ষেত্রে Live API অনুপযুক্ত করে তোলে, যেমন উচ্চ-গতির খেলাধুলায় প্লে-বাই-প্লে।
প্রতিক্রিয়া কণ্ঠস্বর
Live API নিম্নলিখিত প্রতিক্রিয়া ভয়েস বিকল্পগুলিকে সমর্থন করে। প্রতিটি ভয়েস কেমন শোনাচ্ছে তার ডেমোগুলির জন্য, Chirp 3: HD ভয়েসেস দেখুন।
যদি আপনি একটি প্রতিক্রিয়া ভয়েস নির্দিষ্ট না করেন, তাহলে ডিফল্ট হল Puck ।
প্রতিক্রিয়ার কণ্ঠস্বর কীভাবে নির্দিষ্ট করতে হয় তা শিখুন।
Zephyr -- উজ্জ্বলKore -- ফার্মOrus -- ফার্মAutonoe -- উজ্জ্বলUmbriel -- শান্ত-সুলভErinome -- পরিষ্কারLaomedeia -- উচ্ছ্বসিতSchedar -- জোড়Achird -- বন্ধুত্বপূর্ণSadachbia -- প্রাণবন্ত | Puck -- উচ্ছ্বসিতFenrir -- উত্তেজনাপূর্ণAoede -- হাওয়ালাEnceladus -- শ্বাসরুদ্ধকরAlgieba -- মসৃণAlgenib -- গ্রেভেলিAchernar -- নরমGacrux -- পরিণতZubenelgenubi -- ক্যাজুয়ালSadaltager -- জ্ঞানী | Charon -- তথ্যবহুলLeda -- তরুণCallirrhoe -- আরামদায়কIapetus -- পরিষ্কারDespina -- মসৃণRasalgethi -- তথ্যবহুলAlnilam -- দৃঢ়Pulcherrima -- ফরোয়ার্ডVindemiatrix -- ভদ্রSulafat -- উষ্ণ |
ভাষাসমূহ
Live API নিম্নলিখিত ভাষাগুলিকে সমর্থন করে। প্রতিক্রিয়া ভাষাকে কীভাবে প্রভাবিত করতে হয় তা শিখুন।
| ভাষা | BCP-47 কোড | ভাষা | BCP-47 কোড |
|---|---|---|---|
| আরবি (মিশরীয়) | এআর-ইজি | জার্মান (জার্মানি) | ডি-ডি |
| ইংরেজি (মার্কিন) | en-US সম্পর্কে | স্প্যানিশ (মার্কিন) | মার্কিন যুক্তরাষ্ট্র |
| ফরাসি (ফ্রান্স) | fr-FR সম্পর্কে | হিন্দি (ভারত) | হাই-ইন |
| ইন্দোনেশিয়ান (ইন্দোনেশিয়া) | আইডি-আইডি | ইতালীয় (ইতালি) | এটি-আইটি |
| জাপানি (জাপান) | জা-জেপি | কোরিয়ান (কোরিয়া) | কো-কেআর |
| পর্তুগিজ (ব্রাজিল) | pt-BR সম্পর্কে | রাশিয়ান (রাশিয়া) | ru-RU |
| ডাচ (নেদারল্যান্ডস) | nl-NL সম্পর্কে | পোলিশ (পোল্যান্ড) | পিএল-পিএল |
| থাই (থাইল্যান্ড) | ম-ম | তুর্কি (তুরস্ক) | টিআর-টিআর |
| ভিয়েতনামী (ভিয়েতনাম) | ভিআই-ভিএন | রোমানিয়ান (রোমানিয়া) | ro-RO |
| ইউক্রেনীয় (ইউক্রেন) | যুক্তরাজ্য-ইউএ | বাংলা (বাংলাদেশ) | বিএন-বিডি |
| ইংরেজি (ভারত) | এন-ইন এবং হাই-ইন বান্ডেল | মারাঠি (ভারত) | মিস্টার-ইন |
| তামিল (ভারত) | টা-ইন | তেলেগু (ভারত) | te-IN সম্পর্কে |