লাইভ এপিআই-এর সীমা এবং স্পেসিফিকেশন


এই পৃষ্ঠায় Live API এবং এর মডেলগুলো ব্যবহারের বিভিন্ন সীমাবদ্ধতা ও নির্দিষ্টকরণ বর্ণনা করা হয়েছে।

সেশন-সম্পর্কিত সীমা

Live API ক্ষেত্রে, সেশন বলতে এমন একটি স্থায়ী সংযোগকে বোঝায় যেখানে একটি সংযোগের মাধ্যমে ইনপুট এবং আউটপুট অবিচ্ছিন্নভাবে প্রবাহিত হয়।

সেশনটি নিম্নলিখিত সীমাগুলির কোনোটি অতিক্রম করলে, সংযোগটি বিচ্ছিন্ন হয়ে যায়। তবে, মনে রাখবেন যে, এই সেশন-সম্পর্কিত সীমাগুলি পরিচালনা করার জন্য Live API কিছু বিকল্প প্রদান করে (নীচে দেখুন)।

  • সেশন কনটেক্সট উইন্ডো ১২৮কে টোকেনে সীমাবদ্ধ।

    এই কনটেক্সট উইন্ডো সীমাবদ্ধতার কারণে, ইনপুট মোডালিটির উপর ভিত্তি করে আনুমানিক সর্বোচ্চ সেশন দৈর্ঘ্য নিচে দেওয়া হলো:

    • শুধুমাত্র অডিও ইনপুট সেশন ১৫ মিনিটের মধ্যে সীমাবদ্ধ।
    • ভিডিও ও অডিও ইনপুটের সময়সীমা ২ মিনিট
  • সংযোগের মেয়াদ প্রায় ১০ মিনিট পর্যন্ত সীমিত।

    সংযোগ শেষ হওয়ার প্রায় ৬০ সেকেন্ড আগে আপনি একটি বিদায়ী বিজ্ঞপ্তি পাবেন।

সেশন-সম্পর্কিত সীমাগুলো পরিচালনা করার জন্য এখানে কিছু বিকল্প দেওয়া হলো:

সেশন ব্যবস্থাপনা সম্পর্কে আরও জানুন।

হারের সীমা

Live API প্রতিটি ফায়ারবেস প্রজেক্টের জন্য একযোগে সেশন এবং প্রতি মিনিটে টোকেন (TPM) উভয়ের জন্যই রেট লিমিট রয়েছে।

  • জেমিনি ডেভেলপার এপিআই :

  • ভার্টেক্স এআই জেমিনি এপিআই :

    • প্রতিটি ফায়ারবেস প্রোজেক্টে ১,০০০টি যুগপৎ সেশন
    • প্রতি মিনিটে ৪ মিলিয়ন টোকেন

অডিও ফরম্যাট

Live API নিম্নলিখিত অডিও ফরম্যাটগুলো সমর্থন করে:

  • ইনপুট অডিও ফরম্যাট: ১৬ কিলোহার্টজ লিটল-এন্ডিয়ানে র ১৬ বিট পিসিএম অডিও
  • আউটপুট অডিও ফরম্যাট: ২৪ কিলোহার্টজ লিটল-এন্ডিয়ানে র ১৬ বিট পিসিএম অডিও

  • সমর্থিত MIME টাইপসমূহ : audio/x-aac , audio/flac , audio/mp3 , audio/m4a , audio/mpeg , audio/mpga , audio/mp4 , audio/ogg , audio/pcm , audio/wav , audio/webm

ইনপুট অডিওর স্যাম্পল রেট জানাতে, অডিও ধারণকারী প্রতিটি Blob-এর MIME টাইপকে audio/pcm;rate=16000 এর মতো কোনো মানে সেট করুন।

ভিডিও ফরম্যাট

Live API একাধিক বিচ্ছিন্ন ইমেজ ফ্রেমের একটি ক্রম আশা করে এবং প্রতি সেকেন্ডে ১ ফ্রেম (FPS) হারে ভিডিও ফ্রেম ইনপুট সমর্থন করে।

  • সুপারিশকৃত ইনপুট : নেটিভ ৭৬৮x৭৬৮ রেজোলিউশন, ১ এফপিএস।

  • সমর্থিত MIME টাইপসমূহ : video/x-flv , video/quicktime , video/mpeg , video/mpegs , video/mpg , video/mp4 , video/webm , video/wmv , video/3gpp

উল্লেখ্য যে, এই স্পেসিফিকেশনটি Live API এমন সব ব্যবহারের ক্ষেত্রে অনুপযুক্ত করে তোলে যেখানে দ্রুত পরিবর্তনশীল ভিডিও বিশ্লেষণ করার প্রয়োজন হয়, যেমন দ্রুতগতির খেলাধুলার প্লে-বাই-প্লে ধারাভাষ্য।

প্রতিক্রিয়া কণ্ঠস্বর

Live API নিম্নলিখিত প্রতিক্রিয়া ভয়েস বিকল্পগুলি সমর্থন করে। প্রতিটি ভয়েস শুনতে কেমন তা জানতে, Chirp 3: HD voices দেখুন।

আপনি যদি কোনো প্রতিক্রিয়া কণ্ঠস্বর নির্দিষ্ট না করেন, তাহলে ডিফল্ট হিসেবে Puck ব্যবহৃত হয়।

প্রতিক্রিয়ার কণ্ঠস্বর কীভাবে নির্দিষ্ট করতে হয় তা জানুন।

Zephyr -- ব্রাইট
Kore -- ফার্ম
Orus -- ফার্ম
Autonoe -- Bright
Umbriel -- সহজ-সরল
Erinome -- পরিষ্কার
Laomedeia -- উচ্ছ্বসিত
Schedar -- এমনকি
Achird -- বন্ধুত্বপূর্ণ
Sadachbia -- প্রাণবন্ত
Puck -- উচ্ছ্বসিত
Fenrir -- উত্তেজিত
Aoede -- Breezy
Enceladus -- শ্বাসপ্রশ্বাসযুক্ত
Algieba -- মসৃণ
Algenib -- গ্র্যাভেলি
Achernar -- নরম
Gacrux -- পরিপক্ক
Zubenelgenubi -- Casual
Sadaltager -- জ্ঞানী
Charon -- তথ্যমূলক
Leda -- যুবতী
Callirrhoe -- সহজ-সরল
Iapetus -- পরিষ্কার
Despina -- মসৃণ
Rasalgethi -- তথ্যমূলক
Alnilam -- ফার্ম
Pulcherrima -- ফরোয়ার্ড
Vindemiatrix -- কোমল
Sulafat -- উষ্ণ

ভাষা

Live API নিম্নলিখিত ভাষাগুলো সমর্থন করে। প্রতিক্রিয়ার ভাষা কীভাবে প্রভাবিত করা যায় তা জানুন।

ভাষা বিসিপি-৪৭ কোড ভাষা বিসিপি-৪৭ কোড
আরবি (মিশরীয়) ar-EG জার্মান (জার্মানি) ডি-ডিই
ইংরেজি (মার্কিন যুক্তরাষ্ট্র) en-US স্প্যানিশ (মার্কিন যুক্তরাষ্ট্র) es-US
ফরাসি (ফ্রান্স) fr-FR হিন্দি (ভারত) হাই-ইন
ইন্দোনেশিয়ান (ইন্দোনেশিয়া) আইডি-আইডি ইতালীয় (ইতালি) আইটি-আইটি
জাপানি (জাপান) জা-জেপি কোরিয়ান (কোরিয়া) কো-কেআর
পর্তুগিজ (ব্রাজিল) পিটি-বিআর রাশিয়ান (রাশিয়া) ru-RU
ডাচ (নেদারল্যান্ডস) এনএল-এনএল পোলিশ (পোল্যান্ড) pl-PL
থাই (থাইল্যান্ড) তম-টিএইচ তুর্কি (তুরস্ক) tr-TR
ভিয়েতনামী (ভিয়েতনাম) ভি-ভিএন রোমানিয়ান (রোমানিয়া) ro-RO
ইউক্রেনীয় (ইউক্রেন) ইউকে-ইউএ বাংলা (বাংলাদেশ) bn-BD
ইংরেজি (ভারত) en-IN এবং hi-IN বান্ডেল মারাঠি (ভারত) মিঃ-আইএন
তামিল (ভারত) তা-আইএন তেলুগু (ভারত) te-IN