লাইভ এপিআই-এর সীমা এবং স্পেসিফিকেশন


এই পৃষ্ঠায় Live API এবং এর মডেলগুলো ব্যবহারের বিভিন্ন সীমাবদ্ধতা ও নির্দিষ্টকরণ বর্ণনা করা হয়েছে।

সেশন-সম্পর্কিত সীমা

Live API ক্ষেত্রে, সেশন বলতে এমন একটি স্থায়ী সংযোগকে বোঝায় যেখানে একই সংযোগের মাধ্যমে ইনপুট এবং আউটপুট অবিচ্ছিন্নভাবে প্রবাহিত হয়।

সেশনটি নিম্নলিখিত সীমাগুলোর কোনোটি অতিক্রম করলে, সংযোগটি বিচ্ছিন্ন হয়ে যায়।

  • সংযোগের মেয়াদ প্রায় ১০ মিনিট পর্যন্ত সীমিত।

  • সেশনের দৈর্ঘ্য ইনপুট পদ্ধতির উপর নির্ভর করে:

    • শুধুমাত্র অডিও ইনপুট সেশন ১৫ মিনিটের মধ্যে সীমাবদ্ধ।
    • ভিডিও ও অডিও ইনপুটের সময়সীমা ২ মিনিট।
  • সেশন কনটেক্সট উইন্ডো ১২৮কে টোকেনে সীমাবদ্ধ।

সংযোগ শেষ হওয়ার আগে আপনি একটি বিদায়ী বিজ্ঞপ্তি পাবেন, যা আপনাকে পরবর্তী পদক্ষেপ নেওয়ার সুযোগ দেবে।

সেশন ব্যবস্থাপনা সম্পর্কে আরও জানুন।

হারের সীমা

Live API প্রতিটি ফায়ারবেস প্রজেক্টের জন্য একযোগে সেশন এবং প্রতি মিনিটে টোকেন (TPM) উভয়েরই রেট লিমিট রয়েছে।

  • জেমিনি ডেভেলপার এপিআই :

  • ভার্টেক্স এআই জেমিনি এপিআই :

    • প্রতিটি ফায়ারবেস প্রোজেক্টে ১,০০০টি যুগপৎ সেশন
    • প্রতি মিনিটে ৪ মিলিয়ন টোকেন

অডিও ফরম্যাট

Live API নিম্নলিখিত অডিও ফরম্যাটগুলো সমর্থন করে:

  • ইনপুট অডিও ফরম্যাট: ১৬ কিলোহার্টজ লিটল-এন্ডিয়ানে র ১৬ বিট পিসিএম অডিও
  • আউটপুট অডিও ফরম্যাট: ২৪ কিলোহার্টজ লিটল-এন্ডিয়ানে র ১৬ বিট পিসিএম অডিও

  • সমর্থিত MIME টাইপসমূহ : audio/x-aac , audio/flac , audio/mp3 , audio/m4a , audio/mpeg , audio/mpga , audio/mp4 , audio/ogg , audio/pcm , audio/wav , audio/webm

ইনপুট অডিওর স্যাম্পল রেট জানাতে, অডিও ধারণকারী প্রতিটি Blob-এর MIME টাইপকে audio/pcm;rate=16000 এর মতো কোনো মানে সেট করুন।

ভিডিও ফরম্যাট

Live API একাধিক বিচ্ছিন্ন ইমেজ ফ্রেমের একটি ক্রম আশা করে এবং প্রতি সেকেন্ডে ১ ফ্রেম (FPS) হারে ভিডিও ফ্রেম ইনপুট সমর্থন করে।

  • সুপারিশকৃত ইনপুট : নেটিভ ৭৬৮x৭৬৮ রেজোলিউশন, ১ এফপিএস।

  • সমর্থিত MIME টাইপসমূহ : video/x-flv , video/quicktime , video/mpeg , video/mpegs , video/mpg , video/mp4 , video/webm , video/wmv , video/3gpp

উল্লেখ্য যে, এই স্পেসিফিকেশনটি Live API এমন সব ব্যবহারের ক্ষেত্রে অনুপযুক্ত করে তোলে যেখানে দ্রুত পরিবর্তনশীল ভিডিও বিশ্লেষণ করার প্রয়োজন হয়, যেমন দ্রুতগতির খেলাধুলার প্লে-বাই-প্লে ধারাভাষ্য।

প্রতিক্রিয়া কণ্ঠস্বর

Live API নিম্নলিখিত প্রতিক্রিয়া ভয়েস বিকল্পগুলি সমর্থন করে। প্রতিটি ভয়েস শুনতে কেমন তা জানতে, Chirp 3: HD voices দেখুন।

আপনি যদি কোনো প্রতিক্রিয়া কণ্ঠস্বর নির্দিষ্ট না করেন, তাহলে ডিফল্ট হিসেবে Puck ব্যবহৃত হয়।

প্রতিক্রিয়ার কণ্ঠস্বর কীভাবে নির্দিষ্ট করতে হয় তা জানুন।

Zephyr -- ব্রাইট
Kore -- ফার্ম
Orus -- ফার্ম
Autonoe -- Bright
Umbriel -- সহজ-সরল
Erinome -- পরিষ্কার
Laomedeia -- উচ্ছ্বসিত
Schedar -- এমনকি
Achird -- বন্ধুত্বপূর্ণ
Sadachbia -- প্রাণবন্ত
Puck -- উচ্ছ্বসিত
Fenrir -- উত্তেজিত
Aoede -- Breezy
Enceladus -- শ্বাসপ্রশ্বাসযুক্ত
Algieba -- মসৃণ
Algenib -- গ্র্যাভেলি
Achernar -- নরম
Gacrux -- পরিপক্ক
Zubenelgenubi -- Casual
Sadaltager -- জ্ঞানী
Charon -- তথ্যমূলক
Leda -- যুবতী
Callirrhoe -- সহজ-সরল
Iapetus -- পরিষ্কার
Despina -- মসৃণ
Rasalgethi -- তথ্যমূলক
Alnilam -- ফার্ম
Pulcherrima -- ফরোয়ার্ড
Vindemiatrix -- কোমল
Sulafat -- উষ্ণ

ভাষা

Live API নিম্নলিখিত ভাষাগুলো সমর্থন করে। প্রতিক্রিয়ার ভাষা কীভাবে প্রভাবিত করা যায় তা জানুন।

ভাষা বিসিপি-৪৭ কোড ভাষা বিসিপি-৪৭ কোড
আরবি (মিশরীয়) ar-EG জার্মান (জার্মানি) ডি-ডিই
ইংরেজি (মার্কিন যুক্তরাষ্ট্র) en-US স্প্যানিশ (মার্কিন যুক্তরাষ্ট্র) es-US
ফরাসি (ফ্রান্স) fr-FR হিন্দি (ভারত) হাই-ইন
ইন্দোনেশিয়ান (ইন্দোনেশিয়া) আইডি-আইডি ইতালীয় (ইতালি) আইটি-আইটি
জাপানি (জাপান) জা-জেপি কোরিয়ান (কোরিয়া) কো-কেআর
পর্তুগিজ (ব্রাজিল) পিটি-বিআর রাশিয়ান (রাশিয়া) ru-RU
ডাচ (নেদারল্যান্ডস) এনএল-এনএল পোলিশ (পোল্যান্ড) pl-PL
থাই (থাইল্যান্ড) তম-টিএইচ তুর্কি (তুরস্ক) tr-TR
ভিয়েতনামী (ভিয়েতনাম) ভি-ভিএন রোমানিয়ান (রোমানিয়া) ro-RO
ইউক্রেনীয় (ইউক্রেন) ইউকে-ইউএ বাংলা (বাংলাদেশ) bn-BD
ইংরেজি (ভারত) en-IN এবং hi-IN বান্ডেল মারাঠি (ভারত) মিঃ-আইএন
তামিল (ভারত) তা-আইএন তেলুগু (ভারত) te-IN