Gemini API ব্যবহার করে কাঠামোবদ্ধ আউটপুট (যেমন JSON) তৈরি করুন, Gemini API ব্যবহার করে কাঠামোগত আউটপুট (যেমন JSON) তৈরি করুন


Gemini API ডিফল্টরূপে অসংগঠিত পাঠ্য হিসাবে প্রতিক্রিয়া প্রদান করে। যাইহোক, কিছু ব্যবহারের ক্ষেত্রে JSON এর মতো কাঠামোবদ্ধ পাঠ্য প্রয়োজন। উদাহরণস্বরূপ, আপনি অন্যান্য ডাউনস্ট্রিম কাজের জন্য প্রতিক্রিয়া ব্যবহার করতে পারেন যার জন্য একটি প্রতিষ্ঠিত ডেটা স্কিমা প্রয়োজন।

মডেলের তৈরি আউটপুট সর্বদা একটি নির্দিষ্ট স্কিমা মেনে চলে তা নিশ্চিত করতে, আপনি একটি প্রতিক্রিয়া স্কিমা সংজ্ঞায়িত করতে পারেন, যা মডেল প্রতিক্রিয়াগুলির জন্য একটি ব্লুপ্রিন্টের মতো কাজ করে৷ তারপরে আপনি কম পোস্ট-প্রসেসিং সহ মডেলের আউটপুট থেকে সরাসরি ডেটা বের করতে পারেন।

এখানে কিছু উদাহরণ আছে:

  • নিশ্চিত করুন যে একটি মডেলের প্রতিক্রিয়া বৈধ JSON তৈরি করে এবং আপনার প্রদত্ত স্কিমার সাথে সামঞ্জস্যপূর্ণ।
    উদাহরণস্বরূপ, মডেলটি রেসিপিগুলির জন্য কাঠামোগত এন্ট্রি তৈরি করতে পারে যা সর্বদা রেসিপির নাম, উপাদানগুলির তালিকা এবং পদক্ষেপগুলি অন্তর্ভুক্ত করে। তারপরে আপনি আপনার অ্যাপের UI-তে এই তথ্যটি আরও সহজে পার্স এবং প্রদর্শন করতে পারেন।

  • শ্রেণীবিন্যাস কাজের সময় একটি মডেল কীভাবে প্রতিক্রিয়া জানাতে পারে তা সীমাবদ্ধ করুন।
    উদাহরণ স্বরূপ, আপনি মডেলটি তৈরি করে এমন লেবেলের পরিবর্তে লেবেলগুলির একটি নির্দিষ্ট সেট (উদাহরণস্বরূপ, positive এবং negative এনামগুলির একটি নির্দিষ্ট সেট) সহ মডেল টীকা পাঠ রাখতে পারেন (যেটিতে good , positive , negative বা bad মতো পরিবর্তনশীলতার একটি ডিগ্রি থাকতে পারে)।

এই নির্দেশিকা আপনাকে দেখায় কিভাবে জেএসওএন আউটপুট জেনারেট করতে একটি কলে responseSchema প্রদান করে generateContent এটি শুধুমাত্র টেক্সট-ইনপুটের উপর ফোকাস করে, কিন্তু জেমিনি মাল্টিমোডাল অনুরোধের জন্য কাঠামোগত প্রতিক্রিয়াও তৈরি করতে পারে যাতে ইনপুট হিসাবে ছবি, ভিডিও এবং অডিও অন্তর্ভুক্ত থাকে।

এই পৃষ্ঠার নীচে আরও উদাহরণ রয়েছে, যেমন আউটপুট হিসাবে enum মান কীভাবে তৈরি করা যায় । আপনি কীভাবে কাঠামোগত আউটপুট তৈরি করতে পারেন তার অতিরিক্ত উদাহরণ দেখতে, Google Cloud ডকুমেন্টেশনে উদাহরণ স্কিমা এবং মডেল প্রতিক্রিয়াগুলির তালিকাটি দেখুন।

আপনি শুরু করার আগে

আপনি যদি ইতিমধ্যেই না করে থাকেন, Firebase SDK-তে Vertex AI-এর জন্য শুরু করার নির্দেশিকাটি সম্পূর্ণ করুন। নিশ্চিত করুন যে আপনি নিম্নলিখিত সমস্ত কাজ করেছেন:

  1. ব্লেজ প্রাইসিং প্ল্যান ব্যবহার করা এবং প্রয়োজনীয় এপিআই সক্ষম করা সহ একটি নতুন বা বিদ্যমান ফায়ারবেস প্রকল্প সেট আপ করুন৷

  2. আপনার অ্যাপটি রেজিস্টার করা এবং আপনার অ্যাপে আপনার Firebase কনফিগার যোগ করা সহ আপনার অ্যাপটিকে Firebase-এ সংযুক্ত করুন।

  3. SDK যোগ করুন এবং আপনার অ্যাপে Vertex AI পরিষেবা এবং জেনারেটিভ মডেল শুরু করুন।

আপনি আপনার অ্যাপটিকে Firebase-এ সংযুক্ত করার পরে, SDK যোগ করার পরে এবং Vertex AI পরিষেবা এবং জেনারেটিভ মডেল শুরু করার পরে, আপনি Gemini API কল করতে প্রস্তুত৷

ধাপ 1 : একটি প্রতিক্রিয়া স্কিমা সংজ্ঞায়িত করুন

একটি মডেলের আউটপুটের গঠন, ক্ষেত্রের নাম এবং প্রতিটি ক্ষেত্রের জন্য প্রত্যাশিত ডেটা টাইপ নির্দিষ্ট করতে একটি প্রতিক্রিয়া স্কিমা সংজ্ঞায়িত করুন।

যখন একটি মডেল তার প্রতিক্রিয়া তৈরি করে, তখন এটি আপনার প্রম্পট থেকে ক্ষেত্রের নাম এবং প্রসঙ্গ ব্যবহার করে। যাতে আপনার অভিপ্রায় স্পষ্ট হয়, আমরা সুপারিশ করি যে আপনি একটি পরিষ্কার কাঠামো, দ্ব্যর্থহীন ক্ষেত্রের নাম এবং এমনকি প্রয়োজন অনুযায়ী বর্ণনা ব্যবহার করুন।

প্রতিক্রিয়া স্কিমা জন্য বিবেচনা

আপনার প্রতিক্রিয়া স্কিমা লেখার সময় নিম্নলিখিতগুলি মনে রাখবেন:

  • প্রতিক্রিয়া স্কিমার আকার ইনপুট টোকেন সীমার দিকে গণনা করা হয়।

  • প্রতিক্রিয়া স্কিমা বৈশিষ্ট্য নিম্নলিখিত প্রতিক্রিয়া MIME প্রকারগুলিকে সমর্থন করে:

    • application/json : প্রতিক্রিয়া স্কিমাতে সংজ্ঞায়িত হিসাবে আউটপুট JSON (গঠিত আউটপুট প্রয়োজনীয়তার জন্য দরকারী)

    • text/x.enum : রেসপন্স স্কিমাতে সংজ্ঞায়িত একটি enum মান আউটপুট করুন (শ্রেণীবিভাগের কাজের জন্য দরকারী)

  • প্রতিক্রিয়া স্কিমা বৈশিষ্ট্য নিম্নলিখিত স্কিমা ক্ষেত্র সমর্থন করে:

    enum
    items
    maxItems
    nullable
    properties
    required

    আপনি যদি একটি অসমর্থিত ক্ষেত্র ব্যবহার করেন, মডেলটি এখনও আপনার অনুরোধ পরিচালনা করতে পারে, তবে এটি ক্ষেত্রটিকে উপেক্ষা করে। উল্লেখ্য যে উপরের তালিকাটি OpenAPI 3.0 স্কিমা অবজেক্টের একটি উপসেট ( Vertex AI স্কিমা রেফারেন্স দেখুন)।

  • ডিফল্টরূপে, Firebase SDK-তে Vertex AI-এর জন্য, আপনি optionalProperties অ্যারেতে ঐচ্ছিক হিসাবে উল্লেখ না করলে সমস্ত ক্ষেত্রকে প্রয়োজনীয় বলে মনে করা হয়। এই ঐচ্ছিক ক্ষেত্রগুলির জন্য, মডেলটি ক্ষেত্রগুলি পূরণ করতে পারে বা সেগুলি এড়িয়ে যেতে পারে৷

    মনে রাখবেন যে এটিVertex AI Gemini API- এর ডিফল্ট আচরণের বিপরীত।

ধাপ 2 : JSON তৈরি করতে একটি প্রতিক্রিয়া স্কিমা সহ একটি প্রম্পট পাঠান

নিম্নলিখিত উদাহরণ দেখায় কিভাবে কাঠামোগত JSON আউটপুট তৈরি করতে হয়।

স্ট্রাকচার্ড আউটপুট জেনারেট করার জন্য, আপনাকে মডেল ইনিশিয়ালাইজেশনের সময় উপযুক্ত responseMimeType (এই উদাহরণে, application/json ) এবং সেইসাথে responseSchema নির্দিষ্ট করতে হবে যা আপনি মডেলটি ব্যবহার করতে চান।

responseSchema ব্যবহার করা সমস্ত জেমিনি মডেল দ্বারা সমর্থিত ( জেমিনি 1.0 মডেল বাদে)।

import FirebaseVertexAI

// Provide a JSON schema object using a standard format.
// Later, pass this schema object into `responseSchema` in the generation config.
let jsonSchema = Schema.object(
  properties: [
    "characters": Schema.array(
      items: .object(
        properties: [
          "name": .string(),
          "age": .integer(),
          "species": .string(),
          "accessory": .enumeration(values: ["hat", "belt", "shoes"]),
        ],
        optionalProperties: ["accessory"]
      )
    ),
  ]
)

// Initialize the Vertex AI service and the generative model.
let model = VertexAI.vertexAI().generativeModel(
  modelName: "gemini-2.0-flash",
  // In the generation config, set the `responseMimeType` to `application/json`
  // and pass the JSON schema object into `responseSchema`.
  generationConfig: GenerationConfig(
    responseMIMEType: "application/json",
    responseSchema: jsonSchema
  )
)

let prompt = "For use in a children's card game, generate 10 animal-based characters."

let response = try await model.generateContent(prompt)
print(response.text ?? "No text in response.")

আপনার ব্যবহারের ক্ষেত্রে এবং অ্যাপের জন্য উপযুক্ত একটি মডেল এবং ঐচ্ছিকভাবে একটি অবস্থান কীভাবে চয়ন করবেন তা শিখুন।

অতিরিক্ত উদাহরণ

আপনি কীভাবে কাঠামোগত আউটপুট ব্যবহার এবং তৈরি করতে পারেন তার অতিরিক্ত উদাহরণ দেখতে, Google Cloud ডকুমেন্টেশনে উদাহরণ স্কিমা এবং মডেল প্রতিক্রিয়াগুলির তালিকাটি দেখুন।

আউটপুট হিসাবে enum মান তৈরি করুন

নিম্নলিখিত উদাহরণ দেখায় কিভাবে একটি শ্রেণীবিভাগের কাজের জন্য একটি প্রতিক্রিয়া স্কিমা ব্যবহার করতে হয়। মডেলকে তার বর্ণনার উপর ভিত্তি করে একটি সিনেমার ধরণ সনাক্ত করতে বলা হয়। আউটপুট হল একটি প্লেইন-টেক্সট enum মান যা মডেলটি প্রদত্ত প্রতিক্রিয়া স্কিমাতে সংজ্ঞায়িত মানগুলির তালিকা থেকে নির্বাচন করে।

এই কাঠামোবদ্ধ শ্রেণীবিভাগের কাজটি সম্পাদন করার জন্য, আপনাকে মডেল আরম্ভ করার সময় উপযুক্ত responseMimeType (এই উদাহরণে, text/x.enum ) এবং সেইসাথে মডেলটিকে যে responseSchema ব্যবহার করতে চান তা নির্দিষ্ট করতে হবে।

import FirebaseVertexAI

// Provide an enum schema object using a standard format.
// Later, pass this schema object into `responseSchema` in the generation config.
let enumSchema = Schema.enumeration(values: ["drama", "comedy", "documentary"])

// Initialize the Vertex AI service and the generative model.
let model = VertexAI.vertexAI().generativeModel(
  modelName: "gemini-2.0-flash",
  // In the generation config, set the `responseMimeType` to `text/x.enum`
  // and pass the enum schema object into `responseSchema`.
  generationConfig: GenerationConfig(
    responseMIMEType: "text/x.enum",
    responseSchema: enumSchema
  )
)

let prompt = """
The film aims to educate and inform viewers about real-life subjects, events, or people.
It offers a factual record of a particular topic by combining interviews, historical footage,
and narration. The primary purpose of a film is to present information and provide insights
into various aspects of reality.
"""

let response = try await model.generateContent(prompt)
print(response.text ?? "No text in response.")

আপনার ব্যবহারের ক্ষেত্রে এবং অ্যাপের জন্য উপযুক্ত একটি মডেল এবং ঐচ্ছিকভাবে একটি অবস্থান কীভাবে চয়ন করবেন তা শিখুন।

কন্টেন্ট জেনারেশন নিয়ন্ত্রণ করার জন্য অন্যান্য বিকল্প

  • প্রম্পট ডিজাইন সম্পর্কে আরও জানুন যাতে আপনি আপনার প্রয়োজনের জন্য নির্দিষ্ট আউটপুট তৈরি করতে মডেলটিকে প্রভাবিত করতে পারেন।
  • মডেলটি কীভাবে প্রতিক্রিয়া তৈরি করে তা নিয়ন্ত্রণ করতে মডেল প্যারামিটারগুলি কনফিগার করুন। মিথুন মডেলের জন্য, এই পরামিতিগুলির মধ্যে সর্বাধিক আউটপুট টোকেন, তাপমাত্রা, topK এবং topP অন্তর্ভুক্ত রয়েছে। ইমেজেন মডেলের জন্য, এর মধ্যে রয়েছে আকৃতির অনুপাত, ব্যক্তি তৈরি, ওয়াটারমার্কিং ইত্যাদি।
  • ঘৃণাত্মক বক্তব্য এবং যৌনতাপূর্ণ বিষয়বস্তু সহ ক্ষতিকারক বলে বিবেচিত প্রতিক্রিয়া পাওয়ার সম্ভাবনা সামঞ্জস্য করতে নিরাপত্তা সেটিংস ব্যবহার করুন৷
  • মডেলের আচরণ পরিচালনা করতে সিস্টেম নির্দেশাবলী সেট করুন। এই বৈশিষ্ট্যটি একটি "প্রস্তাবনা" এর মতো যা আপনি মডেলটি শেষ ব্যবহারকারীর কাছ থেকে আরও নির্দেশাবলীর সংস্পর্শে আসার আগে যোগ করেন।


Firebase-এ Vertex AI-এর সাথে আপনার অভিজ্ঞতা সম্পর্কে মতামত দিন