Imagen দিয়ে আউটপেইন্টিং ব্যবহার করে একটি ছবির বিষয়বস্তু প্রসারিত করুন


এই পৃষ্ঠাটি বর্ণনা করে যে কীভাবে ফায়ারবেস এআই লজিক এসডিকে ব্যবহার করে ইমেজেন ব্যবহার করে আউটপেইন্টিং ব্যবহার করে কোনও ছবির মূল সীমানা ছাড়িয়ে যাওয়ার বিষয়বস্তু প্রসারিত করা যায়

আউটপেইন্টিং হলো এক ধরণের মাস্ক-ভিত্তিক সম্পাদনামাস্ক হলো একটি ডিজিটাল ওভারলে যা আপনি যে নির্দিষ্ট এলাকাটি সম্পাদনা করতে চান তা নির্ধারণ করে।

এটি কীভাবে কাজ করে : আপনি একটি আসল ছবি এবং একটি সংশ্লিষ্ট মুখোশযুক্ত ছবি প্রদান করেন — হয় স্বয়ংক্রিয়ভাবে তৈরি অথবা আপনার দ্বারা সরবরাহিত — যা নতুন, প্রসারিত এলাকার একটি মুখোশ নির্ধারণ করে। আপনি ঐচ্ছিকভাবে প্রসারিত এলাকায় আপনি কী চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও প্রদান করতে পারেন, অথবা মডেল বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে পারে যে বিদ্যমান দৃশ্যটি যুক্তিসঙ্গতভাবে কী চালিয়ে যাবে। মডেলটি নতুন বিষয়বস্তু তৈরি করে এবং মুখোশযুক্ত এলাকা পূরণ করে।

উদাহরণস্বরূপ, আপনি একটি ছবির আকৃতির অনুপাত পরিবর্তন করতে পারেন অথবা আরও পটভূমির প্রসঙ্গ যোগ করতে পারেন।

কোডে যান

শুরু করার আগে

শুধুমাত্র আপনার API প্রদানকারী হিসেবে Vertex AI Gemini API ব্যবহার করলেই এটি উপলব্ধ।

যদি আপনি ইতিমধ্যেই না করে থাকেন, তাহলে শুরু করার নির্দেশিকাটি সম্পূর্ণ করুন, যেখানে আপনার Firebase প্রকল্পটি কীভাবে সেট আপ করবেন, আপনার অ্যাপটিকে Firebase-এর সাথে সংযুক্ত করবেন, SDK যোগ করবেন, আপনার নির্বাচিত API প্রদানকারীর জন্য ব্যাকএন্ড পরিষেবা শুরু করবেন এবং একটি ImagenModel ইনস্ট্যান্স তৈরি করবেন তা বর্ণনা করা হয়েছে।

এই ক্ষমতা সমর্থন করে এমন মডেলগুলি

ইমেজেন তার capability মডেলের মাধ্যমে চিত্র সম্পাদনা প্রদান করে:

  • imagen-3.0-capability-001

মনে রাখবেন যে Imagen মডেলের জন্য, global অবস্থান সমর্থিত নয়

ছবির কন্টেন্ট প্রসারিত করুন

এই নমুনাটি চেষ্টা করার আগে, আপনার প্রকল্প এবং অ্যাপ সেট আপ করতে এই নির্দেশিকার "শুরু করার আগে" বিভাগটি সম্পূর্ণ করুন।

নিচের নমুনাটি দেখায় কিভাবে একটি ছবিকে তার মূল সীমানার বাইরে প্রসারিত করা যায় — আপনার দেওয়া ছবিতে সংজ্ঞায়িত একটি মাস্ক ব্যবহার করে। আপনি আসল ছবি, একটি টেক্সট প্রম্পট এবং মাস্ক করা ছবি প্রদান করেন। মূল এবং মাস্ক করা ছবি সম্পর্কে নিম্নলিখিত বিষয়গুলি লক্ষ্য করুন:

  • মুখোশযুক্ত ছবিতে চূড়ান্ত আউটপেইন্ট করা ছবির লক্ষ্য আকারের পিক্সেল মাত্রা থাকতে হবে।

  • মূল ছবিতে অবশ্যই অতিরিক্ত প্যাডিং থাকতে হবে যাতে মুখোশযুক্ত ছবির পিক্সেল মাত্রার সাথে মেলে।

যদি আপনি চান যে মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নেবে যে বিদ্যমান দৃশ্যটি কী যুক্তিসঙ্গতভাবে অব্যাহত রাখবে, তাহলে একটি টেক্সট প্রম্পট প্রদান করা ঐচ্ছিক। যদি আপনি প্রসারিত এলাকার মধ্যে নির্দিষ্ট বিষয়বস্তু চান, তাহলে আপনাকে একটি টেক্সট প্রম্পটে তা উল্লেখ করতে হবে।

সুইফট

Swift-এর জন্য Imagen মডেলের মাধ্যমে ছবি সম্পাদনা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!

Kotlin

একটি ছবি প্রসারিত করতে, editImage() ব্যবহার করুন এবং সম্পাদনা কনফিগারেশনটি ImagenEditMode.OUTPAINT ব্যবহার করে সেট করুন।
মনে রাখবেন যে আপনি ঐচ্ছিকভাবে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন, এবং আপনাকে সম্পাদনা মোড নির্দিষ্ট করার প্রয়োজন নেই।

আউটপেইন্টিংয়ের নমুনা কোডের জন্য কুইকস্টার্টটি দেখুন।

Java

একটি ছবি প্রসারিত করতে, editImage() ব্যবহার করুন এবং সম্পাদনা কনফিগারেশনটি ImagenEditMode.OUTPAINT ব্যবহার করে সেট করুন।
মনে রাখবেন যে আপনি ঐচ্ছিকভাবে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন, এবং আপনাকে সম্পাদনা মোড নির্দিষ্ট করার প্রয়োজন নেই।

আউটপেইন্টিংয়ের নমুনা কোডের জন্য কুইকস্টার্টটি দেখুন।

Web

ওয়েব অ্যাপের জন্য ইমেজেন মডেলের মাধ্যমে ছবি সম্পাদনা করা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!

Dart

একটি ছবি প্রসারিত করতে, editImage() ব্যবহার করুন এবং সম্পাদনা কনফিগারেশনটি ImagenEditMode.OUTPAINT ব্যবহার করে সেট করুন।

আউটপেইন্টিংয়ের নমুনা কোডের জন্য কুইকস্টার্টটি দেখুন।

ঐক্য

ইউনিটিতে ইমেজেন মডেলের মাধ্যমে ছবি সম্পাদনা করা যাবে না। এই বছরের শেষের দিকে আবার দেখুন!

সর্বোত্তম অনুশীলন এবং সীমাবদ্ধতা

আমরা ছবি সম্পাদনা করার সময় মাস্কটি প্রসারিত করার পরামর্শ দিই। এটি সম্পাদনার সীমানা মসৃণ করতে এবং এটিকে আরও বিশ্বাসযোগ্য করে তুলতে সাহায্য করতে পারে। সাধারণত, 1% বা 2% ( 0.01 বা 0.02 ) এর প্রসারণ মান সুপারিশ করা হয়।


Firebase AI Logic এর সাথে আপনার অভিজ্ঞতা সম্পর্কে মতামত দিন।