Firebase AI Logic SDKs ব্যবহার করে একটি ছবির বিষয়বস্তু তার মূল সীমানার বাইরে প্রসারিত করতে Imagen ব্যবহার করে কিভাবে আউটপেইন্টিং ব্যবহার করতে হয় এই পৃষ্ঠাটি বর্ণনা করে।
আউটপেইন্টিং হল এক ধরনের মুখোশ-ভিত্তিক সম্পাদনা । একটি মুখোশ হল একটি ডিজিটাল ওভারলে যা আপনি যে নির্দিষ্ট এলাকা সম্পাদনা করতে চান তা সংজ্ঞায়িত করে।
এটি কীভাবে কাজ করে : আপনি একটি আসল চিত্র এবং একটি সংশ্লিষ্ট মুখোশযুক্ত চিত্র প্রদান করেন — হয় স্বয়ংক্রিয়ভাবে তৈরি বা আপনার দ্বারা সরবরাহ করা — যা নতুন, প্রসারিত এলাকার একটি মুখোশ সংজ্ঞায়িত করে৷ আপনি ঐচ্ছিকভাবে প্রসারিত এলাকায় আপনি কী চান তা বর্ণনা করে একটি পাঠ্য প্রম্পট প্রদান করতে পারেন, অথবা মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে পারে যে বিদ্যমান দৃশ্যটি যৌক্তিকভাবে চালিয়ে যাবে। মডেলটি নতুন বিষয়বস্তু তৈরি করে এবং মুখোশযুক্ত এলাকায় পূরণ করে।
উদাহরণস্বরূপ, আপনি একটি চিত্রের আকৃতির অনুপাত পরিবর্তন করতে পারেন বা আরও পটভূমির প্রসঙ্গ যোগ করতে পারেন৷
আপনি শুরু করার আগে
আপনার API প্রদানকারী হিসাবে Vertex AI Gemini API ব্যবহার করার সময় শুধুমাত্র উপলব্ধ। |
যদি আপনি ইতিমধ্যেই না করে থাকেন, শুরু করার নির্দেশিকাটি সম্পূর্ণ করুন, যা বর্ণনা করে যে কীভাবে আপনার Firebase প্রকল্প সেট আপ করবেন, আপনার অ্যাপকে Firebase-এর সাথে সংযুক্ত করবেন, SDK যোগ করবেন, আপনার নির্বাচিত API প্রদানকারীর জন্য ব্যাকএন্ড পরিষেবা শুরু করবেন এবং একটি ImagenModel
উদাহরণ তৈরি করবেন।
মডেল যে এই ক্ষমতা সমর্থন করে
ইমেজেন তার capability
মডেলের মাধ্যমে চিত্র সম্পাদনা অফার করে:
-
imagen-3.0-capability-001
মনে রাখবেন যে Imagen মডেলের জন্য, global
অবস্থান সমর্থিত নয় ।
একটি ছবির বিষয়বস্তু প্রসারিত করুন
এই নমুনাটি চেষ্টা করার আগে, আপনার প্রকল্প এবং অ্যাপ সেট আপ করতে এই গাইডের শুরু করার আগে বিভাগটি সম্পূর্ণ করুন। |
নিচের নমুনাটি দেখায় কিভাবে একটি ছবিকে তার আসল সীমানার বাইরে প্রসারিত করতে হয় — আপনার দেওয়া ছবিতে সংজ্ঞায়িত একটি মাস্ক ব্যবহার করে। আপনি মূল চিত্র, একটি পাঠ্য প্রম্পট এবং মুখোশযুক্ত চিত্র প্রদান করেন। মূল এবং মুখোশযুক্ত চিত্র সম্পর্কে নিম্নলিখিত নোট করুন:
মুখোশযুক্ত ছবিতে অবশ্যই চূড়ান্ত আউটপেইন্ট করা ছবির লক্ষ্যযুক্ত আকারের পিক্সেল মাত্রা থাকতে হবে।
মুখোশযুক্ত ছবির পিক্সেল মাত্রার সাথে মেলে মূল ছবিতে অতিরিক্ত প্যাডিং থাকতে হবে।
একটি পাঠ্য প্রম্পট প্রদান ঐচ্ছিক যদি আপনি মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে চান যে বিদ্যমান দৃশ্যটি যৌক্তিকভাবে চালিয়ে যাবে৷ আপনি যদি প্রসারিত এলাকার মধ্যে নির্দিষ্ট বিষয়বস্তু চান, তাহলে আপনাকে এটি একটি পাঠ্য প্রম্পটে উল্লেখ করতে হবে।
সুইফট
ইমেজেন মডেলের সাথে ছবি সম্পাদনা সুইফটের জন্য সমর্থিত নয়। এই বছরের পরে আবার চেক করুন!
Kotlin
একটি ছবি প্রসারিত করতে, editImage()
ব্যবহার করুন এবং ImagenEditMode.OUTPAINT
ব্যবহার করার জন্য সম্পাদনা কনফিগারেশন সেট করুন।
মনে রাখবেন যে আপনি editImage()
এর পরিবর্তে ঐচ্ছিকভাবে outpaintImage()
ব্যবহার করতে পারেন, এবং আপনাকে সম্পাদনা মোড নির্দিষ্ট করতে হবে না।
Java
একটি ছবি প্রসারিত করতে, editImage()
ব্যবহার করুন এবং ImagenEditMode.OUTPAINT
ব্যবহার করার জন্য সম্পাদনা কনফিগারেশন সেট করুন।
মনে রাখবেন যে আপনি editImage()
এর পরিবর্তে ঐচ্ছিকভাবে outpaintImage()
ব্যবহার করতে পারেন, এবং আপনাকে সম্পাদনা মোড নির্দিষ্ট করতে হবে না।
Web
ইমেজেন মডেলের সাথে ইমেজ এডিটিং ওয়েব অ্যাপের জন্য সমর্থিত নয়। এই বছরের পরে আবার চেক করুন!
Dart
একটি ছবি প্রসারিত করতে, editImage()
ব্যবহার করুন এবং ImagenEditMode.OUTPAINT
ব্যবহার করার জন্য সম্পাদনা কনফিগারেশন সেট করুন।
ঐক্য
ইমেজেন মডেলের সাথে ইমেজ এডিটিং ইউনিটির জন্য সমর্থিত নয়। এই বছরের পরে আবার চেক করুন!
সর্বোত্তম অনুশীলন এবং সীমাবদ্ধতা
একটি চিত্র সম্পাদনা করার সময় আমরা মাস্কটি প্রসারিত করার পরামর্শ দিই। এটি একটি সম্পাদনার সীমানা মসৃণ করতে এবং এটিকে আরও বিশ্বাসযোগ্য মনে করতে সহায়তা করতে পারে। সাধারণত, 1% বা 2% একটি প্রসারিত মান সুপারিশ করা হয় ( 0.01
বা 0.02
)।
Firebase AI লজিকের সাথে আপনার অভিজ্ঞতা সম্পর্কে মতামত দিন