এই পৃষ্ঠাটি বর্ণনা করে যে কীভাবে ফায়ারবেস এআই লজিক এসডিকে ব্যবহার করে ইমেজেন ব্যবহার করে আউটপেইন্টিং ব্যবহার করে কোনও ছবির মূল সীমানা ছাড়িয়ে যাওয়ার বিষয়বস্তু প্রসারিত করা যায় ।
আউটপেইন্টিং হলো এক ধরণের মাস্ক-ভিত্তিক সম্পাদনা । মাস্ক হলো একটি ডিজিটাল ওভারলে যা আপনি যে নির্দিষ্ট এলাকাটি সম্পাদনা করতে চান তা নির্ধারণ করে।
এটি কীভাবে কাজ করে : আপনি একটি আসল ছবি এবং একটি সংশ্লিষ্ট মুখোশযুক্ত ছবি প্রদান করেন — হয় স্বয়ংক্রিয়ভাবে তৈরি অথবা আপনার দ্বারা সরবরাহিত — যা নতুন, প্রসারিত এলাকার একটি মুখোশ নির্ধারণ করে। আপনি ঐচ্ছিকভাবে প্রসারিত এলাকায় আপনি কী চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও প্রদান করতে পারেন, অথবা মডেল বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে পারে যে বিদ্যমান দৃশ্যটি যুক্তিসঙ্গতভাবে কী চালিয়ে যাবে। মডেলটি নতুন বিষয়বস্তু তৈরি করে এবং মুখোশযুক্ত এলাকা পূরণ করে।
উদাহরণস্বরূপ, আপনি একটি ছবির আকৃতির অনুপাত পরিবর্তন করতে পারেন অথবা আরও পটভূমির প্রসঙ্গ যোগ করতে পারেন।
শুরু করার আগে
| শুধুমাত্র আপনার API প্রদানকারী হিসেবে Vertex AI Gemini API ব্যবহার করলেই এটি উপলব্ধ। |
যদি আপনি ইতিমধ্যেই না করে থাকেন, তাহলে শুরু করার নির্দেশিকাটি সম্পূর্ণ করুন, যেখানে আপনার Firebase প্রকল্পটি কীভাবে সেট আপ করবেন, আপনার অ্যাপটিকে Firebase-এর সাথে সংযুক্ত করবেন, SDK যোগ করবেন, আপনার নির্বাচিত API প্রদানকারীর জন্য ব্যাকএন্ড পরিষেবা শুরু করবেন এবং একটি ImagenModel ইনস্ট্যান্স তৈরি করবেন তা বর্ণনা করা হয়েছে।
এই ক্ষমতা সমর্থন করে এমন মডেলগুলি
ইমেজেন তার capability মডেলের মাধ্যমে চিত্র সম্পাদনা প্রদান করে:
-
imagen-3.0-capability-001
মনে রাখবেন যে Imagen মডেলের জন্য, global অবস্থান সমর্থিত নয় ।
ছবির কন্টেন্ট প্রসারিত করুন
| এই নমুনাটি চেষ্টা করার আগে, আপনার প্রকল্প এবং অ্যাপ সেট আপ করতে এই নির্দেশিকার "শুরু করার আগে" বিভাগটি সম্পূর্ণ করুন। |
নিচের নমুনাটি দেখায় কিভাবে একটি ছবিকে তার মূল সীমানার বাইরে প্রসারিত করা যায় — আপনার দেওয়া ছবিতে সংজ্ঞায়িত একটি মাস্ক ব্যবহার করে। আপনি আসল ছবি, একটি টেক্সট প্রম্পট এবং মাস্ক করা ছবি প্রদান করেন। মূল এবং মাস্ক করা ছবি সম্পর্কে নিম্নলিখিত বিষয়গুলি লক্ষ্য করুন:
মুখোশযুক্ত ছবিতে চূড়ান্ত আউটপেইন্ট করা ছবির লক্ষ্য আকারের পিক্সেল মাত্রা থাকতে হবে।
মূল ছবিতে অবশ্যই অতিরিক্ত প্যাডিং থাকতে হবে যাতে মুখোশযুক্ত ছবির পিক্সেল মাত্রার সাথে মেলে।
যদি আপনি চান যে মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নেবে যে বিদ্যমান দৃশ্যটি কী যুক্তিসঙ্গতভাবে অব্যাহত রাখবে, তাহলে একটি টেক্সট প্রম্পট প্রদান করা ঐচ্ছিক। যদি আপনি প্রসারিত এলাকার মধ্যে নির্দিষ্ট বিষয়বস্তু চান, তাহলে আপনাকে একটি টেক্সট প্রম্পটে তা উল্লেখ করতে হবে।
সুইফট
Swift-এর জন্য Imagen মডেলের মাধ্যমে ছবি সম্পাদনা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!
Kotlin
একটি ছবি প্রসারিত করতে, editImage() ব্যবহার করুন এবং সম্পাদনা কনফিগারেশনটি ImagenEditMode.OUTPAINT ব্যবহার করে সেট করুন।
মনে রাখবেন যে আপনি ঐচ্ছিকভাবে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন, এবং আপনাকে সম্পাদনা মোড নির্দিষ্ট করার প্রয়োজন নেই।
Java
একটি ছবি প্রসারিত করতে, editImage() ব্যবহার করুন এবং সম্পাদনা কনফিগারেশনটি ImagenEditMode.OUTPAINT ব্যবহার করে সেট করুন।
মনে রাখবেন যে আপনি ঐচ্ছিকভাবে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন, এবং আপনাকে সম্পাদনা মোড নির্দিষ্ট করার প্রয়োজন নেই।
Web
ওয়েব অ্যাপের জন্য ইমেজেন মডেলের মাধ্যমে ছবি সম্পাদনা করা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!
Dart
একটি ছবি প্রসারিত করতে, editImage() ব্যবহার করুন এবং সম্পাদনা কনফিগারেশনটি ImagenEditMode.OUTPAINT ব্যবহার করে সেট করুন।
ঐক্য
ইউনিটিতে ইমেজেন মডেলের মাধ্যমে ছবি সম্পাদনা করা যাবে না। এই বছরের শেষের দিকে আবার দেখুন!
সর্বোত্তম অনুশীলন এবং সীমাবদ্ধতা
আমরা ছবি সম্পাদনা করার সময় মাস্কটি প্রসারিত করার পরামর্শ দিই। এটি সম্পাদনার সীমানা মসৃণ করতে এবং এটিকে আরও বিশ্বাসযোগ্য করে তুলতে সাহায্য করতে পারে। সাধারণত, 1% বা 2% ( 0.01 বা 0.02 ) এর প্রসারণ মান সুপারিশ করা হয়।
Firebase AI Logic এর সাথে আপনার অভিজ্ঞতা সম্পর্কে মতামত দিন।