এই পৃষ্ঠায় বর্ণনা করা হয়েছে কিভাবে Firebase AI Logic SDK ব্যবহার করে Imagen-এর সাহায্যে আউটপেইন্টিং ব্যবহার করে কোনো ছবির বিষয়বস্তুকে তার মূল সীমানার বাইরে প্রসারিত করা যায় ।
আউটপেইন্টিং হলো এক ধরনের মাস্ক-ভিত্তিক এডিটিং । মাস্ক হলো একটি ডিজিটাল ওভারলে যা আপনি যে নির্দিষ্ট এলাকাটি সম্পাদনা করতে চান, তা নির্ধারণ করে দেয়।
এটি যেভাবে কাজ করে : আপনি একটি মূল ছবি এবং তার সাথে সঙ্গতিপূর্ণ একটি মাস্ক করা ছবি প্রদান করেন — যা স্বয়ংক্রিয়ভাবে তৈরি হতে পারে অথবা আপনার দেওয়া হতে পারে — এবং এটি নতুন, প্রসারিত এলাকাটির একটি মাস্ক নির্ধারণ করে। আপনি চাইলে প্রসারিত এলাকাটিতে কী চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও দিতে পারেন, অথবা মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে পারে যে যৌক্তিকভাবে বিদ্যমান দৃশ্যটির ধারাবাহিকতা কী হবে। মডেলটি নতুন কন্টেন্ট তৈরি করে এবং মাস্ক করা এলাকাটি পূরণ করে দেয়।
উদাহরণস্বরূপ, আপনি একটি ছবির অ্যাস্পেক্ট রেশিও পরিবর্তন করতে পারেন বা পটভূমিতে আরও তথ্য যোগ করতে পারেন।
শুরু করার আগে
| শুধুমাত্র তখনই উপলব্ধ যখন আপনার এপিআই প্রদানকারী হিসেবে ভার্টেক্স এআই জেমিনি এপিআই ব্যবহার করা হয়। |
যদি আপনি ইতিমধ্যে তা না করে থাকেন, তাহলে ‘ গেটিং স্টার্টেড গাইড’টি সম্পূর্ণ করুন, যেখানে আপনার Firebase প্রজেক্ট সেট আপ করা, আপনার অ্যাপকে Firebase-এর সাথে সংযুক্ত করা, SDK যোগ করা, আপনার নির্বাচিত API প্রোভাইডারের জন্য ব্যাকএন্ড সার্ভিস ইনিশিয়ালাইজ করা এবং একটি ImagenModel ইনস্ট্যান্স তৈরি করার পদ্ধতি বর্ণনা করা হয়েছে।
যে মডেলগুলো এই সক্ষমতা সমর্থন করে
ইমেজেন তার capability মডেলের মাধ্যমে ছবি সম্পাদনার সুবিধা প্রদান করে:
-
imagen-3.0-capability-001
উল্লেখ্য যে, Imagen মডেলগুলোর জন্য global লোকেশন সমর্থিত নয় ।
একটি ছবির বিষয়বস্তু প্রসারিত করুন
| এই নমুনাটি চেষ্টা করার আগে, আপনার প্রজেক্ট ও অ্যাপ সেট আপ করার জন্য এই গাইডের ' শুরু করার আগে ' অংশটি সম্পূর্ণ করুন। |
নিম্নলিখিত নমুনাটি দেখায় কিভাবে আপনার সরবরাহ করা একটি ছবিতে সংজ্ঞায়িত মাস্ক ব্যবহার করে একটি ছবিকে তার মূল সীমানার বাইরে প্রসারিত করা যায়। আপনাকে মূল ছবিটি, একটি টেক্সট প্রম্পট এবং মাস্ক করা ছবিটি সরবরাহ করতে হবে। মূল এবং মাস্ক করা ছবি সম্পর্কে নিম্নলিখিত বিষয়গুলো লক্ষ্য করুন:
মাস্ক করা ছবিটির পিক্সেল ডাইমেনশন অবশ্যই চূড়ান্ত আউটপেইন্ট করা ছবির লক্ষ্যমাত্রা আকারের সমান হতে হবে।
মাস্ক করা ছবির পিক্সেল ডাইমেনশনের সাথে মেলানোর জন্য মূল ছবিতে অবশ্যই অতিরিক্ত প্যাডিং অন্তর্ভুক্ত থাকতে হবে।
যদি আপনি চান যে মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিক যে বিদ্যমান দৃশ্যটি যৌক্তিকভাবে কীসে চলবে, তাহলে টেক্সট প্রম্পট দেওয়া ঐচ্ছিক। যদি আপনি প্রসারিত এলাকার মধ্যে নির্দিষ্ট কোনো বিষয়বস্তু চান, তাহলে আপনাকে একটি টেক্সট প্রম্পটে তা উল্লেখ করতে হবে।
সুইফট
Swift-এ Imagen মডেল ব্যবহার করে ছবি সম্পাদনা করা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!
Kotlin
ছবি বড় করতে, editImage() ব্যবহার করুন এবং এডিটিং কনফিগারেশনটি ImagenEditMode.OUTPAINT হিসেবে সেট করুন।
মনে রাখবেন যে, আপনি চাইলে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন এবং এডিটিং মোড নির্দিষ্ট করার কোনো প্রয়োজন নেই।
Java
ছবি বড় করতে, editImage() ব্যবহার করুন এবং এডিটিং কনফিগারেশনটি ImagenEditMode.OUTPAINT হিসেবে সেট করুন।
মনে রাখবেন যে, আপনি চাইলে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন এবং এডিটিং মোড নির্দিষ্ট করার কোনো প্রয়োজন নেই।
Web
ওয়েব অ্যাপের জন্য Imagen মডেল ব্যবহার করে ছবি সম্পাদনা করা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!
Dart
ছবি বড় করতে, editImage() ব্যবহার করুন এবং এডিটিং কনফিগারেশনটি ImagenEditMode.OUTPAINT হিসেবে সেট করুন।
ঐক্য
ইউনিটিতে ইমেজেন মডেল ব্যবহার করে ইমেজ এডিটিং সমর্থিত নয়। এই বছরের শেষের দিকে আবার চেষ্টা করুন!
সর্বোত্তম অনুশীলন এবং সীমাবদ্ধতা
ছবি সম্পাদনা করার সময় আমরা মাস্কটি ডাইলেট করার পরামর্শ দিই। এটি সম্পাদনার সীমানা মসৃণ করতে এবং এটিকে আরও বিশ্বাসযোগ্য করে তুলতে সাহায্য করতে পারে। সাধারণত, ১% বা ২% ( 0.01 বা 0.02 ) ডাইলেশন মান সুপারিশ করা হয়।
Firebase AI Logic ব্যবহারের অভিজ্ঞতা সম্পর্কে মতামত দিন।