Imagen দিয়ে আউটপেইন্টিং ব্যবহার করে একটি ছবির বিষয়বস্তু প্রসারিত করুন


এই পৃষ্ঠায় বর্ণনা করা হয়েছে কিভাবে Firebase AI Logic SDK ব্যবহার করে Imagen-এর সাহায্যে আউটপেইন্টিং ব্যবহার করে কোনো ছবির বিষয়বস্তুকে তার মূল সীমানার বাইরে প্রসারিত করা যায়

আউটপেইন্টিং হলো এক ধরনের মাস্ক-ভিত্তিক এডিটিংমাস্ক হলো একটি ডিজিটাল ওভারলে যা আপনি যে নির্দিষ্ট এলাকাটি সম্পাদনা করতে চান, তা নির্ধারণ করে দেয়।

এটি যেভাবে কাজ করে : আপনি একটি মূল ছবি এবং তার সাথে সঙ্গতিপূর্ণ একটি মাস্ক করা ছবি প্রদান করেন — যা স্বয়ংক্রিয়ভাবে তৈরি হতে পারে অথবা আপনার দেওয়া হতে পারে — এবং এটি নতুন, প্রসারিত এলাকাটির একটি মাস্ক নির্ধারণ করে। আপনি চাইলে প্রসারিত এলাকাটিতে কী চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও দিতে পারেন, অথবা মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে পারে যে যৌক্তিকভাবে বিদ্যমান দৃশ্যটির ধারাবাহিকতা কী হবে। মডেলটি নতুন কন্টেন্ট তৈরি করে এবং মাস্ক করা এলাকাটি পূরণ করে দেয়।

উদাহরণস্বরূপ, আপনি একটি ছবির অ্যাস্পেক্ট রেশিও পরিবর্তন করতে পারেন বা পটভূমিতে আরও তথ্য যোগ করতে পারেন।

যান

শুরু করার আগে

শুধুমাত্র তখনই উপলব্ধ যখন আপনার এপিআই প্রদানকারী হিসেবে ভার্টেক্স এআই জেমিনি এপিআই ব্যবহার করা হয়।

যদি আপনি ইতিমধ্যে তা না করে থাকেন, তাহলে ‘ গেটিং স্টার্টেড গাইড’টি সম্পূর্ণ করুন, যেখানে আপনার Firebase প্রজেক্ট সেট আপ করা, আপনার অ্যাপকে Firebase-এর সাথে সংযুক্ত করা, SDK যোগ করা, আপনার নির্বাচিত API প্রোভাইডারের জন্য ব্যাকএন্ড সার্ভিস ইনিশিয়ালাইজ করা এবং একটি ImagenModel ইনস্ট্যান্স তৈরি করার পদ্ধতি বর্ণনা করা হয়েছে।

যে মডেলগুলো এই সক্ষমতা সমর্থন করে

ইমেজেন তার capability মডেলের মাধ্যমে ছবি সম্পাদনার সুবিধা প্রদান করে:

  • imagen-3.0-capability-001

উল্লেখ্য যে, Imagen মডেলগুলোর জন্য global লোকেশন সমর্থিত নয়

একটি ছবির বিষয়বস্তু প্রসারিত করুন

এই নমুনাটি চেষ্টা করার আগে, আপনার প্রজেক্ট ও অ্যাপ সেট আপ করার জন্য এই গাইডের ' শুরু করার আগে ' অংশটি সম্পূর্ণ করুন।

নিম্নলিখিত নমুনাটি দেখায় কিভাবে আপনার সরবরাহ করা একটি ছবিতে সংজ্ঞায়িত মাস্ক ব্যবহার করে একটি ছবিকে তার মূল সীমানার বাইরে প্রসারিত করা যায়। আপনাকে মূল ছবিটি, একটি টেক্সট প্রম্পট এবং মাস্ক করা ছবিটি সরবরাহ করতে হবে। মূল এবং মাস্ক করা ছবি সম্পর্কে নিম্নলিখিত বিষয়গুলো লক্ষ্য করুন:

  • মাস্ক করা ছবিটির পিক্সেল ডাইমেনশন অবশ্যই চূড়ান্ত আউটপেইন্ট করা ছবির লক্ষ্যমাত্রা আকারের সমান হতে হবে।

  • মাস্ক করা ছবির পিক্সেল ডাইমেনশনের সাথে মেলানোর জন্য মূল ছবিতে অবশ্যই অতিরিক্ত প্যাডিং অন্তর্ভুক্ত থাকতে হবে।

যদি আপনি চান যে মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিক যে বিদ্যমান দৃশ্যটি যৌক্তিকভাবে কীসে চলবে, তাহলে টেক্সট প্রম্পট দেওয়া ঐচ্ছিক। যদি আপনি প্রসারিত এলাকার মধ্যে নির্দিষ্ট কোনো বিষয়বস্তু চান, তাহলে আপনাকে একটি টেক্সট প্রম্পটে তা উল্লেখ করতে হবে।

সুইফট

Swift-এ Imagen মডেল ব্যবহার করে ছবি সম্পাদনা করা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!

Kotlin

ছবি বড় করতে, editImage() ব্যবহার করুন এবং এডিটিং কনফিগারেশনটি ImagenEditMode.OUTPAINT হিসেবে সেট করুন।
মনে রাখবেন যে, আপনি চাইলে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন এবং এডিটিং মোড নির্দিষ্ট করার কোনো প্রয়োজন নেই।

আউটপেইন্টিং-এর নমুনা কোডের জন্য কুইকস্টার্টটি দেখুন।

Java

ছবি বড় করতে, editImage() ব্যবহার করুন এবং এডিটিং কনফিগারেশনটি ImagenEditMode.OUTPAINT হিসেবে সেট করুন।
মনে রাখবেন যে, আপনি চাইলে editImage() এর পরিবর্তে outpaintImage() ব্যবহার করতে পারেন এবং এডিটিং মোড নির্দিষ্ট করার কোনো প্রয়োজন নেই।

আউটপেইন্টিং-এর নমুনা কোডের জন্য কুইকস্টার্টটি দেখুন।

Web

ওয়েব অ্যাপের জন্য Imagen মডেল ব্যবহার করে ছবি সম্পাদনা করা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!

Dart

ছবি বড় করতে, editImage() ব্যবহার করুন এবং এডিটিং কনফিগারেশনটি ImagenEditMode.OUTPAINT হিসেবে সেট করুন।

আউটপেইন্টিং-এর নমুনা কোডের জন্য কুইকস্টার্টটি দেখুন।

ঐক্য

ইউনিটিতে ইমেজেন মডেল ব্যবহার করে ইমেজ এডিটিং সমর্থিত নয়। এই বছরের শেষের দিকে আবার চেষ্টা করুন!

সর্বোত্তম অনুশীলন এবং সীমাবদ্ধতা

ছবি সম্পাদনা করার সময় আমরা মাস্কটি ডাইলেট করার পরামর্শ দিই। এটি সম্পাদনার সীমানা মসৃণ করতে এবং এটিকে আরও বিশ্বাসযোগ্য করে তুলতে সাহায্য করতে পারে। সাধারণত, ১% বা ২% ( 0.01 বা 0.02 ) ডাইলেশন মান সুপারিশ করা হয়।


Firebase AI Logic ব্যবহারের অভিজ্ঞতা সম্পর্কে মতামত দিন।