Imagen দিয়ে ছবি সম্পাদনার ওভারভিউ


শুধুমাত্র তখনই উপলব্ধ যখন আপনার এপিআই প্রদানকারী হিসেবে ভার্টেক্স এআই জেমিনি এপিআই ব্যবহার করা হয়।


Firebase AI Logic SDK-গুলো আপনাকে Imagen মডেলগুলিতে ( Imagen API-এর মাধ্যমে) অ্যাক্সেস দেয়, যাতে আপনি নিম্নলিখিত যেকোনো একটি ব্যবহার করে ছবি সম্পাদনা করতে পারেন:

  • মাস্ক-ভিত্তিক সম্পাদনা , যেমন বস্তু যোগ করা ও সরানো, ছবির বিষয়বস্তুকে মূল সীমানার বাইরে প্রসারিত করা এবং পটভূমি প্রতিস্থাপন করা।

  • শৈলী (যেমন প্যাটার্ন, টেক্সচার বা শিল্পীর শৈলী), বিষয় (যেমন পণ্য, ব্যক্তি বা প্রাণী) বা নিয়ন্ত্রণ (যেমন হাতে আঁকা স্কেচ) এর উপর ভিত্তি করে কাস্টমাইজেশনের বিকল্প।

এই পৃষ্ঠায় প্রতিটি সম্পাদনা বিকল্পের একটি সাধারণ বর্ণনা দেওয়া হয়েছে। প্রতিটি বিকল্পের জন্য আলাদা পৃষ্ঠা রয়েছে, যেখানে আরও বিস্তারিত তথ্য এবং কোডের নমুনা দেওয়া আছে।

যে মডেলগুলো এই সক্ষমতা সমর্থন করে

ইমেজেন তার capability মডেলের মাধ্যমে ছবি সম্পাদনার সুবিধা প্রদান করে:

  • imagen-3.0-capability-001

উল্লেখ্য যে, Imagen মডেলগুলোর জন্য global লোকেশন সমর্থিত নয়

মাস্ক-ভিত্তিক সম্পাদনা

মাস্ক-ভিত্তিক সম্পাদনা আপনাকে একটি ছবিতে নির্দিষ্ট ও সুনির্দিষ্ট পরিবর্তন করতে দেয়। মডেলটি শুধুমাত্র ছবির একটি সংজ্ঞায়িত মাস্ক করা এলাকার মধ্যেই পরিবর্তন করে। মাস্ক হলো একটি ডিজিটাল ওভারলে যা আপনি সম্পাদনা করতে চান এমন নির্দিষ্ট এলাকাটিকে সংজ্ঞায়িত করে। মাস্ক করা এলাকাটি মডেল দ্বারা স্বয়ংক্রিয়ভাবে শনাক্ত ও তৈরি হতে পারে, অথবা আপনার সরবরাহ করা একটি মাস্ক করা ছবিতে সংজ্ঞায়িত থাকতে পারে। ব্যবহারের ধরনের উপর নির্ভর করে, কী পরিবর্তন করতে হবে তা জানার জন্য মডেলের একটি টেক্সট প্রম্পটের প্রয়োজন হতে পারে।

মাস্ক-ভিত্তিক সম্পাদনার সাধারণ ব্যবহারগুলো নিচে দেওয়া হলো:

বস্তু সন্নিবেশ করুন (ইনপেইন্টিং)

আপনি ইনপেইন্টিং ব্যবহার করে কোনো ছবির মধ্যে বস্তু যুক্ত করতে পারেন।

এটি যেভাবে কাজ করে : আপনি একটি মূল ছবি এবং তার সাথে সঙ্গতিপূর্ণ একটি মাস্ক করা ছবি প্রদান করেন — যা স্বয়ংক্রিয়ভাবে তৈরি হতে পারে অথবা আপনার দেওয়া হতে পারে — এবং এটি এমন একটি এলাকার উপর মাস্ক তৈরি করে যেখানে আপনি নতুন কন্টেন্ট যোগ করতে চান। আপনি কী যোগ করতে চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও প্রদান করেন। এরপর মডেলটি মাস্ক করা এলাকার মধ্যে নতুন কন্টেন্ট তৈরি করে এবং যোগ করে দেয়।

উদাহরণস্বরূপ, আপনি একটি টেবিল মাস্ক করে মডেলকে একটি ফুলদানি যোগ করতে বলতে পারেন।

বস্তু অপসারণ (ইনপেইন্টিং)

আপনি ইনপেইন্টিং ব্যবহার করে কোনো ছবি থেকে বস্তু মুছে ফেলতে পারেন।

এটি যেভাবে কাজ করে : আপনি একটি মূল ছবি এবং তার সাথে সঙ্গতিপূর্ণ একটি মাস্ক করা ছবি প্রদান করেন — যা স্বয়ংক্রিয়ভাবে তৈরি হতে পারে অথবা আপনার দেওয়া হতে পারে — এবং এটি আপনি যে বস্তু বা বিষয়বস্তু সরাতে চান, তার উপর একটি মাস্ক তৈরি করে। আপনি চাইলে কী সরাতে চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও দিতে পারেন, অথবা মডেলটি বুদ্ধিমত্তার সাথে শনাক্ত করতে পারে কোন বস্তুটি সরাতে হবে। এরপর মডেলটি বস্তুটি সরিয়ে দেয় এবং সেই জায়গাটি নতুন, প্রাসঙ্গিকভাবে উপযুক্ত বিষয়বস্তু দিয়ে পূরণ করে দেয়।

উদাহরণস্বরূপ, আপনি একটি বলকে ঢেকে দিয়ে তার জায়গায় একটি ফাঁকা দেয়াল বা ঘাসে ঢাকা মাঠ বসাতে পারেন।

একটি চিত্রকে তার মূল সীমানার বাইরে প্রসারিত করা (আউটপেইন্টিং)

আপনি আউটপেইন্টিং ব্যবহার করে একটি ছবিকে তার মূল সীমানার বাইরে প্রসারিত করতে পারেন।

এটি যেভাবে কাজ করে : আপনি একটি মূল ছবি এবং তার সাথে সঙ্গতিপূর্ণ একটি মাস্ক করা ছবি প্রদান করেন — যা স্বয়ংক্রিয়ভাবে তৈরি হতে পারে অথবা আপনার দেওয়া হতে পারে — এবং এটি নতুন, প্রসারিত এলাকাটির একটি মাস্ক নির্ধারণ করে। আপনি চাইলে প্রসারিত এলাকাটিতে কী চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও দিতে পারেন, অথবা মডেলটি বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে পারে যে যৌক্তিকভাবে বিদ্যমান দৃশ্যটির ধারাবাহিকতা কী হবে। মডেলটি নতুন কন্টেন্ট তৈরি করে এবং মাস্ক করা এলাকাটি পূরণ করে দেয়।

উদাহরণস্বরূপ, আপনি একটি ছবির অ্যাস্পেক্ট রেশিও পরিবর্তন করতে পারেন বা পটভূমিতে আরও তথ্য যোগ করতে পারেন।

পটভূমি প্রতিস্থাপন করুন

আপনি একটি ছবির পটভূমি পরিবর্তন করতে পারেন।

এটি যেভাবে কাজ করে : আপনি একটি মূল ছবি এবং তার সাথে সঙ্গতিপূর্ণ একটি মাস্ক করা ছবি প্রদান করেন, যা ব্যাকগ্রাউন্ডের উপর একটি মাস্ক তৈরি করে — এটি স্বয়ংক্রিয় ব্যাকগ্রাউন্ড ডিটেকশন ব্যবহার করে অথবা আপনি নিজেই ব্যাকগ্রাউন্ডের মাস্কটি প্রদান করতে পারেন। এছাড়াও, আপনি কী পরিবর্তন করতে চান তা বর্ণনা করে একটি টেক্সট প্রম্পট প্রদান করেন। এরপর মডেলটি একটি নতুন ব্যাকগ্রাউন্ড তৈরি করে এবং তা প্রয়োগ করে।

উদাহরণস্বরূপ, আপনি ফোরগ্রাউন্ডকে প্রভাবিত না করেই কোনো বিষয় বা বস্তুর চারপাশের সেটিং পরিবর্তন করতে পারেন (যেমন, একটি পণ্যের ছবিতে)।

কাস্টমাইজেশন

কাস্টমাইজেশন আপনাকে টেক্সট প্রম্পট এবং রেফারেন্স ইমেজ ব্যবহার করে ছবি সম্পাদনা বা তৈরি করার সুযোগ দেয়, যা একটি নির্দিষ্ট স্টাইল , বিষয় (যেমন পণ্য, ব্যক্তি বা প্রাণী) অথবা কোনো কন্ট্রোলের উপর ভিত্তি করে মডেলকে একটি নতুন ছবি তৈরি করতে নির্দেশনা দেয়।

একটি শৈলীর উপর ভিত্তি করে কাস্টমাইজ করুন

আপনি একটি নির্দিষ্ট শৈলীর উপর ভিত্তি করে ছবি সম্পাদনা বা তৈরি করতে পারেন।

এটি যেভাবে কাজ করে : আপনি একটি টেক্সট প্রম্পট এবং অন্তত একটি রেফারেন্স ইমেজ প্রদান করেন, যেটিতে একটি নির্দিষ্ট স্টাইল (যেমন প্যাটার্ন, টেক্সচার বা ডিজাইন স্টাইল) দেখানো থাকে। মডেলটি এই ইনপুটগুলো ব্যবহার করে রেফারেন্স ইমেজগুলোতে থাকা নির্দিষ্ট স্টাইলের উপর ভিত্তি করে একটি নতুন ইমেজ তৈরি করে।

উদাহরণস্বরূপ, আপনার দেওয়া কোনো জনপ্রিয় খুচরা পণ্যের ক্যাটালগের ছবির ওপর ভিত্তি করে আপনি রান্নাঘরের একটি নতুন ছবি তৈরি করতে পারেন।

একটি বিষয়ের উপর ভিত্তি করে কাস্টমাইজ করুন

আপনি একটি নির্দিষ্ট বিষয়ের উপর ভিত্তি করে ছবি সম্পাদনা বা তৈরি করতে পারেন।

এটি যেভাবে কাজ করে : আপনি একটি টেক্সট প্রম্পট এবং অন্তত একটি রেফারেন্স ইমেজ প্রদান করেন, যেখানে একটি নির্দিষ্ট বিষয় (যেমন কোনো পণ্য, ব্যক্তি বা পোষা প্রাণী) দেখানো থাকে। মডেলটি এই ইনপুটগুলো ব্যবহার করে রেফারেন্স ইমেজগুলোতে থাকা নির্দিষ্ট বিষয়ের উপর ভিত্তি করে একটি নতুন ইমেজ তৈরি করে।

উদাহরণস্বরূপ, আপনি মডেলকে একটি শিশুর ছবিতে কার্টুন শৈলী প্রয়োগ করতে বা ছবিতে থাকা একটি সাইকেলের রঙ পরিবর্তন করতে বলতে পারেন।

একটি নিয়ন্ত্রণের উপর ভিত্তি করে কাস্টমাইজ করুন

আপনি একটি নির্দিষ্ট কন্ট্রোলের উপর ভিত্তি করে ছবি সম্পাদনা বা তৈরি করতে পারেন।

এটি যেভাবে কাজ করে : আপনি একটি টেক্সট প্রম্পট এবং অন্তত একটি কন্ট্রোল রেফারেন্স ইমেজ (যেমন একটি ড্রয়িং বা ক্যানি এজ ইমেজ) প্রদান করেন। মডেলটি এই ইনপুটগুলো ব্যবহার করে কন্ট্রোল ইমেজগুলোর উপর ভিত্তি করে একটি নতুন ইমেজ তৈরি করে।

উদাহরণস্বরূপ, আপনি মডেলটিকে একটি রকেট জাহাজ ও চাঁদের ছবির সাথে একটি লিখিত নির্দেশ দিতে পারেন, যাতে সে ছবিটির উপর ভিত্তি করে একটি জলরঙের ছবি তৈরি করে।


Firebase AI Logic ব্যবহারের অভিজ্ঞতা সম্পর্কে মতামত দিন।