Imagen দিয়ে ছবি সম্পাদনার ওভারভিউ


শুধুমাত্র আপনার API প্রদানকারী হিসেবে Vertex AI Gemini API ব্যবহার করলেই এটি উপলব্ধ।


Firebase AI Logic SDK গুলি আপনাকে Imagen মডেলগুলিতে অ্যাক্সেস দেয় ( Imagen API এর মাধ্যমে) যাতে আপনি নিম্নলিখিত যেকোনো একটি ব্যবহার করে ছবি সম্পাদনা করতে পারেন:

  • মুখোশ-ভিত্তিক সম্পাদনা , যেমন বস্তু সন্নিবেশ করানো এবং অপসারণ করা, মূল সীমানার বাইরে ছবির বিষয়বস্তু প্রসারিত করা এবং পটভূমি প্রতিস্থাপন করা

  • স্টাইল (যেমন প্যাটার্ন, টেক্সচার, অথবা শিল্পীর স্টাইল), বিষয় (যেমন পণ্য, ব্যক্তি, অথবা প্রাণী), অথবা নিয়ন্ত্রণ (যেমন হাতে আঁকা স্কেচ) এর উপর ভিত্তি করে কাস্টমাইজেশন বিকল্প।

এই পৃষ্ঠাটি প্রতিটি সম্পাদনা বিকল্পকে উচ্চ স্তরে বর্ণনা করে। প্রতিটি বিকল্পের নিজস্ব পৃথক পৃষ্ঠা রয়েছে যেখানে আরও বিশদ এবং কোড নমুনা রয়েছে।

এই ক্ষমতা সমর্থন করে এমন মডেলগুলি

ইমেজেন তার capability মডেলের মাধ্যমে চিত্র সম্পাদনা প্রদান করে:

  • imagen-3.0-capability-001

মনে রাখবেন যে Imagen মডেলের জন্য, global অবস্থান সমর্থিত নয়

মুখোশ-ভিত্তিক সম্পাদনা

মাস্ক-ভিত্তিক সম্পাদনা আপনাকে একটি ছবিতে স্থানীয়, সুনির্দিষ্ট পরিবর্তন করতে দেয়। মডেলটি কেবলমাত্র ছবির একটি নির্দিষ্ট মাস্কড এলাকার মধ্যেই পরিবর্তন করে। মাস্ক হল একটি ডিজিটাল ওভারলে যা আপনি যে নির্দিষ্ট এলাকাটি সম্পাদনা করতে চান তা সংজ্ঞায়িত করে। মাস্কড এলাকাটি হয় স্বয়ংক্রিয়ভাবে সনাক্ত করা যেতে পারে এবং মডেল দ্বারা তৈরি করা যেতে পারে অথবা আপনার প্রদত্ত একটি মাস্কড ছবিতে সংজ্ঞায়িত করা যেতে পারে। ব্যবহারের ক্ষেত্রে নির্ভর করে, মডেলটির কী পরিবর্তন করতে হবে তা জানতে একটি টেক্সট প্রম্পটের প্রয়োজন হতে পারে।

মাস্ক-ভিত্তিক সম্পাদনার জন্য সাধারণ ব্যবহারের উদাহরণ এখানে দেওয়া হল:

বস্তু সন্নিবেশ করান (পেইন্টিংয়ে)

ছবিতে বস্তু সন্নিবেশ করার জন্য আপনি ইনপেইন্টিং ব্যবহার করতে পারেন।

এটি কীভাবে কাজ করে : আপনি একটি আসল ছবি এবং একটি সংশ্লিষ্ট মাস্ক করা ছবি প্রদান করেন — হয় স্বয়ংক্রিয়ভাবে তৈরি অথবা আপনার দ্বারা সরবরাহ করা — যা এমন একটি এলাকার উপর একটি মাস্ক সংজ্ঞায়িত করে যেখানে আপনি নতুন কন্টেন্ট যোগ করতে চান। আপনি কী যোগ করতে চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও প্রদান করেন। এরপর মডেলটি মাস্ক করা এলাকার মধ্যে নতুন কন্টেন্ট তৈরি করে এবং যোগ করে।

উদাহরণস্বরূপ, আপনি একটি টেবিল মাস্ক করতে পারেন এবং মডেলকে ফুলের একটি ফুলদানি যোগ করতে বলতে পারেন।

বস্তুগুলি সরান (পেইন্টিংয়ে)

আপনি ছবি থেকে বস্তু অপসারণ করতে ইনপেইন্টিং ব্যবহার করতে পারেন।

এটি কীভাবে কাজ করে : আপনি একটি আসল ছবি এবং একটি সংশ্লিষ্ট মুখোশযুক্ত ছবি প্রদান করেন — হয় স্বয়ংক্রিয়ভাবে তৈরি অথবা আপনার দ্বারা সরবরাহিত — যা আপনি যে বস্তু বা বিষয় অপসারণ করতে চান তার উপর একটি মুখোশ সংজ্ঞায়িত করে। আপনি ঐচ্ছিকভাবে একটি টেক্সট প্রম্পটও প্রদান করতে পারেন যা আপনি কী অপসারণ করতে চান তা বর্ণনা করে, অথবা মডেলটি বুদ্ধিমত্তার সাথে কোন বস্তু অপসারণ করতে হবে তা সনাক্ত করতে পারে। এরপর মডেলটি বস্তুটি সরিয়ে দেয় এবং নতুন, প্রাসঙ্গিকভাবে উপযুক্ত সামগ্রী দিয়ে এলাকাটি পূরণ করে।

উদাহরণস্বরূপ, আপনি একটি বলকে মাস্ক করতে পারেন এবং এটি একটি ফাঁকা দেয়াল বা ঘাসের মাঠ দিয়ে প্রতিস্থাপন করতে পারেন।

একটি ছবিকে তার মূল সীমানার বাইরে প্রসারিত করুন (আউটপেইন্টিং)

আপনি আউটপেইন্টিং ব্যবহার করে একটি ছবিকে তার মূল সীমানা ছাড়িয়ে প্রসারিত করতে পারেন।

এটি কীভাবে কাজ করে : আপনি একটি আসল ছবি এবং একটি সংশ্লিষ্ট মুখোশযুক্ত ছবি প্রদান করেন — হয় স্বয়ংক্রিয়ভাবে তৈরি অথবা আপনার দ্বারা সরবরাহিত — যা নতুন, প্রসারিত এলাকার একটি মুখোশ নির্ধারণ করে। আপনি ঐচ্ছিকভাবে প্রসারিত এলাকায় আপনি কী চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও প্রদান করতে পারেন, অথবা মডেল বুদ্ধিমত্তার সাথে সিদ্ধান্ত নিতে পারে যে বিদ্যমান দৃশ্যটি যুক্তিসঙ্গতভাবে কী চালিয়ে যাবে। মডেলটি নতুন বিষয়বস্তু তৈরি করে এবং মুখোশযুক্ত এলাকা পূরণ করে।

উদাহরণস্বরূপ, আপনি একটি ছবির আকৃতির অনুপাত পরিবর্তন করতে পারেন অথবা আরও পটভূমির প্রসঙ্গ যোগ করতে পারেন।

ব্যাকগ্রাউন্ড প্রতিস্থাপন করুন

আপনি একটি ছবির ব্যাকগ্রাউন্ড প্রতিস্থাপন করতে পারেন।

এটি কীভাবে কাজ করে : আপনি একটি আসল ছবি এবং একটি অনুরূপ মুখোশযুক্ত ছবি প্রদান করেন যা ব্যাকগ্রাউন্ডের উপরে একটি মুখোশ সংজ্ঞায়িত করে — হয় স্বয়ংক্রিয় ব্যাকগ্রাউন্ড সনাক্তকরণ ব্যবহার করে অথবা নিজেই ব্যাকগ্রাউন্ডের মুখোশ প্রদান করে। আপনি কী পরিবর্তন করতে চান তা বর্ণনা করে একটি টেক্সট প্রম্পটও প্রদান করেন। এরপর মডেলটি একটি নতুন ব্যাকগ্রাউন্ড তৈরি করে এবং প্রয়োগ করে।

উদাহরণস্বরূপ, আপনি কোনও বিষয় বা বস্তুর চারপাশের সেটিং পরিবর্তন করতে পারেন, ফোরগ্রাউন্ডকে প্রভাবিত না করেই (উদাহরণস্বরূপ, কোনও পণ্যের ছবিতে)।

কাস্টমাইজেশন

কাস্টমাইজেশন আপনাকে টেক্সট প্রম্পট এবং রেফারেন্স ইমেজ ব্যবহার করে ছবি সম্পাদনা বা তৈরি করতে দেয় যা মডেলটিকে একটি নির্দিষ্ট স্টাইল , বিষয় (যেমন একটি পণ্য, ব্যক্তি, বা প্রাণী), অথবা একটি নিয়ন্ত্রণের উপর ভিত্তি করে একটি নতুন ছবি তৈরি করতে নির্দেশ দেয়।

স্টাইলের উপর ভিত্তি করে কাস্টমাইজ করুন

আপনি একটি নির্দিষ্ট স্টাইলের উপর ভিত্তি করে ছবি সম্পাদনা বা তৈরি করতে পারেন।

এটি কীভাবে কাজ করে : আপনি একটি টেক্সট প্রম্পট এবং কমপক্ষে একটি রেফারেন্স ছবি প্রদান করেন যা একটি নির্দিষ্ট স্টাইল (যেমন একটি প্যাটার্ন, টেক্সচার, বা ডিজাইন স্টাইল) দেখায়। মডেলটি এই ইনপুটগুলি ব্যবহার করে রেফারেন্স ইমেজগুলিতে নির্দিষ্ট স্টাইলের উপর ভিত্তি করে একটি নতুন ছবি তৈরি করে।

উদাহরণস্বরূপ, আপনার দেওয়া একটি জনপ্রিয় খুচরা বিক্রেতা ক্যাটালগের ছবির উপর ভিত্তি করে আপনি একটি রান্নাঘরের একটি নতুন ছবি তৈরি করতে পারেন।

বিষয়ের উপর ভিত্তি করে কাস্টমাইজ করুন

আপনি একটি নির্দিষ্ট বিষয়ের উপর ভিত্তি করে ছবি সম্পাদনা বা তৈরি করতে পারেন।

এটি কীভাবে কাজ করে : আপনি একটি টেক্সট প্রম্পট এবং কমপক্ষে একটি রেফারেন্স ছবি প্রদান করেন যা একটি নির্দিষ্ট বিষয় (যেমন একটি পণ্য, ব্যক্তি, বা প্রাণীর সঙ্গী) দেখায়। মডেলটি এই ইনপুটগুলি ব্যবহার করে রেফারেন্স ছবিতে নির্দিষ্ট বিষয়ের উপর ভিত্তি করে একটি নতুন ছবি তৈরি করে।

উদাহরণস্বরূপ, আপনি মডেলটিকে একটি শিশুর ছবিতে একটি কার্টুন স্টাইল প্রয়োগ করতে বলতে পারেন অথবা ছবিতে একটি সাইকেলের রঙ পরিবর্তন করতে বলতে পারেন।

নিয়ন্ত্রণের উপর ভিত্তি করে কাস্টমাইজ করুন

আপনি একটি নির্দিষ্ট নিয়ন্ত্রণের উপর ভিত্তি করে ছবি সম্পাদনা বা তৈরি করতে পারেন।

এটি কীভাবে কাজ করে : আপনি একটি টেক্সট প্রম্পট এবং কমপক্ষে একটি কন্ট্রোল রেফারেন্স ইমেজ (যেমন একটি অঙ্কন বা একটি ক্যানি এজ ইমেজ) প্রদান করেন। মডেলটি কন্ট্রোল ইমেজের উপর ভিত্তি করে একটি নতুন ইমেজ তৈরি করতে এই ইনপুটগুলি ব্যবহার করে।

উদাহরণস্বরূপ, আপনি মডেলটিকে একটি রকেট জাহাজ এবং চাঁদের একটি অঙ্কন প্রদান করতে পারেন এবং সেই সাথে একটি টেক্সট প্রম্পটও দিতে পারেন যাতে অঙ্কনের উপর ভিত্তি করে একটি জলরঙের চিত্র তৈরি করা যায়।


Firebase AI Logic এর সাথে আপনার অভিজ্ঞতা সম্পর্কে মতামত দিন।