এই পৃষ্ঠায় বর্ণনা করা হয়েছে কিভাবে Firebase AI Logic SDK ব্যবহার করে একটি নির্দিষ্ট স্টাইলের উপর ভিত্তি করে ছবি সম্পাদনা বা তৈরি করতে Imagen থেকে কাস্টমাইজেশন ক্ষমতা ব্যবহার করা যায়।
এটি কীভাবে কাজ করে : আপনি একটি টেক্সট প্রম্পট এবং কমপক্ষে একটি রেফারেন্স ছবি প্রদান করেন যা একটি নির্দিষ্ট স্টাইল (যেমন একটি প্যাটার্ন, টেক্সচার, বা ডিজাইন স্টাইল) দেখায়। মডেলটি এই ইনপুটগুলি ব্যবহার করে রেফারেন্স ইমেজগুলিতে নির্দিষ্ট স্টাইলের উপর ভিত্তি করে একটি নতুন ছবি তৈরি করে।
উদাহরণস্বরূপ, আপনার দেওয়া একটি জনপ্রিয় খুচরা বিক্রেতা ক্যাটালগের ছবির উপর ভিত্তি করে আপনি একটি রান্নাঘরের একটি নতুন ছবি তৈরি করতে পারেন।
শুরু করার আগে
| শুধুমাত্র আপনার API প্রদানকারী হিসেবে Vertex AI Gemini API ব্যবহার করলেই এটি উপলব্ধ। |
যদি আপনি ইতিমধ্যেই না করে থাকেন, তাহলে শুরু করার নির্দেশিকাটি সম্পূর্ণ করুন, যেখানে আপনার Firebase প্রকল্পটি কীভাবে সেট আপ করবেন, আপনার অ্যাপটিকে Firebase-এর সাথে সংযুক্ত করবেন, SDK যোগ করবেন, আপনার নির্বাচিত API প্রদানকারীর জন্য ব্যাকএন্ড পরিষেবা শুরু করবেন এবং একটি ImagenModel ইনস্ট্যান্স তৈরি করবেন তা বর্ণনা করা হয়েছে।
এই ক্ষমতা সমর্থন করে এমন মডেলগুলি
ইমেজেন তার capability মডেলের মাধ্যমে চিত্র সম্পাদনা প্রদান করে:
-
imagen-3.0-capability-001
মনে রাখবেন যে Imagen মডেলের জন্য, global অবস্থান সমর্থিত নয় ।
স্টাইল কাস্টমাইজেশনের অনুরোধ পাঠান
নিচের নমুনাটি একটি স্টাইল কাস্টমাইজেশন অনুরোধ দেখায় যা মডেলটিকে প্রদত্ত রেফারেন্স ছবির স্টাইল ব্যবহার করে একটি নতুন ছবি তৈরি করতে বলে (এই উদাহরণে, ভ্যান গঘের "স্টারি নাইট")।
প্রম্পট লেখা এবং সেগুলির মধ্যে রেফারেন্স ছবি কীভাবে ব্যবহার করবেন তা জানতে এই পৃষ্ঠায় পরে প্রম্পট টেমপ্লেটগুলি পর্যালোচনা করুন।
সুইফট
Swift-এর জন্য Imagen মডেলের মাধ্যমে ছবি সম্পাদনা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!
Kotlin
// Using this SDK to access Imagen models is a Preview release and requires opt-in
@OptIn(PublicPreviewAPI::class)
suspend fun customizeImage() {
// Initialize the Vertex AI Gemini API backend service
// Optionally specify the location to access the model (for example, `us-central1`)
val ai = Firebase.ai(backend = GenerativeBackend.vertexAI(location = "us-central1"))
// Create an `ImagenModel` instance with an Imagen "capability" model
val model = ai.imagenModel("imagen-3.0-capability-001")
// This example assumes 'referenceImage' is a pre-loaded Bitmap.
// In a real app, this might come from the user's device or a URL.
val referenceImage: Bitmap = TODO("Load your reference image Bitmap here")
// Define the style reference using the reference image.
val styleReference = ImagenStyleReference(
image = referenceImage,
referenceID = 1,
description = "Van Gogh style"
)
// Provide a prompt that describes the final image.
// The "[1]" links the prompt to the style reference with ID 1.
val prompt = "A cat flying through outer space, in the Van Gogh style[1]"
// Use the editImage API to perform the style customization.
// Pass the list of references, the prompt, and an editing configuration.
val editedImage = model.editImage(
referenceImages = listOf(styleReference),
prompt = prompt,
config = ImagenEditingConfig(
editSteps = 50 // Number of editing steps, a higher value can improve quality
)
)
// Process the result
}
Java
// Initialize the Vertex AI Gemini API backend service
// Optionally specify the location to access the model (for example, `us-central1`)
// Create an `ImagenModel` instance with an Imagen "capability" model
ImagenModel imagenModel = FirebaseAI.getInstance(GenerativeBackend.vertexAI("us-central1"))
.imagenModel(
/* modelName */ "imagen-3.0-capability-001");
ImagenModelFutures model = ImagenModelFutures.from(imagenModel);
// This example assumes 'referenceImage' is a pre-loaded Bitmap.
// In a real app, this might come from the user's device or a URL.
Bitmap referenceImage = null; // TODO("Load your image Bitmap here");
// Define the style reference using the reference image.
ImagenStyleReference subjectReference = new ImagenStyleReference.Builder()
.setImage(referenceImage)
.setReferenceID(1)
.setDescription("Van Gogh style")
.build();
// Provide a prompt that describes the final image.
// The "[1]" links the prompt to the style reference with ID 1.
String prompt = "A cat flying through outer space, in the Van Gogh style[1]";
// Define the editing configuration.
ImagenEditingConfig imagenEditingConfig = new ImagenEditingConfig.Builder()
.setEditSteps(50) // Number of editing steps, a higher value can improve quality
.build();
// Use the editImage API to perform the style customization.
// Pass the list of references, the prompt, and the editing configuration.
Futures.addCallback(model.editImage(Collections.singletonList(styleReference), prompt, imagenEditingConfig), new FutureCallback<ImagenGenerationResponse>() {
@Override
public void onSuccess(ImagenGenerationResponse result) {
if (result.getImages().isEmpty()) {
Log.d("TAG", "No images generated");
}
Bitmap bitmap = ((ImagenInlineImage) result.getImages().get(0)).asBitmap();
// Use the bitmap to display the image in your UI
}
@Override
public void onFailure(Throwable t) {
// ...
}
}, Executors.newSingleThreadExecutor());
Web
ওয়েব অ্যাপের জন্য ইমেজেন মডেলের মাধ্যমে ছবি সম্পাদনা করা সমর্থিত নয়। এই বছরের শেষের দিকে আবার দেখুন!
Dart
import 'dart:typed_data';
import 'package:firebase_ai/firebase_ai.dart';
import 'package:firebase_core/firebase_core.dart';
import 'firebase_options.dart';
// Initialize FirebaseApp
await Firebase.initializeApp(
options: DefaultFirebaseOptions.currentPlatform,
);
// Initialize the Vertex AI Gemini API backend service
// Optionally specify a location to access the model (for example, `us-central1`)
final ai = FirebaseAI.vertexAI(location: 'us-central1');
// Create an `ImagenModel` instance with an Imagen "capability" model
final model = ai.imagenModel(model: 'imagen-3.0-capability-001');
// This example assumes 'referenceImage' is a pre-loaded Uint8List.
// In a real app, this might come from the user's device or a URL.
final Uint8List referenceImage = Uint8List(0); // TODO: Load your reference image data here
// Define the style reference using the reference image.
final styleReference = ImagenStyleReference(
image: referenceImage,
referenceId: 1,
description: 'Van Gogh style',
);
// Provide a prompt that describes the final image.
// The "[1]" links the prompt to the style reference with ID 1.
final prompt = "A cat flying through outer space, in the Van Gogh style[1]";
try {
// Use the editImage API to perform the style customization.
// Pass the list of references, the prompt, and an editing configuration.
final response = await model.editImage(
[styleReference],
prompt,
config: ImagenEditingConfig(
editSteps: 50, // Number of editing steps, a higher value can improve quality
),
);
// Process the result.
if (response.images.isNotEmpty) {
final editedImage = response.images.first.bytes;
// Use the editedImage (a Uint8List) to display the image, save it, etc.
print('Image successfully generated!');
} else {
// Handle the case where no images were generated.
print('Error: No images were generated.');
}
} catch (e) {
// Handle any potential errors during the API call.
print('An error occurred: $e');
}
ঐক্য
ইউনিটিতে ইমেজেন মডেলের মাধ্যমে ছবি সম্পাদনা করা যাবে না। এই বছরের শেষের দিকে আবার দেখুন!
প্রম্পট টেমপ্লেট
অনুরোধে, আপনি একটি ImagenStyleReference সংজ্ঞায়িত করে রেফারেন্স ছবি (সর্বোচ্চ ৪টি ছবি) প্রদান করেন যেখানে আপনি একটি ছবির জন্য একটি রেফারেন্স আইডি (এবং ঐচ্ছিকভাবে একটি স্টাইলের বিবরণও) নির্দিষ্ট করেন। মনে রাখবেন যে একাধিক ছবির একই রেফারেন্স আইডি থাকতে পারে (উদাহরণস্বরূপ, একই প্যাটার্নের একাধিক ছবি)।
তারপর, প্রম্পট লেখার সময়, আপনি এই আইডিগুলি উল্লেখ করেন। উদাহরণস্বরূপ, আপনি রেফারেন্স আইডি 1 সহ ছবিগুলি উল্লেখ করার জন্য প্রম্পটে [1] ব্যবহার করেন। আপনি যদি কোনও বিষয়ের বিবরণ প্রদান করেন, তাহলে আপনি এটি প্রম্পটে অন্তর্ভুক্ত করতে পারেন যাতে একজন মানুষের পক্ষে প্রম্পটটি পড়া সহজ হয়।
নিম্নলিখিত টেবিলে প্রম্পট টেমপ্লেটগুলি দেওয়া হয়েছে যা স্টাইলের উপর ভিত্তি করে কাস্টমাইজেশনের জন্য প্রম্পট লেখার জন্য একটি সূচনা বিন্দু হতে পারে।
| ব্যবহারের ধরণ | রেফারেন্স ছবি | প্রম্পট টেমপ্লেট | উদাহরণ |
|---|---|---|---|
| অবজেক্ট স্টাইল | বিষয় চিত্র (১-৪) | নিম্নলিখিত ক্যাপশনের উপর ভিত্তি করে STYLE_DESCRIPTION [1] তে একটি ছবি তৈরি করুন: IMAGE_DESCRIPTION । | নিচের ক্যাপশনের উপর ভিত্তি করে neon sign style [1] একটি ছবি তৈরি করুন: a sign saying have a great day । |
| ফেস মেশ ইনপুট ছাড়াই ব্যক্তির ছবির স্টাইলাইজেশন | বিষয় চিত্র (১-৪) | SUBJECT_DESCRIPTION [1] সম্পর্কে একটি ছবি তৈরি করুন যা বর্ণনার সাথে মিলে যায়: SUBJECT_DESCRIPTION [1] ${PROMPT} এর একটি প্রতিকৃতি | a woman with short hair[1] বর্ণনার সাথে মিলে একটি ছবি তৈরি করুন: ঝাপসা ব্যাকগ্রাউন্ড সহ 3D-কার্টুন স্টাইলে a woman with short hair[1] প্রতিকৃতি । একটি সুন্দর এবং মনোরম চরিত্র, হাসিমুখে ক্যামেরার দিকে তাকিয়ে, প্যাস্টেল রঙের স্বর ... |
| ফেস মেশ ইনপুট সহ ব্যক্তির ছবির স্টাইলাইজেশন | বিষয় চিত্র (১-৩) ফেসমেশ নিয়ন্ত্রণ চিত্র (1) | CONTROL_IMAGE [2] এর ভঙ্গিতে SUBJECT_DESCRIPTION [1] সম্পর্কে একটি ছবি তৈরি করুন যাতে বর্ণনার সাথে মিল থাকে: SUBJECT_DESCRIPTION [1] ${PROMPT} এর একটি প্রতিকৃতি | control image [2] এর ভঙ্গিতে a woman with short hair [1] একটি ছবি তৈরি করুন যা বর্ণনার সাথে মিলে যায়: ঝাপসা ব্যাকগ্রাউন্ড সহ 3D-কার্টুন স্টাইলে a woman with short hair [1] একটি প্রতিকৃতি । একটি সুন্দর এবং সুন্দর চরিত্র, হাসিমুখে ক্যামেরার দিকে তাকিয়ে, প্যাস্টেল রঙের স্বর ... |
সর্বোত্তম অনুশীলন এবং সীমাবদ্ধতা
ব্যবহারের ক্ষেত্রে
কাস্টমাইজেশন ক্ষমতাটি ফ্রি-স্টাইল প্রম্পটিং প্রদান করে, যা এই ধারণা দিতে পারে যে মডেলটি যা করার জন্য প্রশিক্ষিত তার চেয়েও বেশি কিছু করতে পারে। নিম্নলিখিত বিভাগগুলিতে কাস্টমাইজেশনের জন্য উদ্দেশ্যমূলক ব্যবহারের ক্ষেত্রে এবং অনিচ্ছাকৃত ব্যবহারের ক্ষেত্রে অ-সম্পূর্ণ উদাহরণ বর্ণনা করা হয়েছে।
আমরা এই ক্ষমতাটি ব্যবহারের জন্য সুপারিশ করছি, কারণ আমরা মডেলটিকে সেই ব্যবহারের ক্ষেত্রে প্রশিক্ষণ দিয়েছি এবং তাদের জন্য ভালো ফলাফল আশা করি। বিপরীতভাবে, যদি আপনি মডেলটিকে উদ্দেশ্যমূলক ব্যবহারের ক্ষেত্রের বাইরে কিছু করার জন্য চাপ দেন, তাহলে আপনার খারাপ ফলাফল আশা করা উচিত।
উদ্দেশ্যপ্রণোদিত ব্যবহারের ক্ষেত্রে
স্টাইলের উপর ভিত্তি করে কাস্টমাইজেশনের জন্য নিম্নলিখিত ব্যবহারের উদাহরণ দেওয়া হল:
টেক্সট ইনপুট থেকে এমন একটি ছবি তৈরি করুন যা একটি রেফারেন্স ছবির দ্বারা প্রদত্ত নির্দিষ্ট স্টাইল অনুসরণ করে।
একজন ব্যক্তির ছবি পরিবর্তন করুন।
একজন ব্যক্তির ছবি পরিবর্তন করুন এবং তার মুখের ভাব সংরক্ষণ করুন।
অনিচ্ছাকৃত ব্যবহারের উদাহরণ
স্টাইলের উপর ভিত্তি করে কাস্টমাইজেশনের জন্য অনিচ্ছাকৃত ব্যবহারের ক্ষেত্রের একটি সম্পূর্ণ তালিকা নিচে দেওয়া হল। মডেলটি এই ব্যবহারের ক্ষেত্রে প্রশিক্ষিত নয়, এবং সম্ভবত খারাপ ফলাফল দেবে।
রেফারেন্স ইমেজ থেকে তৈরি কম্পোজিশনের উপর কিছুটা নিয়ন্ত্রণ রাখার উদ্দেশ্যে, টেক্সট থেকে এবং একটি রেফারেন্স ইমেজ ব্যবহার করে একটি ইমেজ তৈরি করুন।
একটি নির্দিষ্ট মুখের ভাবভঙ্গি সহ একজন ব্যক্তির একটি রেফারেন্স চিত্র তৈরি করুন।
দুটি ব্যক্তিকে একটি ভিন্ন দৃশ্যে রাখুন, তাদের পরিচয় সংরক্ষণ করুন এবং আউটপুট ছবির স্টাইল (যেমন একটি তৈলচিত্র) নির্দিষ্ট করার সময় একটি রেফারেন্স চিত্র ব্যবহার করুন।
একটি পোষা প্রাণীর ছবি স্টাইলাইজ করুন এবং এটিকে একটি অঙ্কনে পরিণত করুন, একই সাথে ছবির গঠন সংরক্ষণ বা নির্দিষ্ট করুন।
একটি পণ্য, যেমন একটি কুকি বা একটি সোফা, বিভিন্ন দৃশ্যে বিভিন্ন পণ্য কোণে এবং একটি নির্দিষ্ট চিত্র শৈলী অনুসরণ করে (যেমন নির্দিষ্ট রঙ, আলোর শৈলী, বা অ্যানিমেশন সহ ফটোরিয়ালিস্টিক) রাখুন।