ใช้ได้เมื่อใช้ Vertex AI Gemini API เป็นผู้ให้บริการ API เท่านั้น |
Firebase AI Logic SDK ช่วยให้คุณเข้าถึงโมเดล Imagen (ผ่าน Imagen API) เพื่อให้คุณแก้ไขรูปภาพได้โดยใช้ตัวเลือกต่อไปนี้
การแก้ไขตามมาสก์ เช่น การแทรกและนำออบเจ็กต์ออก การขยายเนื้อหาของรูปภาพให้เกินขอบเขตเดิม และการแทนที่พื้นหลัง
ตัวเลือกการปรับแต่งตามสไตล์ (เช่น ลวดลาย พื้นผิว หรือสไตล์ของศิลปิน) เรื่อง (เช่น ผลิตภัณฑ์ บุคคล หรือสัตว์) หรือการควบคุม (เช่น ภาพร่างที่วาดด้วยมือ)
หน้านี้อธิบายตัวเลือกการแก้ไขแต่ละรายการในระดับสูง แต่ละตัวเลือกจะมีหน้าแยกของตัวเองพร้อมรายละเอียดและตัวอย่างโค้ดเพิ่มเติม
รุ่นที่รองรับความสามารถนี้
Imagen มีบริการแก้ไขรูปภาพผ่านโมเดล capability
ดังนี้
imagen-3.0-capability-001
โปรดทราบว่าสำหรับโมเดล Imagen ระบบไม่รองรับตำแหน่ง global
การแก้ไขโดยใช้มาสก์
การแก้ไขตามมาสก์ช่วยให้คุณทำการเปลี่ยนแปลงที่เฉพาะเจาะจงและแม่นยำกับรูปภาพได้ โมเดลจะทำการเปลี่ยนแปลงเฉพาะภายในพื้นที่ที่มาสก์ที่กำหนดของรูปภาพ มาสก์คือการซ้อนทับแบบดิจิทัลที่กำหนดพื้นที่เฉพาะที่คุณต้องการแก้ไข โมเดลจะตรวจหาและสร้างพื้นที่ที่มาสก์โดยอัตโนมัติ หรือคุณจะกำหนดพื้นที่ที่มาสก์ ในรูปภาพที่มาสก์ที่คุณระบุได้ โมเดลอาจต้องใช้พรอมต์ข้อความเพื่อทราบว่าควรทำการเปลี่ยนแปลงใด ทั้งนี้ขึ้นอยู่กับกรณีการใช้งาน
กรณีการใช้งานทั่วไปสำหรับการแก้ไขโดยใช้มาสก์มีดังนี้
- แทรกออบเจ็กต์ใหม่ลงในรูปภาพ
- นำวัตถุที่ไม่ต้องการออกจากรูปภาพ
- ขยายเนื้อหาของรูปภาพให้เกินขอบเดิม
- แทนที่พื้นหลังของรูปภาพ
แทรกออบเจ็กต์ (การลบวัตถุที่ไม่ต้องการ)
คุณใช้การวาดภาพเติมเพื่อแทรกออบเจ็กต์ลงในรูปภาพได้
วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและรูปภาพที่มาสก์ที่สอดคล้องกัน ซึ่งระบบสร้างขึ้นโดยอัตโนมัติหรือคุณเป็นผู้ระบุ ซึ่งกำหนดมาสก์เหนือพื้นที่ที่คุณต้องการเพิ่มเนื้อหาใหม่ นอกจากนี้ คุณยัง ระบุพรอมต์ข้อความที่อธิบายสิ่งที่คุณต้องการเพิ่มได้ด้วย จากนั้นโมเดลจะ สร้างและเพิ่มเนื้อหาใหม่ภายในพื้นที่ที่มาสก์
เช่น คุณสามารถมาสก์โต๊ะและแจ้งให้โมเดลเพิ่มแจกัน ดอกไม้ได้
นำวัตถุออก (การวาดภาพในพื้นที่)
คุณใช้การเติมภาพเพื่อนำวัตถุออก จากรูปภาพได้
วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและรูปภาพที่มาสก์ที่สอดคล้องกัน ซึ่งระบบสร้างขึ้นโดยอัตโนมัติหรือคุณเป็นผู้ระบุ โดยรูปภาพที่มาสก์จะกำหนดมาสก์เหนือออบเจ็กต์หรือชิ้นงานที่คุณต้องการนำออก นอกจากนี้ คุณยัง ระบุพรอมต์ข้อความที่อธิบายสิ่งที่คุณต้องการนำออกได้ด้วย หรือ โมเดลจะตรวจหาออบเจ็กต์ที่จะนำออกได้อย่างชาญฉลาด จากนั้นโมเดลจะ นำออบเจ็กต์ออกและเติมพื้นที่ด้วยเนื้อหาใหม่ที่เหมาะสมกับบริบท
เช่น คุณสามารถมาสก์ลูกบอลและแทนที่ด้วยผนังเปล่าหรือสนามหญ้าได้
ขยายรูปภาพให้เกินขอบเขตเดิม (การวาดภาพนอกกรอบ)
คุณใช้การวาดภาพนอกกรอบเพื่อขยายรูปภาพให้เกินขอบเขตเดิมได้
วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและรูปภาพที่มาสก์ที่สอดคล้องกัน ซึ่งระบบสร้างขึ้นโดยอัตโนมัติหรือคุณเป็นผู้ระบุ ซึ่งกำหนดมาสก์ของพื้นที่ใหม่ที่ขยาย นอกจากนี้ คุณยังระบุพรอมต์ข้อความที่อธิบายสิ่งที่ต้องการในพื้นที่ที่ขยายได้ หรือโมเดลจะตัดสินใจอย่างชาญฉลาดว่าจะให้ฉากที่มีอยู่ดำเนินต่อไปอย่างไรอย่างสมเหตุสมผล โมเดลจะสร้างเนื้อหาใหม่และเติมในพื้นที่ที่มาสก์
เช่น คุณเปลี่ยนสัดส่วนภาพหรือเพิ่มบริบทพื้นหลังได้
แทนที่พื้นหลัง
คุณสามารถแทนที่พื้นหลังของรูปภาพได้
วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและ รูปภาพที่มาสก์ที่สอดคล้องกันซึ่งกำหนดมาสก์บนพื้นหลัง โดย ใช้การตรวจหาพื้นหลังอัตโนมัติหรือระบุมาสก์ของพื้นหลัง ด้วยตนเอง นอกจากนี้ คุณยังระบุพรอมต์ข้อความที่อธิบายสิ่งที่คุณต้องการเปลี่ยนแปลงได้ด้วย จากนั้นโมเดลจะสร้างและใช้ภาพพื้นหลังใหม่
เช่น คุณสามารถเปลี่ยนการตั้งค่ารอบๆ วัตถุหรือออบเจ็กต์ได้โดยไม่ ส่งผลต่อพื้นหน้า (เช่น ในรูปภาพผลิตภัณฑ์)
การปรับแต่ง
การปรับแต่งช่วยให้คุณแก้ไขหรือสร้างรูปภาพได้โดยใช้พรอมต์ข้อความและ รูปภาพอ้างอิงที่จะแนะนำโมเดลให้สร้างรูปภาพใหม่ตามสไตล์ วัตถุ (เช่น ผลิตภัณฑ์ บุคคล หรือสัตว์) หรือการควบคุมที่ระบุ
ปรับแต่งตามสไตล์
คุณสามารถแก้ไขหรือสร้างรูปภาพตามสไตล์ที่ระบุ
วิธีการทำงาน: คุณระบุพรอมต์ข้อความและรูปภาพอ้างอิงอย่างน้อย 1 รูปที่แสดงสไตล์ที่เฉพาะเจาะจง (เช่น รูปแบบ พื้นผิว หรือสไตล์การออกแบบ) โมเดลจะใช้ข้อมูลที่ป้อนเหล่านี้เพื่อสร้างรูปภาพใหม่ตามสไตล์ที่ระบุในรูปภาพอ้างอิง
เช่น คุณสร้างรูปภาพใหม่ของห้องครัวโดยอิงตามรูปภาพจากแคตตาล็อกค้าปลีกยอดนิยมที่คุณระบุได้
ปรับแต่งตามเรื่อง
คุณสามารถแก้ไขหรือสร้างรูปภาพตามวัตถุที่ระบุ
วิธีการทำงาน: คุณระบุพรอมต์ข้อความและรูปภาพอ้างอิงอย่างน้อย 1 รูปที่แสดงวัตถุที่เฉพาะเจาะจง (เช่น ผลิตภัณฑ์ บุคคล หรือสัตว์เลี้ยง) โมเดลจะใช้ข้อมูลเหล่านี้เพื่อสร้างรูปภาพใหม่ตามวัตถุที่ระบุในรูปภาพอ้างอิง
เช่น คุณสามารถขอให้โมเดลใช้สไตล์การ์ตูนกับรูปภาพของเด็ก หรือเปลี่ยนสีจักรยานในรูปภาพได้
ปรับแต่งตามการควบคุม
คุณสามารถแก้ไขหรือสร้างรูปภาพตามการควบคุมที่ระบุได้
วิธีการทำงาน: คุณระบุพรอมต์ข้อความและรูปภาพอ้างอิงควบคุมอย่างน้อย 1 รูป (เช่น ภาพวาดหรือรูปภาพขอบ Canny) โมเดล ใช้อินพุตเหล่านี้เพื่อสร้างรูปภาพใหม่ตามรูปภาพควบคุม
เช่น คุณสามารถให้โมเดลดูภาพวาดของยานอวกาศและดวงจันทร์พร้อมกับพรอมต์ข้อความเพื่อสร้างภาพวาดสีน้ำตามภาพวาดนั้น
แสดงความคิดเห็น เกี่ยวกับประสบการณ์การใช้งาน Firebase AI Logic