ภาพรวมของการแก้ไขรูปภาพด้วย Imagen


ใช้ได้เมื่อใช้ Vertex AI Gemini API เป็นผู้ให้บริการ API เท่านั้น


Firebase AI Logic SDK ช่วยให้คุณเข้าถึงโมเดล Imagen (ผ่าน Imagen API) เพื่อให้คุณแก้ไขรูปภาพได้โดยใช้ตัวเลือกต่อไปนี้

  • การแก้ไขตามมาสก์ เช่น การแทรกและนำออบเจ็กต์ออก การขยายเนื้อหาของรูปภาพให้เกินขอบเขตเดิม และการแทนที่พื้นหลัง

  • ตัวเลือกการปรับแต่งตามสไตล์ (เช่น ลวดลาย พื้นผิว หรือสไตล์ของศิลปิน) เรื่อง (เช่น ผลิตภัณฑ์ บุคคล หรือสัตว์) หรือการควบคุม (เช่น ภาพร่างที่วาดด้วยมือ)

หน้านี้อธิบายตัวเลือกการแก้ไขแต่ละรายการในระดับสูง แต่ละตัวเลือกจะมีหน้าแยกของตัวเองพร้อมรายละเอียดและตัวอย่างโค้ดเพิ่มเติม

รุ่นที่รองรับความสามารถนี้

Imagen มีบริการแก้ไขรูปภาพผ่านโมเดล capability ดังนี้

  • imagen-3.0-capability-001

โปรดทราบว่าสำหรับโมเดล Imagen ระบบไม่รองรับตำแหน่ง global

การแก้ไขโดยใช้มาสก์

การแก้ไขตามมาสก์ช่วยให้คุณทำการเปลี่ยนแปลงที่เฉพาะเจาะจงและแม่นยำกับรูปภาพได้ โมเดลจะทำการเปลี่ยนแปลงเฉพาะภายในพื้นที่ที่มาสก์ที่กำหนดของรูปภาพ มาสก์คือการซ้อนทับแบบดิจิทัลที่กำหนดพื้นที่เฉพาะที่คุณต้องการแก้ไข โมเดลจะตรวจหาและสร้างพื้นที่ที่มาสก์โดยอัตโนมัติ หรือคุณจะกำหนดพื้นที่ที่มาสก์ ในรูปภาพที่มาสก์ที่คุณระบุได้ โมเดลอาจต้องใช้พรอมต์ข้อความเพื่อทราบว่าควรทำการเปลี่ยนแปลงใด ทั้งนี้ขึ้นอยู่กับกรณีการใช้งาน

กรณีการใช้งานทั่วไปสำหรับการแก้ไขโดยใช้มาสก์มีดังนี้

แทรกออบเจ็กต์ (การลบวัตถุที่ไม่ต้องการ)

คุณใช้การวาดภาพเติมเพื่อแทรกออบเจ็กต์ลงในรูปภาพได้

วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและรูปภาพที่มาสก์ที่สอดคล้องกัน ซึ่งระบบสร้างขึ้นโดยอัตโนมัติหรือคุณเป็นผู้ระบุ ซึ่งกำหนดมาสก์เหนือพื้นที่ที่คุณต้องการเพิ่มเนื้อหาใหม่ นอกจากนี้ คุณยัง ระบุพรอมต์ข้อความที่อธิบายสิ่งที่คุณต้องการเพิ่มได้ด้วย จากนั้นโมเดลจะ สร้างและเพิ่มเนื้อหาใหม่ภายในพื้นที่ที่มาสก์

เช่น คุณสามารถมาสก์โต๊ะและแจ้งให้โมเดลเพิ่มแจกัน ดอกไม้ได้

นำวัตถุออก (การวาดภาพในพื้นที่)

คุณใช้การเติมภาพเพื่อนำวัตถุออก จากรูปภาพได้

วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและรูปภาพที่มาสก์ที่สอดคล้องกัน ซึ่งระบบสร้างขึ้นโดยอัตโนมัติหรือคุณเป็นผู้ระบุ โดยรูปภาพที่มาสก์จะกำหนดมาสก์เหนือออบเจ็กต์หรือชิ้นงานที่คุณต้องการนำออก นอกจากนี้ คุณยัง ระบุพรอมต์ข้อความที่อธิบายสิ่งที่คุณต้องการนำออกได้ด้วย หรือ โมเดลจะตรวจหาออบเจ็กต์ที่จะนำออกได้อย่างชาญฉลาด จากนั้นโมเดลจะ นำออบเจ็กต์ออกและเติมพื้นที่ด้วยเนื้อหาใหม่ที่เหมาะสมกับบริบท

เช่น คุณสามารถมาสก์ลูกบอลและแทนที่ด้วยผนังเปล่าหรือสนามหญ้าได้

ขยายรูปภาพให้เกินขอบเขตเดิม (การวาดภาพนอกกรอบ)

คุณใช้การวาดภาพนอกกรอบเพื่อขยายรูปภาพให้เกินขอบเขตเดิมได้

วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและรูปภาพที่มาสก์ที่สอดคล้องกัน ซึ่งระบบสร้างขึ้นโดยอัตโนมัติหรือคุณเป็นผู้ระบุ ซึ่งกำหนดมาสก์ของพื้นที่ใหม่ที่ขยาย นอกจากนี้ คุณยังระบุพรอมต์ข้อความที่อธิบายสิ่งที่ต้องการในพื้นที่ที่ขยายได้ หรือโมเดลจะตัดสินใจอย่างชาญฉลาดว่าจะให้ฉากที่มีอยู่ดำเนินต่อไปอย่างไรอย่างสมเหตุสมผล โมเดลจะสร้างเนื้อหาใหม่และเติมในพื้นที่ที่มาสก์

เช่น คุณเปลี่ยนสัดส่วนภาพหรือเพิ่มบริบทพื้นหลังได้

แทนที่พื้นหลัง

คุณสามารถแทนที่พื้นหลังของรูปภาพได้

วิธีการทำงาน: คุณระบุรูปภาพต้นฉบับและ รูปภาพที่มาสก์ที่สอดคล้องกันซึ่งกำหนดมาสก์บนพื้นหลัง โดย ใช้การตรวจหาพื้นหลังอัตโนมัติหรือระบุมาสก์ของพื้นหลัง ด้วยตนเอง นอกจากนี้ คุณยังระบุพรอมต์ข้อความที่อธิบายสิ่งที่คุณต้องการเปลี่ยนแปลงได้ด้วย จากนั้นโมเดลจะสร้างและใช้ภาพพื้นหลังใหม่

เช่น คุณสามารถเปลี่ยนการตั้งค่ารอบๆ วัตถุหรือออบเจ็กต์ได้โดยไม่ ส่งผลต่อพื้นหน้า (เช่น ในรูปภาพผลิตภัณฑ์)

การปรับแต่ง

การปรับแต่งช่วยให้คุณแก้ไขหรือสร้างรูปภาพได้โดยใช้พรอมต์ข้อความและ รูปภาพอ้างอิงที่จะแนะนำโมเดลให้สร้างรูปภาพใหม่ตามสไตล์ วัตถุ (เช่น ผลิตภัณฑ์ บุคคล หรือสัตว์) หรือการควบคุมที่ระบุ

ปรับแต่งตามสไตล์

คุณสามารถแก้ไขหรือสร้างรูปภาพตามสไตล์ที่ระบุ

วิธีการทำงาน: คุณระบุพรอมต์ข้อความและรูปภาพอ้างอิงอย่างน้อย 1 รูปที่แสดงสไตล์ที่เฉพาะเจาะจง (เช่น รูปแบบ พื้นผิว หรือสไตล์การออกแบบ) โมเดลจะใช้ข้อมูลที่ป้อนเหล่านี้เพื่อสร้างรูปภาพใหม่ตามสไตล์ที่ระบุในรูปภาพอ้างอิง

เช่น คุณสร้างรูปภาพใหม่ของห้องครัวโดยอิงตามรูปภาพจากแคตตาล็อกค้าปลีกยอดนิยมที่คุณระบุได้

ปรับแต่งตามเรื่อง

คุณสามารถแก้ไขหรือสร้างรูปภาพตามวัตถุที่ระบุ

วิธีการทำงาน: คุณระบุพรอมต์ข้อความและรูปภาพอ้างอิงอย่างน้อย 1 รูปที่แสดงวัตถุที่เฉพาะเจาะจง (เช่น ผลิตภัณฑ์ บุคคล หรือสัตว์เลี้ยง) โมเดลจะใช้ข้อมูลเหล่านี้เพื่อสร้างรูปภาพใหม่ตามวัตถุที่ระบุในรูปภาพอ้างอิง

เช่น คุณสามารถขอให้โมเดลใช้สไตล์การ์ตูนกับรูปภาพของเด็ก หรือเปลี่ยนสีจักรยานในรูปภาพได้

ปรับแต่งตามการควบคุม

คุณสามารถแก้ไขหรือสร้างรูปภาพตามการควบคุมที่ระบุได้

วิธีการทำงาน: คุณระบุพรอมต์ข้อความและรูปภาพอ้างอิงควบคุมอย่างน้อย 1 รูป (เช่น ภาพวาดหรือรูปภาพขอบ Canny) โมเดล ใช้อินพุตเหล่านี้เพื่อสร้างรูปภาพใหม่ตามรูปภาพควบคุม

เช่น คุณสามารถให้โมเดลดูภาพวาดของยานอวกาศและดวงจันทร์พร้อมกับพรอมต์ข้อความเพื่อสร้างภาพวาดสีน้ำตามภาพวาดนั้น


แสดงความคิดเห็น เกี่ยวกับประสบการณ์การใช้งาน Firebase AI Logic