Catch up on highlights from Firebase at Google I/O 2023. Learn more

Theo dõi và phát hiện đối tượng

Với API theo dõi và phát hiện đối tượng trên thiết bị của ML Kit, bạn có thể khoanh vùng và theo dõi trong thời gian thực các đối tượng nổi bật nhất trong nguồn cấp dữ liệu hình ảnh hoặc camera trực tiếp. Bạn cũng có thể tùy chọn phân loại các đối tượng được phát hiện thành một trong một số danh mục chung.

Phát hiện và theo dõi đối tượng với phân loại thô rất hữu ích để xây dựng trải nghiệm tìm kiếm trực quan. Do việc phát hiện và theo dõi đối tượng diễn ra nhanh chóng và hoàn toàn trên thiết bị nên nó hoạt động tốt như phần đầu của một đường dẫn tìm kiếm trực quan dài hơn. Sau khi phát hiện và lọc các đối tượng, bạn có thể chuyển chúng đến một phần mềm phụ trợ đám mây, chẳng hạn như Tìm kiếm Sản phẩm Cloud Vision hoặc đến một mô hình tùy chỉnh, chẳng hạn như một mô hình bạn đã đào tạo bằng AutoML Vision Edge .

iOS Android

Các khả năng chính

Phát hiện và theo dõi đối tượng nhanh chóng Phát hiện các đối tượng và lấy vị trí của chúng trong hình ảnh. Theo dõi các đối tượng trên các hình ảnh.
Mô hình trên thiết bị được tối ưu hóa Mô hình theo dõi và phát hiện đối tượng được tối ưu hóa cho thiết bị di động và được thiết kế để sử dụng trong các ứng dụng thời gian thực, ngay cả trên các thiết bị cấp thấp hơn.
Phát hiện đối tượng nổi bật Tự động xác định đối tượng nổi bật nhất trong hình ảnh.
Phân loại thô Phân loại đối tượng thành các danh mục rộng, bạn có thể sử dụng để lọc ra các đối tượng mà bạn không quan tâm. Các danh mục sau được hỗ trợ: hàng gia dụng, hàng thời trang, thực phẩm, thực vật, địa điểm và không xác định.

Kết quả ví dụ

Theo dõi đối tượng nổi bật nhất trên các hình ảnh

ID theo dõi 0
Bounds (95, 45), (496, 45), (496, 240), (95, 240)
Loại NƠI
Độ tin cậy phân loại 0,9296875
ID theo dõi 0
Bounds (84, 46), (478, 46), (478, 247), (84, 247)
Loại NƠI
Độ tin cậy phân loại 0,8710938
ID theo dõi 0
Bounds (53, 45), (519, 45), (519, 240), (53, 240)
Loại NƠI
Độ tin cậy phân loại 0,8828125

Ảnh: Christian Ferrer [CC BY-SA 4.0]

Nhiều đối tượng trong một hình ảnh tĩnh

Đối tượng 0
Bounds (1, 97), (332, 97), (332, 332), (1, 332)
Loại FASHION_GOOD
Độ tin cậy phân loại 0,95703125
Đối tượng 1
Bounds (186, 80), (337, 80), (337, 226), (186, 226)
Loại FASHION_GOOD
Độ tin cậy phân loại 0,84375
Đối tượng 2
Bounds (296, 80), (472, 80), (472, 388), (296, 388)
Loại FASHION_GOOD
Độ tin cậy phân loại 0,94921875
Đối tượng 3
Bounds (439, 83), (615, 83), (615, 306), (439, 306)
Loại FASHION_GOOD
Độ tin cậy phân loại 0,9375