Phát hiện đối tượng trong hình ảnh bằng mô hình được huấn luyện bằng AutoML trên Android

Sau khi huấn luyện mô hình của riêng mình bằng AutoML Vision Edge, bạn có thể sử dụng mô hình đó trong ứng dụng để phát hiện đối tượng trong hình ảnh.

Có hai cách để tích hợp các mô hình được huấn luyện từ AutoML Vision Edge: Bạn có thể gói mô hình bằng cách đặt mô hình đó vào thư mục thành phần của ứng dụng hoặc bạn có thể tự động tải xuống từ Firebase.

Tuỳ chọn gói mô hình
Được đóng gói trong ứng dụng
  • Mô hình này nằm trong tệp APK của ứng dụng
  • Bạn có thể sử dụng mô hình ngay lập tức, ngay cả khi thiết bị Android không có kết nối mạng
  • Không cần dự án Firebase
Được lưu trữ bằng Firebase
  • Lưu trữ mô hình bằng cách tải mô hình lên Công nghệ học máy của Firebase
  • Giảm kích thước tệp APK
  • Mô hình này được tải xuống theo yêu cầu
  • Đẩy nội dung cập nhật mô hình mà không cần phát hành lại ứng dụng
  • Dễ dàng thử nghiệm A/B bằng Cấu hình từ xa Firebase
  • Cần có dự án Firebase

Trước khi bắt đầu

  1. Nếu muốn tải một mô hình xuống, hãy nhớ thêm Firebase vào dự án Android của bạn (nếu bạn chưa thêm). Đây là việc không bắt buộc khi bạn gói mô hình.

  2. Thêm các phần phụ thuộc cho thư viện Tác vụ TensorFlow Lite vào tệp gradle cấp ứng dụng của mô-đun, thường là app/build.gradle:

    Cách đóng gói mô hình với ứng dụng:

    dependencies {
      // ...
      // Object detection with a bundled Auto ML model
      implementation 'org.tensorflow:tensorflow-lite-task-vision:0.0.0-nightly-SNAPSHOT'
    }
    

    Để tải mô hình xuống một cách linh động từ Firebase, hãy thêm phần phụ thuộc Firebase ML:

    dependencies {
      // ...
      // Object detection with an Auto ML model deployed to Firebase
      implementation platform('com.google.firebase:firebase-bom:26.1.1')
      implementation 'com.google.firebase:firebase-ml-model-interpreter'
    
      implementation 'org.tensorflow:tensorflow-lite-task-vision:0.0.0-nightly'
    }
    

1. Tải mô hình

Định cấu hình nguồn mô hình cục bộ

Cách gói mô hình với ứng dụng:

  1. Giải nén mô hình từ tệp lưu trữ zip mà bạn đã tải xuống từ bảng điều khiển Google Cloud.
  2. Đưa mô hình vào gói ứng dụng:
    1. Nếu dự án của bạn không có thư mục thành phần, hãy tạo một thư mục bằng cách nhấp chuột phải vào thư mục app/, sau đó nhấp vào New > Folder > Assets Folder (Mới > Thư mục > Thư mục thành phần).
    2. Sao chép tệp mô hình tflite có siêu dữ liệu được nhúng vào thư mục tài sản.
  3. Hãy thêm nội dung sau vào tệp build.gradle của ứng dụng để đảm bảo Gradle không nén tệp mô hình khi tạo ứng dụng:

    android {
        // ...
        aaptOptions {
            noCompress "tflite"
        }
    }
    

    Tệp mô hình sẽ được đưa vào gói ứng dụng và có sẵn dưới dạng tài sản thô.

Định cấu hình nguồn mô hình được lưu trữ trên Firebase

Để sử dụng mô hình được lưu trữ từ xa, hãy tạo một đối tượng RemoteModel, chỉ định tên mà bạn đã gán cho mô hình khi phát hành:

Java

// Specify the name you assigned when you deployed the model.
FirebaseCustomRemoteModel remoteModel =
        new FirebaseCustomRemoteModel.Builder("your_model").build();

Kotlin

// Specify the name you assigned when you deployed the model.
val remoteModel =
    FirebaseCustomRemoteModel.Builder("your_model_name").build()

Sau đó, hãy bắt đầu tác vụ tải mô hình xuống, chỉ định các điều kiện mà bạn muốn cho phép tải xuống. Nếu mô hình không có trên thiết bị hoặc nếu có phiên bản mô hình mới hơn, thì tác vụ sẽ tải mô hình xuống không đồng bộ từ Firebase:

Java

DownloadConditions downloadConditions = new DownloadConditions.Builder()
        .requireWifi()
        .build();
RemoteModelManager.getInstance().download(remoteModel, downloadConditions)
        .addOnSuccessListener(new OnSuccessListener<Void>() {
            @Override
            public void onSuccess(@NonNull Task<Void> task) {
                // Success.
            }
        });

Kotlin

val downloadConditions = DownloadConditions.Builder()
    .requireWifi()
    .build()
RemoteModelManager.getInstance().download(remoteModel, downloadConditions)
    .addOnSuccessListener {
        // Success.
    }

Nhiều ứng dụng bắt đầu tác vụ tải xuống trong mã khởi chạy, nhưng bạn có thể làm như vậy bất cứ lúc nào trước khi cần sử dụng mô hình.

Tạo trình phát hiện đối tượng từ mô hình

Sau khi bạn định cấu hình các nguồn mô hình, hãy tạo một đối tượng ObjectDetector từ một trong các nguồn đó.

Nếu bạn chỉ có một mô hình được đóng gói cục bộ, bạn chỉ cần tạo một trình phát hiện đối tượng từ tệp mô hình và định cấu hình ngưỡng điểm số tin cậy mà bạn muốn yêu cầu (xem phần Đánh giá mô hình):

Java

// Initialization
ObjectDetectorOptions options = ObjectDetectorOptions.builder()
    .setScoreThreshold(0)  // Evaluate your model in the Google Cloud console
                           // to determine an appropriate value.
    .build();
ObjectDetector objectDetector = ObjectDetector.createFromFileAndOptions(context, modelFile, options);

Kotlin

// Initialization
val options = ObjectDetectorOptions.builder()
    .setScoreThreshold(0)  // Evaluate your model in the Google Cloud console
                           // to determine an appropriate value.
    .build()
val objectDetector = ObjectDetector.createFromFileAndOptions(context, modelFile, options)

Nếu có một mô hình được lưu trữ từ xa, bạn sẽ phải kiểm tra để đảm bảo rằng mô hình đó đã được tải xuống trước khi chạy. Bạn có thể kiểm tra trạng thái của tác vụ tải mô hình xuống bằng phương thức isModelDownloaded() của trình quản lý mô hình.

Mặc dù bạn chỉ phải xác nhận điều này trước khi chạy trình phát hiện đối tượng, nhưng nếu có cả mô hình được lưu trữ từ xa và mô hình được gói cục bộ, thì bạn có thể thực hiện việc kiểm tra này khi tạo thực thể của trình phát hiện đối tượng: tạo một trình phát hiện đối tượng từ mô hình từ xa nếu đã tải xuống và từ mô hình cục bộ.

Java

FirebaseModelManager.getInstance().isModelDownloaded(remoteModel)
        .addOnSuccessListener(new OnSuccessListener<Boolean>() {
            @Override
            public void onSuccess(Boolean isDownloaded) {
            }
        });

Kotlin

FirebaseModelManager.getInstance().isModelDownloaded(remoteModel)
        .addOnSuccessListener { success ->

        }

Nếu chỉ có một mô hình được lưu trữ từ xa, bạn nên tắt chức năng liên quan đến mô hình (ví dụ: chuyển sang màu xám hoặc ẩn một phần giao diện người dùng) cho đến khi bạn xác nhận mô hình đã được tải xuống. Bạn có thể thực hiện việc này bằng cách đính kèm trình nghe vào phương thức download() của trình quản lý mô hình.

Sau khi bạn biết mô hình đã được tải xuống, hãy tạo một trình phát hiện đối tượng từ tệp mô hình:

Java

FirebaseModelManager.getInstance().getLatestModelFile(remoteModel)
        .addOnCompleteListener(new OnCompleteListener<File>() {
            @Override
            public void onComplete(@NonNull Task<File> task) {
                File modelFile = task.getResult();
                if (modelFile != null) {
                    ObjectDetectorOptions options = ObjectDetectorOptions.builder()
                            .setScoreThreshold(0)
                            .build();
                    objectDetector = ObjectDetector.createFromFileAndOptions(
                            getApplicationContext(), modelFile.getPath(), options);
                }
            }
        });

Kotlin

FirebaseModelManager.getInstance().getLatestModelFile(remoteModel)
        .addOnSuccessListener { modelFile ->
            val options = ObjectDetectorOptions.builder()
                    .setScoreThreshold(0f)
                    .build()
            objectDetector = ObjectDetector.createFromFileAndOptions(
                    applicationContext, modelFile.path, options)
        }

2. Chuẩn bị hình ảnh đầu vào

Sau đó, đối với mỗi hình ảnh mà bạn muốn gắn nhãn, hãy tạo một đối tượng TensorImage từ hình ảnh đó. Bạn có thể tạo đối tượng TensorImage từ Bitmap bằng phương thức fromBitmap:

Java

TensorImage image = TensorImage.fromBitmap(bitmap);

Kotlin

val image = TensorImage.fromBitmap(bitmap)

Nếu dữ liệu hình ảnh không nằm trong Bitmap, bạn có thể tải một mảng pixel như trong tài liệu về TensorFlow Lite.

3. Chạy trình phát hiện đối tượng

Để phát hiện các đối tượng trong hình ảnh, hãy truyền đối tượng TensorImage vào phương thức detect() của ObjectDetector.

Java

List<Detection> results = objectDetector.detect(image);

Kotlin

val results = objectDetector.detect(image)

4. Nhận thông tin về các đối tượng được gắn nhãn

Nếu thành công, thao tác phát hiện đối tượng sẽ trả về danh sách các đối tượng Detection. Mỗi đối tượng Detection đại diện cho một đối tượng đã được phát hiện trong hình ảnh. Bạn có thể lấy hộp giới hạn và nhãn của từng đối tượng.

Ví dụ:

Java

for (Detection result : results) {
    RectF bounds = result.getBoundingBox();
    List<Category> labels = result.getCategories();
}

Kotlin

for (result in results) {
    val bounds = result.getBoundingBox()
    val labels = result.getCategories()
}

Mẹo cải thiện hiệu suất theo thời gian thực

Nếu bạn muốn gắn nhãn hình ảnh trong một ứng dụng theo thời gian thực, hãy làm theo các nguyên tắc sau để đạt được tốc độ khung hình tốt nhất:

  • Điều tiết các lệnh gọi đến trình gắn nhãn hình ảnh. Nếu có một khung video mới trong khi trình gắn nhãn hình ảnh đang chạy, hãy bỏ khung đó. Hãy xem lớp VisionProcessorBase trong ứng dụng mẫu bắt đầu nhanh để biết ví dụ.
  • Nếu bạn đang sử dụng kết quả của trình gắn nhãn hình ảnh để phủ hình ảnh đồ hoạ lên hình ảnh đầu vào, trước tiên, hãy lấy kết quả, sau đó kết xuất hình ảnh và phủ trong một bước. Bằng cách này, bạn chỉ kết xuất một lần cho mỗi khung đầu vào trên bề mặt hiển thị. Hãy xem các lớp CameraSourcePreview GraphicOverlay trong ứng dụng mẫu bắt đầu nhanh để biết ví dụ.
  • Nếu bạn sử dụng API Camera2, hãy chụp ảnh ở định dạng ImageFormat.YUV_420_888.

    Nếu bạn sử dụng API Máy ảnh cũ, hãy chụp ảnh ở định dạng ImageFormat.NV21.