Addestra un modello di etichettatura delle immagini con AutoML Vision Edge

Per addestrare un modello di etichettatura delle immagini, fornisci ad AutoML Vision Edge un insieme di immagini e le etichette corrispondenti. AutoML Vision Edge utilizza questo set di dati per addestrare un nuovo modello nel cloud, che puoi utilizzare per l'etichettatura delle immagini on-device nella tua app. (Per informazioni generali su questa funzionalità, consulta la panoramica.)

AutoML Vision Edge è un servizio Google Cloud. L'utilizzo del servizio è soggetto al Contratto di licenza della piattaforma Google Cloud e ai Termini di servizio specifici e viene fatturato di conseguenza. Per informazioni sulla fatturazione, consulta la pagina Prezzi di AutoML.

Prima di iniziare

Se non hai ancora un progetto Firebase o Google Cloud, creane uno nella Firebase console.
Acquisisci familiarità con le linee guida presentate nella Guida al machine learning inclusivo - AutoML.
Se vuoi solo provare AutoML Vision Edge e non hai i tuoi dati di addestramento, scarica un set di dati di esempio, ad esempio uno dei seguenti:
- Il set di dati di esempio ufficiale di immagini floreali di TensorFlow
- Questo set di dati dell'alfabeto della lingua dei segni americana (ASL)
Puoi trovare altri set di dati ospitati su Kaggle.

1. Assembla i dati di addestramento

Innanzitutto, devi creare un set di dati di addestramento di immagini etichettate. Tieni presenti le seguenti linee guida:

Le immagini devono essere in uno dei seguenti formati: JPEG, PNG, GIF, BMP, ICO.
Ogni immagine deve avere dimensioni massime pari a 30 MB. Tieni presente che AutoML Vision Edge ridimensiona la maggior parte delle immagini durante la preelaborazione, quindi in genere non è vantaggioso in termini di precisione fornire immagini ad altissima risoluzione.
Includi almeno 10 e, preferibilmente, 100 o più esempi di ogni etichetta.
Includi più angolazioni, risoluzioni e sfondi per ogni etichetta.
I dati di addestramento devono essere il più possibile simili ai dati su cui devono essere effettuate le previsioni. Ad esempio, se il tuo caso d'uso prevede immagini sfocate e a bassa risoluzione (ad esempio quelle di una videocamera di sicurezza), i dati di addestramento devono essere composti da immagini sfocate e a bassa risoluzione.
I modelli generati da AutoML Vision Edge sono ottimizzati per le fotografie di oggetti nel mondo reale. Potrebbero non funzionare bene per radiografie, disegni a mano, documenti scansionati, ricevute e così via.

Inoltre, i modelli in genere non possono prevedere etichette che gli esseri umani non possono assegnare. Pertanto, se una persona non riesce ad assegnare etichette guardando l'immagine per 1-2 secondi, è probabile che non sia possibile addestrare il modello a farlo.

Quando le immagini di addestramento sono pronte, preparale per l'importazione in Firebase. Hai a disposizione tre opzioni:

Opzione 1: archivio zip strutturato

Organizza le immagini di addestramento in directory, ognuna denominata in base a un'etichetta e contenente immagini che sono esempi di quell'etichetta. Quindi, comprimi la struttura della directory in un archivio ZIP.

I nomi delle directory in questo archivio zip possono contenere fino a 32 caratteri ASCII e possono contenere solo caratteri alfanumerici e il carattere di sottolineatura (_).

Ad esempio:

my_training_data.zip
  |____accordion
  | |____001.jpg
  | |____002.jpg
  | |____003.jpg
  |____bass_guitar
  | |____hofner.gif
  | |____p-bass.png
  |____clavier
    |____well-tempered.jpg
    |____well-tempered (1).jpg
    |____well-tempered (2).jpg

Opzione 2: Cloud Storage con indice CSV

Carica le immagini di addestramento su Google Cloud Storage e prepara un file CSV che elenca l'URL di ogni immagine e, facoltativamente, le etichette corrette per ogni immagine. Questa opzione è utile quando si utilizzano set di dati molto grandi.

Ad esempio, carica le immagini su Cloud Storage e prepara un file CSV come il seguente:

gs://your-training-data-bucket/001.jpg,accordion
gs://your-training-data-bucket/002.jpg,accordion
gs://your-training-data-bucket/003.jpg,accordion
gs://your-training-data-bucket/hofner.gif,bass_guitar
gs://your-training-data-bucket/p-bass.png,bass_guitar
gs://your-training-data-bucket/well-tempered.jpg,clavier
gs://your-training-data-bucket/well-tempered%20(1).jpg,clavier
gs://your-training-data-bucket/well-tempered%20(2).jpg,clavier

Le immagini devono essere archiviate in un bucket che fa parte del progetto Google Cloud corrispondente del progetto Firebase.

Per saperne di più sulla preparazione del file CSV, consulta Preparazione dei dati di addestramento nella documentazione di Cloud AutoML Vision.

Opzione 3: immagini senza etichetta

Etichetta le immagini di addestramento nella console Firebase dopo averle caricate, singolarmente o in un file ZIP non strutturato. Vedi il passaggio successivo.

2. Addestra il modello

Poi, addestra un modello utilizzando le tue immagini:

Apri la pagina Vision Datasets nella console Google Cloud. Quando richiesto, seleziona il tuo progetto.
Fai clic su Nuovo set di dati, fornisci un nome per il set di dati, seleziona il tipo di modello che vuoi addestrare e fai clic su Crea set di dati.
Nella scheda Importa del set di dati, carica un archivio zip delle immagini di addestramento o un file CSV contenente le posizioni Cloud Storage in cui le hai caricate. Vedi Assemblare i dati di addestramento.
Al termine dell'attività di importazione, utilizza la scheda Immagini per verificare i dati di addestramento ed etichettare le immagini senza etichetta.

Nella scheda Addestra, fai clic su Inizia addestramento.

Assegna un nome al modello e seleziona il tipo di modello Edge.

Configura le seguenti impostazioni di addestramento, che regolano le prestazioni del modello generato:

Ottimizza il modello per…

La configurazione del modello da utilizzare. Puoi addestrare modelli più veloci e più piccoli quando sono importanti la bassa latenza o le dimensioni ridotte del pacchetto oppure modelli più lenti e più grandi quando l'accuratezza è più importante.

Budget per l'ora nodo

Il tempo massimo, in ore di calcolo, da dedicare all'addestramento del modello. Un maggiore tempo di addestramento in genere produce un modello più accurato.

Tieni presente che l'addestramento può essere completato in meno tempo di quello specificato se il sistema determina che il modello è ottimizzato e un addestramento aggiuntivo non migliorerebbe l'accuratezza. Ti vengono addebitati solo i costi per le ore effettivamente utilizzate.

Tempi di addestramento tipici
Set molto piccoli	1 ora
500 immagini	2 ore
1000 immagini	3 ore
5000 immagini	6 ore
10.000 immagini	7 ore
50.000 immagini	11 ore
100.000 immagini	13 ore
1.000.000 di immagini	18 ore

3. valuta il modello

Al termine dell'addestramento, puoi fare clic sulla scheda Valuta per visualizzare le metriche di rendimento del modello.

Uno degli usi più importanti di questa pagina è determinare la soglia di confidenza ottimale per il tuo modello. La soglia di confidenza è la confidenza minima che il modello deve avere per assegnare un'etichetta a un'immagine. Spostando il cursore della soglia di affidabilità, puoi vedere in che modo le diverse soglie influiscono sul rendimento del modello. Il rendimento del modello viene misurato utilizzando due metriche: precisione e richiamo.

Nel contesto della classificazione delle immagini, la precisione è il rapporto tra il numero di immagini etichettate correttamente e il numero di immagini etichettate dal modello in base alla soglia selezionata. Quando un modello ha una precisione elevata, assegna etichette in modo errato meno spesso (meno falsi positivi).

Richiamo è il rapporto tra il numero di immagini etichettate correttamente e il numero di immagini con contenuti che il modello avrebbe dovuto essere in grado di etichettare. Quando un modello ha un richiamo elevato, non riesce ad assegnare un'etichetta meno spesso (meno falsi negativi).

L'ottimizzazione per la precisione o il richiamo dipende dal caso d'uso. Per saperne di più, consulta la guida per principianti di AutoML Vision e la guida al machine learning inclusivo - AutoML.

Quando trovi una soglia di confidenza che produce metriche soddisfacenti, prendine nota, perché la utilizzerai per configurare il modello nella tua app. Puoi utilizzare questo strumento in qualsiasi momento per ottenere un valore di soglia appropriato.

4. Pubblicare o scaricare il modello

Se ritieni che le prestazioni del modello vadano bene e vuoi utilizzarlo in un'app, hai tre opzioni, tra cui puoi scegliere qualsiasi combinazione: eseguire il deployment del modello per la previsione online, pubblicare il modello su Firebase o scaricare il modello e raggrupparlo con la tua app.

Esegui il deployment del modello

Nella scheda Testa e utilizza del set di dati, puoi eseguire il deployment del modello per la previsione online, che esegue il modello nel cloud. Questa opzione è trattata nella documentazione di Cloud AutoML. La documentazione di questo sito riguarda le altre due opzioni.

Pubblica il modello

Se pubblichi il modello su Firebase, puoi aggiornarlo senza rilasciare una nuova versione dell'app e puoi utilizzare Remote Config e A/B Testing per mostrare dinamicamente modelli diversi a diversi gruppi di utenti.

Se scegli di fornire solo il modello ospitandolo con Firebase e non di raggrupparlo con la tua app, puoi ridurre le dimensioni del download iniziale dell'app. Tieni presente, tuttavia, che se il modello non è raggruppato con la tua app, qualsiasi funzionalità correlata al modello non sarà disponibile finché l'app non scarica il modello per la prima volta.

Per pubblicare il modello, puoi utilizzare uno dei due metodi:

Scarica il modello TF Lite dalla pagina Testa e utilizza del set di dati nella console Google Cloud, quindi caricalo nella pagina Modello personalizzato della console Firebase. In genere è il modo più semplice per pubblicare un singolo modello.
Pubblica il modello direttamente dal tuo progetto Google Cloud su Firebase utilizzando l'SDK Admin. Puoi utilizzare questo metodo per pubblicare in batch più modelli o per creare pipeline di pubblicazione automatizzate.

Per pubblicare il modello con l'API di gestione dei modelli dell'SDK Admin:

Installa e inizializza l'SDK.

Pubblica il modello.

Dovrai specificare l'identificatore della risorsa del modello, ovvero una stringa simile all'esempio seguente:

projects/PROJECT_NUMBER/locations/us-central1/models/MODEL_ID

`PROJECT_NUMBER`	Il numero di progetto del bucket Cloud Storage che contiene il modello. Potrebbe trattarsi del tuo progetto Firebase o di un altro progetto Google Cloud. Puoi trovare questo valore nella pagina Impostazioni della console Firebase o nella dashboard della console Google Cloud.
`MODEL_ID`	L'ID del modello, ottenuto dall'API AutoML Cloud.

Python

# First, import and initialize the SDK.

# Get a reference to the AutoML model
source = ml.TFLiteAutoMlSource('projects/{}/locations/us-central1/models/{}'.format(
    # See above for information on these values.
    project_number,
    model_id
))

# Create the model object
tflite_format = ml.TFLiteFormat(model_source=source)
model = ml.Model(
    display_name="example_model",  # This is the name you will use from your app to load the model.
    tags=["examples"],             # Optional tags for easier management.
    model_format=tflite_format)

# Add the model to your Firebase project and publish it
new_model = ml.create_model(model)
new_model.wait_for_unlocked()
ml.publish_model(new_model.model_id)

Node.js

// First, import and initialize the SDK.

(async () => {
  // Get a reference to the AutoML model. See above for information on these
  // values.
  const automlModel = `projects/${projectNumber}/locations/us-central1/models/${modelId}`;

  // Create the model object and add the model to your Firebase project.
  const model = await ml.createModel({
    displayName: 'example_model',  // This is the name you use from your app to load the model.
    tags: ['examples'],  // Optional tags for easier management.
    tfliteModel: { automlModel: automlModel },
  });

  // Wait for the model to be ready.
  await model.waitForUnlocked();

  // Publish the model.
  await ml.publishModel(model.modelId);

  process.exit();
})().catch(console.error);

Scaricare e raggruppare il modello con l'app

Se raggruppi il modello con l'app, puoi assicurarti che le funzionalità di ML dell'app continuino a funzionare anche quando il modello ospitato su Firebase non è disponibile.

Se pubblichi il modello e lo raggruppi con la tua app, quest'ultima utilizzerà la versione più recente disponibile.

Per scaricare il modello, fai clic su TF Lite nella pagina Testa e utilizza del set di dati.

Passaggi successivi

Ora che hai pubblicato o scaricato il modello, scopri come utilizzarlo nelle tue app iOS+ e Android.