אפשר להשתמש ב-ML Kit כדי לזהות פנים בתמונות ובסרטונים.
לפני שמתחילים
- אם עדיין לא עשיתם זאת, מוסיפים את Firebase לפרויקט Android.
- מוסיפים את יחסי התלות של ספריות ML Kit ל-Android לקובץ Gradle של המודול (ברמת האפליקציה) (בדרך כלל app/build.gradle):apply plugin: 'com.android.application' apply plugin: 'com.google.gms.google-services' dependencies { // ... implementation 'com.google.firebase:firebase-ml-vision:24.0.3' // If you want to detect face contours (landmark detection and classification // don't require this additional model): implementation 'com.google.firebase:firebase-ml-vision-face-model:20.0.1' } 
- 
  אופציונלי אבל מומלץ: מגדירים את האפליקציה כך שתוריד את מודל ה-ML למכשיר באופן אוטומטי אחרי שתתקינו את האפליקציה מחנות Play.
  כדי לעשות זאת, מוסיפים את ההצהרה הבאה לקובץ AndroidManifest.xmlשל האפליקציה:<application ...> ... <meta-data android:name="com.google.firebase.ml.vision.DEPENDENCIES" android:value="face" /> <!-- To use multiple models: android:value="face,model2,model3" --> </application> 
הנחיות לתמונות קלט
כדי ש-ML Kit יזהה פנים בצורה מדויקת, תמונות הקלט חייבות להכיל פנים שמיוצגים על ידי מספיק נתוני פיקסלים. באופן כללי, כל פנים שרוצים לזהות בתמונה צריכים להיות בגודל של 100x100 פיקסלים לפחות. אם רוצים לזהות את קווי המתאר של הפנים, צריך להזין ל-ML Kit קלט ברזולוציה גבוהה יותר: כל פנים צריך להיות בגודל של 200x200 פיקסלים לפחות.
אם אתם מזהים פנים באפליקציה בזמן אמת, כדאי גם להביא בחשבון את המימדים הכוללים של תמונות הקלט. קל יותר לעבד תמונות קטנות יותר, ולכן כדי לקצר את זמן האחזור, כדאי לצלם תמונות ברזולוציות נמוכות יותר (תוך שמירה על דרישות הדיוק שמפורטות למעלה) ולוודא שפניו של האדם שרוצים לזהות תופסים כמה שיותר מהתמונה. כדאי לעיין גם בטיפים לשיפור הביצועים בזמן אמת.
מיקוד לקוי של התמונה עלול לפגוע בדיוק. אם התוצאות לא מתקבלות, נסו לבקש מהמשתמש לצלם מחדש את התמונה.
גם הכיוון של הפנים ביחס למצלמה יכול להשפיע על מאפייני הפנים ש-ML Kit מזהה. מושגים של זיהוי פנים
1. הגדרת הכלי לזיהוי פנים
לפני שמפעילים זיהוי פנים בתמונה, אם רוצים לשנות את הגדרות ברירת המחדל של הכלי לזיהוי פנים, צריך לציין את ההגדרות האלה באמצעות אובייקטFirebaseVisionFaceDetectorOptions.
אתם יכולים לשנות את ההגדרות הבאות:
| הגדרות | |
|---|---|
| מצב ביצועים | FAST(ברירת מחדל)
        |ACCURATEלהעדיף מהירות או דיוק בזיהוי פנים. | 
| זיהוי ציוני דרך | NO_LANDMARKS(ברירת מחדל)
        |ALL_LANDMARKSאם לנסות לזהות 'נקודות ציון' בפנים: עיניים, אוזניים, אף, לחיים, פה וכו'. | 
| זיהוי קווי מתאר | NO_CONTOURS(ברירת מחדל)
        |ALL_CONTOURSהאם לזהות את קווי המתאר של תכונות הפנים. קווי המתאר מזוהים רק בפנים הבולטים ביותר בתמונה. | 
| סיווג פנים | NO_CLASSIFICATIONS(ברירת מחדל)
          |ALL_CLASSIFICATIONSהאם לסווג את הפנים לקטגוריות כמו 'חיוך' ו'עיניים פקוחות'. | 
| גודל מינימלי של תצוגת השעון | float(ברירת מחדל:0.1f)הגודל המינימלי של הפנים לזיהוי, ביחס לתמונה. | 
| הפעלת מעקב אחר פנים | false(ברירת מחדל) |trueאם להקצות לפנים מזהה, שאפשר להשתמש בו למעקב אחרי פנים בתמונות שונות. חשוב לזכור שכאשר התכונה 'זיהוי קווי מתאר' מופעלת, מזוהה רק פנים אחד, ולכן מעקב אחר הפנים לא מניב תוצאות שימושיות. לכן, וכדי לשפר את מהירות הזיהוי, לא מומלץ להפעיל גם זיהוי קווי מתאר וגם מעקב אחר פנים. | 
לדוגמה:
Java
// High-accuracy landmark detection and face classification FirebaseVisionFaceDetectorOptions highAccuracyOpts = new FirebaseVisionFaceDetectorOptions.Builder() .setPerformanceMode(FirebaseVisionFaceDetectorOptions.ACCURATE) .setLandmarkMode(FirebaseVisionFaceDetectorOptions.ALL_LANDMARKS) .setClassificationMode(FirebaseVisionFaceDetectorOptions.ALL_CLASSIFICATIONS) .build(); // Real-time contour detection of multiple faces FirebaseVisionFaceDetectorOptions realTimeOpts = new FirebaseVisionFaceDetectorOptions.Builder() .setContourMode(FirebaseVisionFaceDetectorOptions.ALL_CONTOURS) .build();
Kotlin
// High-accuracy landmark detection and face classification val highAccuracyOpts = FirebaseVisionFaceDetectorOptions.Builder() .setPerformanceMode(FirebaseVisionFaceDetectorOptions.ACCURATE) .setLandmarkMode(FirebaseVisionFaceDetectorOptions.ALL_LANDMARKS) .setClassificationMode(FirebaseVisionFaceDetectorOptions.ALL_CLASSIFICATIONS) .build() // Real-time contour detection of multiple faces val realTimeOpts = FirebaseVisionFaceDetectorOptions.Builder() .setContourMode(FirebaseVisionFaceDetectorOptions.ALL_CONTOURS) .build()
2. הפעלת הכלי לזיהוי פנים
כדי לזהות פנים בתמונה, יוצרים אובייקטFirebaseVisionImage מ-Bitmap, מ-media.Image, מ-ByteBuffer, ממערך בייטים או מקובץ במכשיר. לאחר מכן מעבירים את האובייקט FirebaseVisionImage לשיטה detectInImage של FirebaseVisionFaceDetector.
לזיהוי פנים, צריך להשתמש בתמונה בגודל של 480x360 פיקסלים לפחות. אם אתם מזהים פנים בזמן אמת, צילום של פריימים ברזולוציה המינימלית הזו יכול לעזור לצמצם את זמן האחזור.
- יוצרים אובייקט - FirebaseVisionImageמהתמונה.- 
    כדי ליצור אובייקט FirebaseVisionImageמאובייקטmedia.Image, למשל כשיוצרים תמונה ממצלמת המכשיר, מעבירים את האובייקטmedia.Imageואת סיבוב התמונה אלFirebaseVisionImage.fromMediaImage().אם אתם משתמשים בספרייה CameraX, הערך של הזווית מסתובב בעצמו על ידי הכיתות OnImageCapturedListenerו-ImageAnalysis.Analyzer, כך שצריך רק להמיר את הזווית לאחד מהקבועיםROTATION_של ML Kit לפני שמפעילים אתFirebaseVisionImage.fromMediaImage():Javaprivate class YourAnalyzer implements ImageAnalysis.Analyzer { private int degreesToFirebaseRotation(int degrees) { switch (degrees) { case 0: return FirebaseVisionImageMetadata.ROTATION_0; case 90: return FirebaseVisionImageMetadata.ROTATION_90; case 180: return FirebaseVisionImageMetadata.ROTATION_180; case 270: return FirebaseVisionImageMetadata.ROTATION_270; default: throw new IllegalArgumentException( "Rotation must be 0, 90, 180, or 270."); } } @Override public void analyze(ImageProxy imageProxy, int degrees) { if (imageProxy == null || imageProxy.getImage() == null) { return; } Image mediaImage = imageProxy.getImage(); int rotation = degreesToFirebaseRotation(degrees); FirebaseVisionImage image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation); // Pass image to an ML Kit Vision API // ... } } Kotlinprivate class YourImageAnalyzer : ImageAnalysis.Analyzer { private fun degreesToFirebaseRotation(degrees: Int): Int = when(degrees) { 0 -> FirebaseVisionImageMetadata.ROTATION_0 90 -> FirebaseVisionImageMetadata.ROTATION_90 180 -> FirebaseVisionImageMetadata.ROTATION_180 270 -> FirebaseVisionImageMetadata.ROTATION_270 else -> throw Exception("Rotation must be 0, 90, 180, or 270.") } override fun analyze(imageProxy: ImageProxy?, degrees: Int) { val mediaImage = imageProxy?.image val imageRotation = degreesToFirebaseRotation(degrees) if (mediaImage != null) { val image = FirebaseVisionImage.fromMediaImage(mediaImage, imageRotation) // Pass image to an ML Kit Vision API // ... } } } אם אתם לא משתמשים בספריית מצלמה שמספקת את כיוון התמונה, תוכלו לחשב אותו לפי כיוון המכשיר וכיוון החיישן של המצלמה במכשיר: Javaprivate static final SparseIntArray ORIENTATIONS = new SparseIntArray(); static { ORIENTATIONS.append(Surface.ROTATION_0, 90); ORIENTATIONS.append(Surface.ROTATION_90, 0); ORIENTATIONS.append(Surface.ROTATION_180, 270); ORIENTATIONS.append(Surface.ROTATION_270, 180); } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) private int getRotationCompensation(String cameraId, Activity activity, Context context) throws CameraAccessException { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation(); int rotationCompensation = ORIENTATIONS.get(deviceRotation); // On most devices, the sensor orientation is 90 degrees, but for some // devices it is 270 degrees. For devices with a sensor orientation of // 270, rotate the image an additional 180 ((270 + 270) % 360) degrees. CameraManager cameraManager = (CameraManager) context.getSystemService(CAMERA_SERVICE); int sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION); rotationCompensation = (rotationCompensation + sensorOrientation + 270) % 360; // Return the corresponding FirebaseVisionImageMetadata rotation value. int result; switch (rotationCompensation) { case 0: result = FirebaseVisionImageMetadata.ROTATION_0; break; case 90: result = FirebaseVisionImageMetadata.ROTATION_90; break; case 180: result = FirebaseVisionImageMetadata.ROTATION_180; break; case 270: result = FirebaseVisionImageMetadata.ROTATION_270; break; default: result = FirebaseVisionImageMetadata.ROTATION_0; Log.e(TAG, "Bad rotation value: " + rotationCompensation); } return result; } Kotlinprivate val ORIENTATIONS = SparseIntArray() init { ORIENTATIONS.append(Surface.ROTATION_0, 90) ORIENTATIONS.append(Surface.ROTATION_90, 0) ORIENTATIONS.append(Surface.ROTATION_180, 270) ORIENTATIONS.append(Surface.ROTATION_270, 180) } /** * Get the angle by which an image must be rotated given the device's current * orientation. */ @RequiresApi(api = Build.VERSION_CODES.LOLLIPOP) @Throws(CameraAccessException::class) private fun getRotationCompensation(cameraId: String, activity: Activity, context: Context): Int { // Get the device's current rotation relative to its "native" orientation. // Then, from the ORIENTATIONS table, look up the angle the image must be // rotated to compensate for the device's rotation. val deviceRotation = activity.windowManager.defaultDisplay.rotation var rotationCompensation = ORIENTATIONS.get(deviceRotation) // On most devices, the sensor orientation is 90 degrees, but for some // devices it is 270 degrees. For devices with a sensor orientation of // 270, rotate the image an additional 180 ((270 + 270) % 360) degrees. val cameraManager = context.getSystemService(CAMERA_SERVICE) as CameraManager val sensorOrientation = cameraManager .getCameraCharacteristics(cameraId) .get(CameraCharacteristics.SENSOR_ORIENTATION)!! rotationCompensation = (rotationCompensation + sensorOrientation + 270) % 360 // Return the corresponding FirebaseVisionImageMetadata rotation value. val result: Int when (rotationCompensation) { 0 -> result = FirebaseVisionImageMetadata.ROTATION_0 90 -> result = FirebaseVisionImageMetadata.ROTATION_90 180 -> result = FirebaseVisionImageMetadata.ROTATION_180 270 -> result = FirebaseVisionImageMetadata.ROTATION_270 else -> { result = FirebaseVisionImageMetadata.ROTATION_0 Log.e(TAG, "Bad rotation value: $rotationCompensation") } } return result } לאחר מכן מעבירים את האובייקט media.Imageואת ערך הסיבוב אלFirebaseVisionImage.fromMediaImage():JavaFirebaseVisionImage image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation); Kotlinval image = FirebaseVisionImage.fromMediaImage(mediaImage, rotation) 
- כדי ליצור אובייקט FirebaseVisionImageמכתובת URI של קובץ, מעבירים את הקשר של האפליקציה ואת כתובת ה-URI של הקובץ אלFirebaseVisionImage.fromFilePath(). האפשרות הזו שימושית כשמשתמשים בכוונהACTION_GET_CONTENTכדי לבקש מהמשתמש לבחור תמונה מאפליקציית הגלריה שלו.JavaFirebaseVisionImage image; try { image = FirebaseVisionImage.fromFilePath(context, uri); } catch (IOException e) { e.printStackTrace(); } Kotlinval image: FirebaseVisionImage try { image = FirebaseVisionImage.fromFilePath(context, uri) } catch (e: IOException) { e.printStackTrace() } 
- כדי ליצור אובייקט FirebaseVisionImageמ-ByteBufferאו ממערך בייטים, קודם מחשבים את סיבוב התמונה כפי שמתואר למעלה עבור קלטmedia.Image.לאחר מכן יוצרים אובייקט FirebaseVisionImageMetadataשמכיל את הגובה, הרוחב, פורמט קידוד הצבע והסיבוב של התמונה:JavaFirebaseVisionImageMetadata metadata = new FirebaseVisionImageMetadata.Builder() .setWidth(480) // 480x360 is typically sufficient for .setHeight(360) // image recognition .setFormat(FirebaseVisionImageMetadata.IMAGE_FORMAT_NV21) .setRotation(rotation) .build(); Kotlinval metadata = FirebaseVisionImageMetadata.Builder() .setWidth(480) // 480x360 is typically sufficient for .setHeight(360) // image recognition .setFormat(FirebaseVisionImageMetadata.IMAGE_FORMAT_NV21) .setRotation(rotation) .build() משתמשים במאגר או במערך ובאובייקט המטא-נתונים כדי ליצור אובייקט FirebaseVisionImage:JavaFirebaseVisionImage image = FirebaseVisionImage.fromByteBuffer(buffer, metadata); // Or: FirebaseVisionImage image = FirebaseVisionImage.fromByteArray(byteArray, metadata); Kotlinval image = FirebaseVisionImage.fromByteBuffer(buffer, metadata) // Or: val image = FirebaseVisionImage.fromByteArray(byteArray, metadata) 
- כדי ליצור אובייקט FirebaseVisionImageמאובייקטBitmap:התמונה שמיוצגת על ידי האובייקטJavaFirebaseVisionImage image = FirebaseVisionImage.fromBitmap(bitmap); Kotlinval image = FirebaseVisionImage.fromBitmap(bitmap) Bitmapחייבת להיות מוצבת בצורה זקופה, ללא צורך בסיבוב נוסף.
 
- 
    
- אחזור מופע של - FirebaseVisionFaceDetector:- Java- FirebaseVisionFaceDetector detector = FirebaseVision.getInstance() .getVisionFaceDetector(options); - Kotlin- val detector = FirebaseVision.getInstance() .getVisionFaceDetector(options) 
- לבסוף, מעבירים את התמונה לשיטה - detectInImage:- Java- Task<List<FirebaseVisionFace>> result = detector.detectInImage(image) .addOnSuccessListener( new OnSuccessListener<List<FirebaseVisionFace>>() { @Override public void onSuccess(List<FirebaseVisionFace> faces) { // Task completed successfully // ... } }) .addOnFailureListener( new OnFailureListener() { @Override public void onFailure(@NonNull Exception e) { // Task failed with an exception // ... } }); - Kotlin- val result = detector.detectInImage(image) .addOnSuccessListener { faces -> // Task completed successfully // ... } .addOnFailureListener { e -> // Task failed with an exception // ... } 
3. קבלת מידע על פנים שזוהו
אם פעולת זיהוי הפנים תצליח, רשימה של אובייקטים מסוגFirebaseVisionFace תועבר למאזין להצלחה. כל אובייקט FirebaseVisionFace מייצג פנים שזוהו בתמונה. לכל פנים, אפשר לקבל את קואורדינטות המסגרת שלו בתמונה הקלט, וגם כל מידע אחר שהגדרתם לזיהוי הפנים למצוא. לדוגמה:
Java
for (FirebaseVisionFace face : faces) { Rect bounds = face.getBoundingBox(); float rotY = face.getHeadEulerAngleY(); // Head is rotated to the right rotY degrees float rotZ = face.getHeadEulerAngleZ(); // Head is tilted sideways rotZ degrees // If landmark detection was enabled (mouth, ears, eyes, cheeks, and // nose available): FirebaseVisionFaceLandmark leftEar = face.getLandmark(FirebaseVisionFaceLandmark.LEFT_EAR); if (leftEar != null) { FirebaseVisionPoint leftEarPos = leftEar.getPosition(); } // If contour detection was enabled: List<FirebaseVisionPoint> leftEyeContour = face.getContour(FirebaseVisionFaceContour.LEFT_EYE).getPoints(); List<FirebaseVisionPoint> upperLipBottomContour = face.getContour(FirebaseVisionFaceContour.UPPER_LIP_BOTTOM).getPoints(); // If classification was enabled: if (face.getSmilingProbability() != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { float smileProb = face.getSmilingProbability(); } if (face.getRightEyeOpenProbability() != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { float rightEyeOpenProb = face.getRightEyeOpenProbability(); } // If face tracking was enabled: if (face.getTrackingId() != FirebaseVisionFace.INVALID_ID) { int id = face.getTrackingId(); } }
Kotlin
for (face in faces) { val bounds = face.boundingBox val rotY = face.headEulerAngleY // Head is rotated to the right rotY degrees val rotZ = face.headEulerAngleZ // Head is tilted sideways rotZ degrees // If landmark detection was enabled (mouth, ears, eyes, cheeks, and // nose available): val leftEar = face.getLandmark(FirebaseVisionFaceLandmark.LEFT_EAR) leftEar?.let { val leftEarPos = leftEar.position } // If contour detection was enabled: val leftEyeContour = face.getContour(FirebaseVisionFaceContour.LEFT_EYE).points val upperLipBottomContour = face.getContour(FirebaseVisionFaceContour.UPPER_LIP_BOTTOM).points // If classification was enabled: if (face.smilingProbability != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { val smileProb = face.smilingProbability } if (face.rightEyeOpenProbability != FirebaseVisionFace.UNCOMPUTED_PROBABILITY) { val rightEyeOpenProb = face.rightEyeOpenProbability } // If face tracking was enabled: if (face.trackingId != FirebaseVisionFace.INVALID_ID) { val id = face.trackingId } }
דוגמה לקווי מתאר של פנים
כשמפעילים את זיהוי קווי המתאר של הפנים, מקבלים רשימה של נקודות לכל מאפיין פנים שזוהה. הנקודות האלה מייצגות את הצורה של התכונה. בקטע סקירה כללית על המושגים של זיהוי הפנים מוסבר איך מתבצעת הייצוג של קווי המתאר.
בתמונה הבאה אפשר לראות איך הנקודות האלה ממפות לפנים (כדי להגדיל את התמונה, לוחצים עליה):
זיהוי פנים בזמן אמת
אם אתם רוצים להשתמש בזיהוי פנים באפליקציה בזמן אמת, כדאי לפעול לפי ההנחיות הבאות כדי להשיג את שיעורי הפריימים הטובים ביותר:
- מגדירים את גלאי הפנים כך שישתמש בזיהוי קווי המתאר של הפנים או בסיווג ובזיהוי ציוני דרך, אבל לא בשניהם: - זיהוי קווי מתאר 
 זיהוי ציוני דרך
 סיווג
 זיהוי וסיווג של ציוני דרך
 זיהוי קווי מתאר וזיהוי ציוני דרך
 זיהוי קווי מתאר וסיווג
 זיהוי קווי מתאר, זיהוי ציוני דרך וסיווג
- מפעילים את מצב - FAST(הוא מופעל כברירת מחדל).
- כדאי לצלם תמונות ברזולוציה נמוכה יותר. עם זאת, חשוב לזכור גם את הדרישות לגבי מידות התמונות ב-API הזה. 
- צמצום מספר הקריאות למזהה. אם מסגרת וידאו חדשה זמינה בזמן שהגלאי פועל, צריך להסיר את המסגרת.
- אם אתם משתמשים בפלט של הגלאי כדי להוסיף שכבת-על של גרפיקה לתמונה הקלט, קודם צריך לקבל את התוצאה מ-ML Kit, ואז לבצע עיבוד (רנדור) של התמונה ולהוסיף את שכבת-העל בשלב אחד. כך תוכלו לבצע עיבוד (render) למשטח התצוגה רק פעם אחת לכל מסגרת קלט.
- 
  אם אתם משתמשים ב-Camera2 API, כדאי לצלם תמונות בפורמט ImageFormat.YUV_420_888.אם משתמשים ב-Camera API הקודם, צריך לצלם תמונות בפורמט ImageFormat.NV21.