Identifica el idioma de un texto con ML Kit en iOS

Puedes usar el Kit de AA para identificar el idioma de una string de texto. Puedes obtener el idioma más probable de la string o las puntuaciones de confianza de todos sus posibles idiomas.

El ML Kit reconoce texto en 103 idiomas en sus alfabetos nativos. Además, puede reconocer texto latinizado en idiomas como el árabe, búlgaro, chino, griego, hindi, japonés y ruso.

Antes de comenzar

  1. Si aún no agregaste Firebase a tu app, sigue los pasos en la guía de introducción para hacerlo.
  2. Incluye las bibliotecas del ML Kit en tu Podfile:
    pod 'Firebase/MLNaturalLanguage', '6.25.0'
    pod 'Firebase/MLNLLanguageID', '6.25.0'
    
    Después de instalar o actualizar los Pods de tu proyecto, asegúrate de abrir el proyecto de Xcode con su .xcworkspace.
  3. En tu app, importa Firebase:

    Swift

    import Firebase

    Objective-C

    @import Firebase;

Identifica el idioma de una string

Para identificar el idioma de una string, obtén una instancia de LanguageIdentification y pasa la string al método identifyLanguage(for:).

Por ejemplo:

Swift

let languageId = NaturalLanguage.naturalLanguage().languageIdentification()

languageId.identifyLanguage(for: text) { (languageCode, error) in
  if let error = error {
    print("Failed with error: \(error)")
    return
  }
  if let languageCode = languageCode, languageCode != "und" {
    print("Identified Language: \(languageCode)")
  } else {
    print("No language was identified")
  }
}

Objective-C

FIRNaturalLanguage *naturalLanguage = [FIRNaturalLanguage naturalLanguage];
FIRLanguageIdentification *languageId = [naturalLanguage languageIdentification];

[languageId identifyLanguageForText:text
                         completion:^(NSString * _Nullable languageCode,
                                      NSError * _Nullable error) {
                           if (error != nil) {
                             NSLog(@"Failed with error: %@", error.localizedDescription);
                             return;
                           }
                           if (languageCode != nil
                               && ![languageCode isEqualToString:@"und"] ) {
                             NSLog(@"Identified Language: %@", languageCode);
                           } else {
                             NSLog(@"No language was identified");
                           }
                         }];

Si la llamada se ejecuta correctamente, se pasa un código de idioma BCP-47 al controlador de finalización, el que indica el idioma del texto. Consulta la lista completa de idiomas admitidos. Si no se pudo detectar un idioma con confianza, se pasa el código und (indeterminado).

Según la configuración predeterminada, el Kit de AA muestra un valor distinto de und solo cuando identifica el idioma con un valor de confianza de al menos 0.5. Para cambiar este umbral, pasa un objeto LanguageIdentificationOptions a languageIdentification(options:) de la siguiente manera:

Swift

let options = LanguageIdentificationOptions(confidenceThreshold: 0.4)
let languageId = NaturalLanguage.naturalLanguage().languageIdentification(options: options)

Objective-C

FIRNaturalLanguage *naturalLanguage = [FIRNaturalLanguage naturalLanguage];
FIRLanguageIdentificationOptions *options =
    [[FIRLanguageIdentificationOptions alloc] initWithConfidenceThreshold:0.4];
FIRLanguageIdentification *languageId =
    [naturalLanguage languageIdentificationWithOptions:options];

Obtén los posibles idiomas de una string

Para ver los valores de confianza de los idiomas más probables de una string, obtén una instancia de LanguageIdentification y, luego, pasa la string al método identifyPossibleLanguages(for:).

Por ejemplo:

Swift

let languageId = NaturalLanguage.naturalLanguage().languageIdentification()

languageId.identifyPossibleLanguages(for: text) { (identifiedLanguages, error) in
  if let error = error {
    print("Failed with error: \(error)")
    return
  }
  guard let identifiedLanguages = identifiedLanguages,
    !identifiedLanguages.isEmpty,
    identifiedLanguages[0].languageCode != "und"
  else {
    print("No language was identified")
    return
  }

  print("Identified Languages:\n" +
    identifiedLanguages.map {
      String(format: "(%@, %.2f)", $0.languageCode, $0.confidence)
      }.joined(separator: "\n"))
}

Objective-C

FIRNaturalLanguage *naturalLanguage = [FIRNaturalLanguage naturalLanguage];
FIRLanguageIdentification *languageId = [naturalLanguage languageIdentification];

[languageId identifyPossibleLanguagesForText:text
                                  completion:^(NSArray<FIRIdentifiedLanguage *> * _Nonnull identifiedLanguages,
                                               NSError * _Nullable error) {
  if (error != nil) {
    NSLog(@"Failed with error: %@", error.localizedDescription);
    return;
  }
  if (identifiedLanguages.count == 1
      && [identifiedLanguages[0].languageCode isEqualToString:@"und"] ) {
    NSLog(@"No language was identified");
    return;
  }
  NSMutableString *outputText = [NSMutableString stringWithFormat:@"Identified Languages:"];
  for (FIRIdentifiedLanguage *language in identifiedLanguages) {
    [outputText appendFormat:@"\n(%@, %.2f)", language.languageCode, language.confidence];
  }
  NSLog(outputText);
}];

Si la llamada se ejecuta correctamente, se pasará una lista de objetos IdentifiedLanguage al controlador de continuación. Podrás obtener el código BCP-47 del idioma en cada objeto y estar seguro de que la string está en ese idioma. Consulta la lista completa de idiomas admitidos. Ten en cuenta que estos valores señalan con seguridad que la string completa está en el idioma determinado. El ML Kit no identifica varios idiomas en una sola string.

Según la configuración predeterminada, el Kit de AA solo muestra los idiomas con valores de confianza de al menos 0.01. Para cambiar este umbral, pasa un objeto LanguageIdentificationOptions a languageIdentification(options:) de la siguiente manera:

Swift

let options = LanguageIdentificationOptions(confidenceThreshold: 0.4)
let languageId = NaturalLanguage.naturalLanguage().languageIdentification(options: options)

Objective-C

FIRNaturalLanguage *naturalLanguage = [FIRNaturalLanguage naturalLanguage];
FIRLanguageIdentificationOptions *options =
    [[FIRLanguageIdentificationOptions alloc] initWithConfidenceThreshold:0.4];
FIRLanguageIdentification *languageId =
    [naturalLanguage languageIdentificationWithOptions:options];

Si ningún idioma alcanza este umbral, la lista solo contendrá un elemento con el valor und.