Catch up on everything announced at Firebase Summit, and learn how Firebase can help you accelerate app development and run your app with confidence. Learn More

অ্যাপল প্ল্যাটফর্মে ফায়ারবেস প্রমাণীকরণ এবং ফাংশন ব্যবহার করে ক্লাউড ভিশনের মাধ্যমে সুরক্ষিতভাবে চিত্রগুলিতে পাঠ্য সনাক্ত করুন

সেভ করা পৃষ্ঠা গুছিয়ে রাখতে 'সংগ্রহ' ব্যবহার করুন আপনার পছন্দ অনুযায়ী কন্টেন্ট সেভ করুন ও সঠিক বিভাগে রাখুন।

আপনার অ্যাপ থেকে একটি Google ক্লাউড API কল করার জন্য, আপনাকে একটি মধ্যবর্তী REST API তৈরি করতে হবে যা অনুমোদন পরিচালনা করে এবং API কীগুলির মতো গোপন মানগুলিকে রক্ষা করে। তারপরে আপনাকে এই মধ্যবর্তী পরিষেবার সাথে প্রমাণীকরণ এবং যোগাযোগ করতে আপনার মোবাইল অ্যাপে কোড লিখতে হবে৷

এই REST API তৈরি করার একটি উপায় হল Firebase প্রমাণীকরণ এবং ফাংশনগুলি ব্যবহার করা, যা আপনাকে Google ক্লাউড API-এর একটি পরিচালিত, সার্ভারবিহীন গেটওয়ে দেয় যা প্রমাণীকরণ পরিচালনা করে এবং পূর্ব-নির্মিত SDK সহ আপনার মোবাইল অ্যাপ থেকে কল করা যেতে পারে।

আপনার অ্যাপ থেকে ক্লাউড ভিশন API কল করতে এই কৌশলটি কীভাবে ব্যবহার করবেন তা এই নির্দেশিকাটি প্রদর্শন করে৷ এই পদ্ধতিটি সমস্ত প্রমাণীকৃত ব্যবহারকারীদের আপনার ক্লাউড প্রকল্পের মাধ্যমে ক্লাউড ভিশন বিল করা পরিষেবাগুলি অ্যাক্সেস করার অনুমতি দেবে, তাই এগিয়ে যাওয়ার আগে এই প্রমাণীকরণ প্রক্রিয়াটি আপনার ব্যবহারের ক্ষেত্রে যথেষ্ট কিনা তা বিবেচনা করুন।

তুমি শুরু করার আগে

আপনার প্রকল্প কনফিগার করুন

আপনি যদি ইতিমধ্যে আপনার অ্যাপে Firebase যোগ না করে থাকেন, তাহলে শুরু করার নির্দেশিকাতে দেওয়া ধাপগুলি অনুসরণ করে তা করুন৷

ফায়ারবেস নির্ভরতা ইনস্টল এবং পরিচালনা করতে সুইফট প্যাকেজ ম্যানেজার ব্যবহার করুন।

  1. Xcode-এ, আপনার অ্যাপ প্রকল্প খোলার সাথে, ফাইল > প্যাকেজ যোগ করুন -এ নেভিগেট করুন।
  2. অনুরোধ করা হলে, Firebase Apple প্ল্যাটফর্ম SDK সংগ্রহস্থল যোগ করুন:
  3.   https://github.com/firebase/firebase-ios-sdk
  4. Firebase ML লাইব্রেরি বেছে নিন।
  5. শেষ হয়ে গেলে, Xcode স্বয়ংক্রিয়ভাবে পটভূমিতে আপনার নির্ভরতাগুলি সমাধান এবং ডাউনলোড করা শুরু করবে।

এরপরে, কিছু ইন-অ্যাপ সেটআপ সম্পাদন করুন:

  1. আপনার অ্যাপে, Firebase আমদানি করুন:

    সুইফট

    import FirebaseMLModelDownloader

    উদ্দেশ্য গ

    @import FirebaseMLModelDownloader;

আরও কয়েকটি কনফিগারেশন ধাপ, এবং আমরা যেতে প্রস্তুত:

  1. আপনি যদি ইতিমধ্যে আপনার প্রকল্পের জন্য ক্লাউড-ভিত্তিক API সক্ষম না করে থাকেন তবে এখনই তা করুন:

    1. Firebase কনসোলের Firebase ML APIs পৃষ্ঠা খুলুন।
    2. আপনি যদি ইতিমধ্যেই আপনার প্রোজেক্টকে ব্লেজ প্রাইসিং প্ল্যানে আপগ্রেড না করে থাকেন, তা করতে আপগ্রেড এ ক্লিক করুন। (যদি আপনার প্রকল্পটি ব্লেজ প্ল্যানে না থাকে তবেই আপনাকে আপগ্রেড করার জন্য অনুরোধ করা হবে।)

      শুধুমাত্র ব্লেজ-স্তরের প্রকল্পগুলি ক্লাউড-ভিত্তিক API ব্যবহার করতে পারে।

    3. যদি ক্লাউড-ভিত্তিক APIগুলি ইতিমধ্যে সক্ষম না থাকে, তাহলে ক্লাউড-ভিত্তিক APIগুলি সক্ষম করুন ক্লিক করুন৷
  2. ক্লাউড ভিশন API-এ অ্যাক্সেসের অনুমতি না দেওয়ার জন্য আপনার বিদ্যমান Firebase API কীগুলি কনফিগার করুন:
    1. ক্লাউড কনসোলের শংসাপত্র পৃষ্ঠাটি খুলুন।
    2. তালিকার প্রতিটি API কী-এর জন্য, সম্পাদনা দৃশ্য খুলুন এবং কী বিধিনিষেধ বিভাগে, ক্লাউড ভিশন API ছাড়া সমস্ত উপলব্ধ API যোগ করুন।

কলযোগ্য ফাংশন স্থাপন করুন

এরপরে, ক্লাউড ফাংশনটি স্থাপন করুন যা আপনি আপনার অ্যাপ এবং ক্লাউড ভিশন API ব্রিজ করতে ব্যবহার করবেন। functions-samples সংগ্রহস্থলে একটি উদাহরণ রয়েছে যা আপনি ব্যবহার করতে পারেন।

ডিফল্টরূপে, এই ফাংশনের মাধ্যমে ক্লাউড ভিশন API অ্যাক্সেস করা শুধুমাত্র আপনার অ্যাপের প্রমাণীকৃত ব্যবহারকারীদের ক্লাউড ভিশন API-এ অ্যাক্সেসের অনুমতি দেবে। আপনি বিভিন্ন প্রয়োজনীয়তার জন্য ফাংশন পরিবর্তন করতে পারেন.

ফাংশন স্থাপন করতে:

  1. ফাংশন-নমুনা রেপো ক্লোন করুন বা ডাউনলোড করুন এবং vision-annotate-image ডিরেক্টরিতে পরিবর্তন করুন:
    git clone https://github.com/firebase/functions-samples
    cd vision-annotate-image
    
  2. নির্ভরতা ইনস্টল করুন:
    cd functions
    npm install
    cd ..
    
  3. আপনার কাছে Firebase CLI না থাকলে, এটি ইনস্টল করুন
  4. vision-annotate-image ডিরেক্টরিতে একটি ফায়ারবেস প্রকল্প শুরু করুন। অনুরোধ করা হলে, তালিকায় আপনার প্রকল্প নির্বাচন করুন।
    firebase init
  5. ফাংশনটি স্থাপন করুন:
    firebase deploy --only functions:annotateImage

আপনার অ্যাপে Firebase Auth যোগ করুন

উপরে স্থাপিত কলযোগ্য ফাংশনটি আপনার অ্যাপের অ-প্রমাণিত ব্যবহারকারীদের যেকোনো অনুরোধ প্রত্যাখ্যান করবে। আপনি যদি ইতিমধ্যে এটি না করে থাকেন, তাহলে আপনাকে আপনার অ্যাপে Firebase Auth যোগ করতে হবে।

আপনার অ্যাপে প্রয়োজনীয় নির্ভরতা যোগ করুন

ফায়ারবেস লাইব্রেরির জন্য ক্লাউড ফাংশন ইনস্টল করতে সুইফট প্যাকেজ ম্যানেজার ব্যবহার করুন।

এখন আপনি চিত্রগুলিতে পাঠ্য সনাক্তকরণ শুরু করতে প্রস্তুত৷

1. ইনপুট ইমেজ প্রস্তুত করুন

ক্লাউড ভিশন কল করার জন্য, ছবিটি একটি বেস 64-এনকোডেড স্ট্রিং হিসাবে ফর্ম্যাট করা আবশ্যক। একটি UIImage প্রক্রিয়া করতে:

সুইফট

guard let imageData = uiImage.jpegData(compressionQuality: 1.0f) else { return }
let base64encodedImage = imageData.base64EncodedString()

উদ্দেশ্য গ

NSData *imageData = UIImageJPEGRepresentation(uiImage, 1.0f);
NSString *base64encodedImage =
  [imageData base64EncodedStringWithOptions:NSDataBase64Encoding76CharacterLineLength];

2. টেক্সট সনাক্ত করতে কলযোগ্য ফাংশন আহ্বান করুন

একটি ছবিতে ল্যান্ডমার্ক চিনতে, একটি JSON ক্লাউড ভিশন অনুরোধ পাস করে কলযোগ্য ফাংশনটি চালু করুন।

  1. প্রথমে, ক্লাউড ফাংশনগুলির একটি উদাহরণ শুরু করুন:

    সুইফট

    lazy var functions = Functions.functions()
    

    উদ্দেশ্য গ

    @property(strong, nonatomic) FIRFunctions *functions;
    
  2. অনুরোধটি তৈরি করুন। ক্লাউড ভিশন API দুই ধরনের পাঠ্য সনাক্তকরণ সমর্থন করে: TEXT_DETECTION এবং DOCUMENT_TEXT_DETECTION । দুটি ব্যবহারের ক্ষেত্রে পার্থক্যের জন্য ক্লাউড ভিশন ওসিআর ডক্স দেখুন।

    সুইফট

    let requestData = [
      "image": ["content": base64encodedImage],
      "features": ["type": "TEXT_DETECTION"],
      "imageContext": ["languageHints": ["en"]]
    ]
    

    উদ্দেশ্য গ

    NSDictionary *requestData = @{
      @"image": @{@"content": base64encodedImage},
      @"features": @{@"type": @"TEXT_DETECTION"},
      @"imageContext": @{@"languageHints": @[@"en"]}
    };
    
  3. অবশেষে, ফাংশনটি আহ্বান করুন:

    সুইফট

    functions.httpsCallable("annotateImage").call(requestData) { (result, error) in
      if let error = error as NSError? {
        if error.domain == FunctionsErrorDomain {
          let code = FunctionsErrorCode(rawValue: error.code)
          let message = error.localizedDescription
          let details = error.userInfo[FunctionsErrorDetailsKey]
        }
        // ...
      }
      // Function completed succesfully
    }
    

    উদ্দেশ্য গ

    [[_functions HTTPSCallableWithName:@"annotateImage"]
                              callWithObject:requestData
                                  completion:^(FIRHTTPSCallableResult * _Nullable result, NSError * _Nullable error) {
            if (error) {
              if (error.domain == FIRFunctionsErrorDomain) {
                FIRFunctionsErrorCode code = error.code;
                NSString *message = error.localizedDescription;
                NSObject *details = error.userInfo[FIRFunctionsErrorDetailsKey];
              }
              // ...
            }
            // Function completed succesfully
            // Get information about labeled objects
    
          }];
    

3. স্বীকৃত পাঠ্যের ব্লকগুলি থেকে পাঠ্য বের করুন

পাঠ্য শনাক্তকরণ অপারেশন সফল হলে, টাস্কের ফলাফলে BatchAnnotateImagesResponse- এর একটি JSON প্রতিক্রিয়া ফেরত দেওয়া হবে। টেক্সট টীকাগুলি fullTextAnnotation অবজেক্টে পাওয়া যাবে।

আপনি text ক্ষেত্রে একটি স্ট্রিং হিসাবে স্বীকৃত পাঠ্য পেতে পারেন। উদাহরণ স্বরূপ:

সুইফট

guard let annotation = (result?.data as? [String: Any])?["fullTextAnnotation"] as? [String: Any] else { return }
print("%nComplete annotation:")
let text = annotation["text"] as? String ?? ""
print("%n\(text)")

উদ্দেশ্য গ

NSDictionary *annotation = result.data[@"fullTextAnnotation"];
if (!annotation) { return; }
NSLog(@"\nComplete annotation:");
NSLog(@"\n%@", annotation[@"text"]);

আপনি চিত্রের অঞ্চলগুলির জন্য নির্দিষ্ট তথ্যও পেতে পারেন। প্রতিটি block , paragraph , word এবং symbol জন্য, আপনি অঞ্চলে স্বীকৃত পাঠ্য এবং অঞ্চলের সীমাবদ্ধ স্থানাঙ্ক পেতে পারেন। উদাহরণ স্বরূপ:

সুইফট

guard let pages = annotation["pages"] as? [[String: Any]] else { return }
for page in pages {
var pageText = ""
guard let blocks = page["blocks"] as? [[String: Any]] else { continue }
for block in blocks {
    var blockText = ""
    guard let paragraphs = block["paragraphs"] as? [[String: Any]] else { continue }
    for paragraph in paragraphs {
    var paragraphText = ""
    guard let words = paragraph["words"] as? [[String: Any]] else { continue }
    for word in words {
        var wordText = ""
        guard let symbols = word["symbols"] as? [[String: Any]] else { continue }
        for symbol in symbols {
        let text = symbol["text"] as? String ?? ""
        let confidence = symbol["confidence"] as? Float ?? 0.0
        wordText += text
        print("Symbol text: \(text) (confidence: \(confidence)%n")
        }
        let confidence = word["confidence"] as? Float ?? 0.0
        print("Word text: \(wordText) (confidence: \(confidence)%n%n")
        let boundingBox = word["boundingBox"] as? [Float] ?? [0.0, 0.0, 0.0, 0.0]
        print("Word bounding box: \(boundingBox.description)%n")
        paragraphText += wordText
    }
    print("%nParagraph: %n\(paragraphText)%n")
    let boundingBox = paragraph["boundingBox"] as? [Float] ?? [0.0, 0.0, 0.0, 0.0]
    print("Paragraph bounding box: \(boundingBox)%n")
    let confidence = paragraph["confidence"] as? Float ?? 0.0
    print("Paragraph Confidence: \(confidence)%n")
    blockText += paragraphText
    }
    pageText += blockText
}

উদ্দেশ্য গ

for (NSDictionary *page in annotation[@"pages"]) {
  NSMutableString *pageText = [NSMutableString new];
  for (NSDictionary *block in page[@"blocks"]) {
    NSMutableString *blockText = [NSMutableString new];
    for (NSDictionary *paragraph in block[@"paragraphs"]) {
      NSMutableString *paragraphText = [NSMutableString new];
      for (NSDictionary *word in paragraph[@"words"]) {
        NSMutableString *wordText = [NSMutableString new];
        for (NSDictionary *symbol in word[@"symbols"]) {
          NSString *text = symbol[@"text"];
          [wordText appendString:text];
          NSLog(@"Symbol text: %@ (confidence: %@\n", text, symbol[@"confidence"]);
        }
        NSLog(@"Word text: %@ (confidence: %@\n\n", wordText, word[@"confidence"]);
        NSLog(@"Word bounding box: %@\n", word[@"boundingBox"]);
        [paragraphText appendString:wordText];
      }
      NSLog(@"\nParagraph: \n%@\n", paragraphText);
      NSLog(@"Paragraph bounding box: %@\n", paragraph[@"boundingBox"]);
      NSLog(@"Paragraph Confidence: %@\n", paragraph[@"confidence"]);
      [blockText appendString:paragraphText];
    }
    [pageText appendString:blockText];
  }
}