Catch up on everthing we announced at this year's Firebase Summit. Learn more

অ্যান্ড্রয়েডে ফায়ারবেস এথ এবং ফাংশন ব্যবহার করে ক্লাউড ভিশনের মাধ্যমে সুরক্ষিতভাবে চিত্রগুলিতে পাঠ্যটি সনাক্ত করুন

আপনার অ্যাপ থেকে গুগল ক্লাউড এপিআই কল করার জন্য, আপনাকে একটি মধ্যবর্তী REST API তৈরি করতে হবে যা অনুমোদন পরিচালনা করে এবং এপিআই কীগুলির মতো গোপন মান রক্ষা করে। এই মধ্যবর্তী পরিষেবাটির সাথে প্রমাণীকরণ এবং যোগাযোগের জন্য আপনাকে আপনার মোবাইল অ্যাপে কোড লিখতে হবে।

এই REST API তৈরির একটি উপায় হল Firebase প্রমাণীকরণ এবং ফাংশন ব্যবহার করে, যা আপনাকে Google ক্লাউড API- এর একটি পরিচালিত, সার্ভারহীন গেটওয়ে দেয় যা প্রমাণীকরণ পরিচালনা করে এবং আপনার মোবাইল অ্যাপ থেকে পূর্বনির্ধারিত SDKs দিয়ে কল করা যায়।

আপনার অ্যাপ থেকে ক্লাউড ভিশন এপিআই -তে কল করার জন্য এই কৌশলটি কীভাবে ব্যবহার করতে হয় তা এই নির্দেশিকা দেখায়। এই পদ্ধতিটি সমস্ত অনুমোদিত ব্যবহারকারীদের আপনার ক্লাউড প্রকল্পের মাধ্যমে ক্লাউড ভিশন বিল পরিষেবাগুলি অ্যাক্সেস করার অনুমতি দেবে, তাই এগিয়ে যাওয়ার আগে এই ব্যবহারের প্রক্রিয়াটি আপনার ব্যবহারের ক্ষেত্রে যথেষ্ট কিনা তা বিবেচনা করুন।

তুমি শুরু করার আগে

আপনার প্রকল্প কনফিগার করুন

  1. আপনি ইতিমধ্যে থাকে, তাহলে আপনার অ্যান্ড্রয়েড প্রকল্পের Firebase যোগ
  2. আপনি যদি ইতিমধ্যে আপনার প্রকল্পের জন্য ক্লাউড-ভিত্তিক API সক্ষম না করে থাকেন, তাহলে এখনই করুন:

    1. খুলুন Firebase এমএল API গুলি পৃষ্ঠা Firebase কনসোলের।
    2. যদি আপনি ইতিমধ্যে আলোকচ্ছটা মূল্যের পরিকল্পনা আপনার প্রকল্পের উন্নীত না করে থাকেন, তাই এ আপগ্রেড করুন এ ক্লিক করুন। (আপনার প্রজেক্ট যদি ব্লেজ প্ল্যানে না থাকে তবেই আপনাকে আপগ্রেড করতে বলা হবে।)

      শুধুমাত্র ব্লেজ-স্তরের প্রকল্পগুলি ক্লাউড-ভিত্তিক API ব্যবহার করতে পারে।

    3. মেঘ-ভিত্তিক API গুলি ইতিমধ্যেই সক্ষম না হয় তাহলে, ক্লিক করুন মেঘ-ভিত্তিক API সক্ষম করুন।
  3. ক্লাউড ভিশন API- এ অ্যাক্সেসের অনুমতি না দেওয়ার জন্য আপনার বিদ্যমান Firebase API কীগুলি কনফিগার করুন:
    1. খুলুন শংসাপত্রের ক্লাউড কনসোলের পাতা।
    2. তালিকার প্রতিটি API কী জন্য, সম্পাদনা দৃশ্য খুলুন, এবং কী বিধিনিষেধ বিভাগে, লিস্টে ক্লাউড ভিশন এপিআই ব্যতীত প্রাপ্তিসাধ্য API গুলি সব যোগ করুন।

কলযোগ্য ফাংশন স্থাপন করুন

পরবর্তী, ক্লাউড ফাংশনটি স্থাপন করুন যা আপনি আপনার অ্যাপ এবং ক্লাউড ভিশন এপিআই ব্যবহার করতে ব্যবহার করবেন। functions-samples সংগ্রহস্থলের একটি উদাহরণ আপনি ব্যবহার করতে পারেন ধারণ করে।

ডিফল্টরূপে, এই ফাংশনের মাধ্যমে ক্লাউড ভিশন এপিআই অ্যাক্সেস করলে আপনার অ্যাপের অনুমোদিত ব্যবহারকারীরা ক্লাউড ভিশন এপিআই অ্যাক্সেস করতে পারবেন। আপনি বিভিন্ন প্রয়োজনীয়তার জন্য ফাংশন পরিবর্তন করতে পারেন।

ফাংশন স্থাপন করতে:

  1. ক্লোন বা ডাউনলোড ফাংশন-নমুনার রেপো এবং পরিবর্তন vision-annotate-image ডিরেক্টরি:
    git clone https://github.com/firebase/functions-samples
    cd vision-annotate-image
    
  2. নির্ভরতা ইনস্টল করুন:
    cd functions
    npm install
    cd ..
    
  3. আপনি Firebase CLI না থাকে তাহলে, এটি ইনস্টল করুন
  4. একটি Firebase প্রকল্পের আরম্ভ vision-annotate-image ডিরেক্টরি। অনুরোধ করা হলে, তালিকা থেকে আপনার প্রকল্প নির্বাচন করুন।
    firebase init
  5. ফাংশন স্থাপন করুন:
    firebase deploy --only functions:annotateImage

আপনার অ্যাপে Firebase Auth যোগ করুন

উপরে কল করা ফাংশন আপনার অ্যাপের অ-প্রমাণিত ব্যবহারকারীদের যেকোনো অনুরোধ প্রত্যাখ্যান করবে। যদি আপনি ইতিমধ্যে এটি না করে থাকে, তাহলে আপনি করতে হবে আপনার অ্যাপ্লিকেশানে Firebase প্রমাণীকরণ যোগ করুন।

আপনার অ্যাপে প্রয়োজনীয় নির্ভরতা যোগ করুন

  • : আপনার মডিউল (অ্যাপ্লিকেশান-স্তর) Gradle ফাইল (সাধারণত অ্যাপ্লিকেশন / build.gradle) এর Firebase কার্যাবলী এবং gson অ্যান্ড্রয়েড লাইব্রেরির জন্য নির্ভরতা যোগ
    implementation 'com.google.firebase:firebase-functions:20.0.1'
    implementation 'com.google.code.gson:gson:2.8.6'
    
  • এখন আপনি ছবিতে টেক্সট চিনতে শুরু করার জন্য প্রস্তুত।

    1. ইনপুট ইমেজ প্রস্তুত করুন

    ক্লাউড ভিশন কল করার জন্য, ছবিটি বেস 64-এনকোডেড স্ট্রিং হিসাবে ফরম্যাট করা আবশ্যক। একটি সংরক্ষিত ফাইল URI থেকে একটি ছবি প্রক্রিয়া করতে:
    1. হিসেবে ইমেজ পেতে Bitmap বস্তু:

      জাভা

      Bitmap bitmap = MediaStore.Images.Media.getBitmap(getContentResolver(), uri);

      কোটলিন+কেটিএক্স

      var bitmap: Bitmap = MediaStore.Images.Media.getBitmap(contentResolver, uri)
    2. Allyচ্ছিকভাবে, ব্যান্ডউইথ সংরক্ষণ করতে ছবিটি স্কেল করুন। দেখুন ক্লাউড ভিশন সুপারিশ ইমেজ মাপ।

      জাভা

      private Bitmap scaleBitmapDown(Bitmap bitmap, int maxDimension) {
          int originalWidth = bitmap.getWidth();
          int originalHeight = bitmap.getHeight();
          int resizedWidth = maxDimension;
          int resizedHeight = maxDimension;
      
          if (originalHeight > originalWidth) {
              resizedHeight = maxDimension;
              resizedWidth = (int) (resizedHeight * (float) originalWidth / (float) originalHeight);
          } else if (originalWidth > originalHeight) {
              resizedWidth = maxDimension;
              resizedHeight = (int) (resizedWidth * (float) originalHeight / (float) originalWidth);
          } else if (originalHeight == originalWidth) {
              resizedHeight = maxDimension;
              resizedWidth = maxDimension;
          }
          return Bitmap.createScaledBitmap(bitmap, resizedWidth, resizedHeight, false);
      }

      কোটলিন+কেটিএক্স

      private fun scaleBitmapDown(bitmap: Bitmap, maxDimension: Int): Bitmap {
          val originalWidth = bitmap.width
          val originalHeight = bitmap.height
          var resizedWidth = maxDimension
          var resizedHeight = maxDimension
          if (originalHeight > originalWidth) {
              resizedHeight = maxDimension
              resizedWidth =
                      (resizedHeight * originalWidth.toFloat() / originalHeight.toFloat()).toInt()
          } else if (originalWidth > originalHeight) {
              resizedWidth = maxDimension
              resizedHeight =
                      (resizedWidth * originalHeight.toFloat() / originalWidth.toFloat()).toInt()
          } else if (originalHeight == originalWidth) {
              resizedHeight = maxDimension
              resizedWidth = maxDimension
          }
          return Bitmap.createScaledBitmap(bitmap, resizedWidth, resizedHeight, false)
      }

      জাভা

      // Scale down bitmap size
      bitmap = scaleBitmapDown(bitmap, 640);

      কোটলিন+কেটিএক্স

      // Scale down bitmap size
      bitmap = scaleBitmapDown(bitmap, 640)
    3. বিটম্যাপ বস্তুকে বেস 64 এনকোডেড স্ট্রিংয়ে রূপান্তর করুন:

      জাভা

      // Convert bitmap to base64 encoded string
      ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
      bitmap.compress(Bitmap.CompressFormat.JPEG, 100, byteArrayOutputStream);
      byte[] imageBytes = byteArrayOutputStream.toByteArray();
      String base64encoded = Base64.encodeToString(imageBytes, Base64.NO_WRAP);

      কোটলিন+কেটিএক্স

      // Convert bitmap to base64 encoded string
      val byteArrayOutputStream = ByteArrayOutputStream()
      bitmap.compress(Bitmap.CompressFormat.JPEG, 100, byteArrayOutputStream)
      val imageBytes: ByteArray = byteArrayOutputStream.toByteArray()
      val base64encoded = Base64.encodeToString(imageBytes, Base64.NO_WRAP)
    4. ইমেজ দ্বারা প্রতিনিধিত্ব Bitmap বস্তু, ন্যায়পরায়ণ হতে হবে কোন অতিরিক্ত প্রয়োজনীয় ঘূর্ণন সঙ্গে।

    2. পাঠ্য সনাক্ত করার জন্য কলযোগ্য ফাংশন আহ্বান

    একটি ছবিতে পাঠ্য সনাক্ত করতে, callable ফাংশন ডাকা, একটি ক্ষণস্থায়ী তাদেরকে JSON ক্লাউড ভিশন অনুরোধ

    1. প্রথমে, ক্লাউড ফাংশনের একটি উদাহরণ আরম্ভ করুন:

      জাভা

      private FirebaseFunctions mFunctions;
      // ...
      mFunctions = FirebaseFunctions.getInstance();
      

      কোটলিন+কেটিএক্স

      private lateinit var functions: FirebaseFunctions
      // ...
      functions = Firebase.functions
      
    2. ফাংশন চালানোর জন্য একটি পদ্ধতি সংজ্ঞায়িত করুন:

      জাভা

      private Task<JsonElement> annotateImage(String requestJson) {
          return mFunctions
                  .getHttpsCallable("annotateImage")
                  .call(requestJson)
                  .continueWith(new Continuation<HttpsCallableResult, JsonElement>() {
                      @Override
                      public JsonElement then(@NonNull Task<HttpsCallableResult> task) {
                          // This continuation runs on either success or failure, but if the task
                          // has failed then getResult() will throw an Exception which will be
                          // propagated down.
                          return JsonParser.parseString(new Gson().toJson(task.getResult().getData()));
                      }
                  });
      }
      

      কোটলিন+কেটিএক্স

      private fun annotateImage(requestJson: String): Task<JsonElement> {
          return functions
                  .getHttpsCallable("annotateImage")
                  .call(requestJson)
                  .continueWith { task ->
                      // This continuation runs on either success or failure, but if the task
                      // has failed then result will throw an Exception which will be
                      // propagated down.
                      val result = task.result?.data
                      JsonParser.parseString(Gson().toJson(result))
                  }
      }
      
    3. JSON অনুরোধ তৈরি করুন। ক্লাউড ভিশন এপিআই দুই সমর্থন প্রকারভেদ : পাঠ্য সনাক্তকরণের TEXT_DETECTION এবং DOCUMENT_TEXT_DETECTION । দেখুন ক্লাউড ভিশন OCR করুন ডক্স দুই ব্যবহারের ক্ষেত্রে পার্থক্য জন্য।

      জাভা

      // Create json request to cloud vision
      JsonObject request = new JsonObject();
      // Add image to request
      JsonObject image = new JsonObject();
      image.add("content", new JsonPrimitive(base64encoded));
      request.add("image", image);
      //Add features to the request
      JsonObject feature = new JsonObject();
      feature.add("type", new JsonPrimitive("TEXT_DETECTION"));
      // Alternatively, for DOCUMENT_TEXT_DETECTION:
      //feature.add("type", new JsonPrimitive("DOCUMENT_TEXT_DETECTION"));
      JsonArray features = new JsonArray();
      features.add(feature);
      request.add("features", features);
      

      কোটলিন+কেটিএক্স

      // Create json request to cloud vision
      val request = JsonObject()
      // Add image to request
      val image = JsonObject()
      image.add("content", JsonPrimitive(base64encoded))
      request.add("image", image)
      //Add features to the request
      val feature = JsonObject()
      feature.add("type", JsonPrimitive("TEXT_DETECTION"))
      // Alternatively, for DOCUMENT_TEXT_DETECTION:
      // feature.add("type", JsonPrimitive("DOCUMENT_TEXT_DETECTION"))
      val features = JsonArray()
      features.add(feature)
      request.add("features", features)
      

      বৈকল্পিকভাবে, ভাষা নির্দেশ প্রদান ভাষা শনাক্তকরণ (দেখুন সহায়তার জন্য সমর্থিত ভাষার ):

      জাভা

      JsonObject imageContext = new JsonObject();
      JsonArray languageHints = new JsonArray();
      languageHints.add("en");
      imageContext.add("languageHints", languageHints);
      request.add("imageContext", imageContext);
      

      কোটলিন+কেটিএক্স

      val imageContext = JsonObject()
      val languageHints = JsonArray()
      languageHints.add("en")
      imageContext.add("languageHints", languageHints)
      request.add("imageContext", imageContext)
      
    4. অবশেষে, ফাংশনটি আহ্বান করুন:

      জাভা

      annotateImage(request.toString())
              .addOnCompleteListener(new OnCompleteListener<JsonElement>() {
                  @Override
                  public void onComplete(@NonNull Task<JsonElement> task) {
                      if (!task.isSuccessful()) {
                          // Task failed with an exception
                          // ...
                      } else {
                          // Task completed successfully
                          // ...
                      }
                  }
              });
      

      কোটলিন+কেটিএক্স

      annotateImage(request.toString())
              .addOnCompleteListener { task ->
                  if (!task.isSuccessful) {
                      // Task failed with an exception
                      // ...
                  } else {
                      // Task completed successfully
                      // ...
                  }
              }
      

    3. স্বীকৃত পাঠ্যের ব্লক থেকে পাঠ্য বের করুন

    পাঠ্য স্বীকৃতির অপারেশন সফল হয়, তাহলে একটি JSON প্রতিক্রিয়া BatchAnnotateImagesResponse টাস্ক এর ফলাফলে ফেরত পাঠানো হবে। টেক্সট টীকা খুঁজে পাওয়া যেতে পারে fullTextAnnotation অবজেক্ট।

    আপনি একটি স্ট্রিং হিসাবে স্বীকৃত টেক্সট পেতে পারেন text ক্ষেত্র। উদাহরণ স্বরূপ:

    জাভা

    JsonObject annotation = task.getResult().getAsJsonArray().get(0).getAsJsonObject().get("fullTextAnnotation").getAsJsonObject();
    System.out.format("%nComplete annotation:%n");
    System.out.format("%s%n", annotation.get("text").getAsString());
    

    কোটলিন+কেটিএক্স

    val annotation = task.result!!.asJsonArray[0].asJsonObject["fullTextAnnotation"].asJsonObject
    System.out.format("%nComplete annotation:")
    System.out.format("%n%s", annotation["text"].asString)
    

    আপনি চিত্রের অঞ্চলগুলির জন্য নির্দিষ্ট তথ্যও পেতে পারেন। প্রত্যেকের জন্য block , paragraph , word , এবং symbol হয়ে গেলে আপনি পাঠ্য অঞ্চলের স্বীকৃত এবং অঞ্চলের সীমান্তবর্তী স্থানাঙ্ক পেতে পারেন। উদাহরণ স্বরূপ:

    জাভা

    for (JsonElement page : annotation.get("pages").getAsJsonArray()) {
        StringBuilder pageText = new StringBuilder();
        for (JsonElement block : page.getAsJsonObject().get("blocks").getAsJsonArray()) {
            StringBuilder blockText = new StringBuilder();
            for (JsonElement para : block.getAsJsonObject().get("paragraphs").getAsJsonArray()) {
                StringBuilder paraText = new StringBuilder();
                for (JsonElement word : para.getAsJsonObject().get("words").getAsJsonArray()) {
                    StringBuilder wordText = new StringBuilder();
                    for (JsonElement symbol : word.getAsJsonObject().get("symbols").getAsJsonArray()) {
                        wordText.append(symbol.getAsJsonObject().get("text").getAsString());
                        System.out.format("Symbol text: %s (confidence: %f)%n", symbol.getAsJsonObject().get("text").getAsString(), symbol.getAsJsonObject().get("confidence").getAsFloat());
                    }
                    System.out.format("Word text: %s (confidence: %f)%n%n", wordText.toString(), word.getAsJsonObject().get("confidence").getAsFloat());
                    System.out.format("Word bounding box: %s%n", word.getAsJsonObject().get("boundingBox"));
                    paraText.append(wordText.toString()).append(" ");
                }
                System.out.format("%nParagraph:%n%s%n", paraText);
                System.out.format("Paragraph bounding box: %s%n", para.getAsJsonObject().get("boundingBox"));
                System.out.format("Paragraph Confidence: %f%n", para.getAsJsonObject().get("confidence").getAsFloat());
                blockText.append(paraText);
            }
            pageText.append(blockText);
        }
    }
    

    কোটলিন+কেটিএক্স

    for (page in annotation["pages"].asJsonArray) {
        var pageText = ""
        for (block in page.asJsonObject["blocks"].asJsonArray) {
            var blockText = ""
            for (para in block.asJsonObject["paragraphs"].asJsonArray) {
                var paraText = ""
                for (word in para.asJsonObject["words"].asJsonArray) {
                    var wordText = ""
                    for (symbol in word.asJsonObject["symbols"].asJsonArray) {
                        wordText += symbol.asJsonObject["text"].asString
                        System.out.format("Symbol text: %s (confidence: %f)%n",
                            symbol.asJsonObject["text"].asString, symbol.asJsonObject["confidence"].asFloat)
                    }
                    System.out.format("Word text: %s (confidence: %f)%n%n", wordText,
                        word.asJsonObject["confidence"].asFloat)
                    System.out.format("Word bounding box: %s%n", word.asJsonObject["boundingBox"])
                    paraText = String.format("%s%s ", paraText, wordText)
                }
                System.out.format("%nParagraph: %n%s%n", paraText)
                System.out.format("Paragraph bounding box: %s%n", para.asJsonObject["boundingBox"])
                System.out.format("Paragraph Confidence: %f%n", para.asJsonObject["confidence"].asFloat)
                blockText += paraText
            }
            pageText += blockText
        }
    }