Check out what’s new from Firebase at Google I/O 2022. Learn more

A/B 테스팅을 사용한 메시징 실험 만들기

사용자에게 무엇인가를 홍보하거나 새로운 마케팅 캠페인을 시작할 때는 가장 효과적인 방법을 찾아야 합니다. A/B 테스트는 사용자층을 임의로 나누어 서로 다른 메시지를 테스트함으로써 가장 적절한 문구와 표현 방식을 알아내는 데 도움이 됩니다. 유지율 개선, 프로모션의 전환율 상승 등 목표가 무엇이든 간에 A/B 테스트로 통계 분석을 실시하여 특정 메시지 대안이 원하는 목표를 기준보다 뛰어나게 달성할 수 있는지 파악할 수 있습니다.

기준을 활용해 여러 기능 대안에 대한 A/B 테스트를 하는 방법은 다음과 같습니다.

  1. 실험을 만듭니다.
  2. 테스트 기기에서 실험의 유효성을 검증합니다.
  3. 실험을 관리합니다.

실험 만들기

알림 작성기를 사용한 실험을 통해 알림 메시지의 여러 버전을 평가할 수 있습니다.

  1. Firebase Console에 로그인하고 실험 중 애널리틱스 데이터에 액세스할 수 있도록 프로젝트에서 Google 애널리틱스를 사용 설정했는지 확인합니다.

    프로젝트를 만들 때 Google 애널리틱스를 사용 설정하지 않았다면 통합 탭(Firebase Console > 프로젝트 설정을 사용해 액세스 가능)에서 사용 설정할 수 있습니다.

  2. Firebase Console 탐색 메뉴의 참여 섹션에서 A/B 테스팅을 클릭합니다.

  3. 실험 만들기를 클릭한 후 실험하려는 서비스를 지정하라는 메시지가 표시되면 알림을 선택합니다.

  4. 실험의 이름설명(선택사항)을 입력하고 다음을 클릭합니다.

  5. 실험을 사용할 앱을 먼저 선택하고 타겟팅 입력란을 작성합니다. 다음을 포함하는 옵션을 선택하여 사용자의 일부만 실험에 참여하도록 타겟팅할 수도 있습니다.

    • 버전: 하나 이상의 앱 버전입니다.
    • 잠재 사용자: 실험에 포함될 수 있는 사용자를 타겟팅하는 데 사용되는 애널리틱스 잠재고객입니다.
    • 사용자 속성: 실험에 포함될 수 있는 사용자를 선택하는 하나 이상의 애널리틱스 사용자 속성입니다.
    • 국가/지역: 실험에 포함될 수 있는 사용자를 선택하는 하나 이상의 국가 또는 지역입니다.
    • 기기 언어: 실험에 포함될 수 있는 사용자를 선택하는 데 사용되는 하나 이상의 언어입니다.
    • 최초 실행: 사용자가 앱을 처음으로 실행한 시간을 기준으로 사용자를 타겟팅합니다.
    • 마지막 앱 참여: 사용자가 앱에 마지막으로 참여한 시간을 기준으로 사용자를 타겟팅합니다.
  6. 대상 사용자 비율 설정: 대상 사용자에 설정한 기준과 일치하는 앱 사용자층 중에서 기준 및 하나 이상의 실험 대안 간에 균등하게 나눌 비율을 선택합니다. 0.01%~100% 사이의 백분율을 입력할 수 있습니다. 백분율은 중복 실험을 포함하여 실험마다 사용자에게 무작위로 다시 할당됩니다.

  7. 대안 섹션의 메시지 내용 입력 필드에 기준 그룹에 전송할 메시지를 입력합니다. 기준 그룹에 메시지를 보내지 않으려면 이 필드를 비워 둡니다.

  8. (선택사항) 실험에 하나 이상의 대안을 추가하려면 대안 추가를 클릭합니다. 실험에는 기본적으로 1개의 기준과 1개의 대안이 포함됩니다.

  9. (선택사항) 실험의 각 대안에 이름을 입력하여 대안 A, 대안 B 등의 이름을 대체합니다.

  10. 드롭다운 목록에서 원하는 추가 측정항목과 함께 실험 대안을 평가할 때 사용할 실험의 목표 측정항목을 정의합니다. 여기에는 기본 목표(참여도, 구매, 수익, 유지율 등), 애널리틱스 전환 이벤트 및 기타 애널리틱스 이벤트가 포함됩니다.

  11. 메시지 옵션을 선택합니다.

    • 전송 날짜: 지금 보내기를 클릭하여 실험을 즉시 시작하거나 일정 예약을 클릭하여 실험을 시작할 시간을 지정합니다.
    • 고급 옵션: 실험에 포함된 모든 알림에 대한 고급 옵션을 선택하려면 고급 옵션을 펼치고 나열된 메시지 옵션 중 원하는 항목을 변경합니다.
  12. 검토를 클릭하여 실험을 저장합니다.

프로젝트당 최대 300개의 실험이 허용되며 최대 24개의 진행 중인 실험을 구성하고 나머지는 초안 또는 완료로 구성할 수 있습니다.

테스트 기기에서 실험 검증

Firebase 설치마다 연결된 FCM 등록 토큰을 검색할 수 있습니다. 이 토큰을 사용하면 앱이 설치된 테스트 기기에서 특정 실험 대안을 테스트할 수 있습니다. 테스트 기기에서 실험의 유효성을 검사하는 방법은 다음과 같습니다.

  1. 다음과 같이 FCM 등록 토큰을 가져옵니다.

    Swift

    Messaging.messaging().token { token, error in
      if let error = error {
        print("Error fetching FCM registration token: \(error)")
      } else if let token = token {
        print("FCM registration token: \(token)")
        self.fcmRegTokenMessage.text  = "Remote FCM registration token: \(token)"
      }
    }
    

    Objective-C

    [[FIRMessaging messaging] tokenWithCompletion:^(NSString *token, NSError *error) {
      if (error != nil) {
        NSLog(@"Error getting FCM registration token: %@", error);
      } else {
        NSLog(@"FCM registration token: %@", token);
        self.fcmRegTokenMessage.text = token;
      }
    }];
    

    자바

    FirebaseMessaging.getInstance().getToken()
        .addOnCompleteListener(new OnCompleteListener<String>() {
            @Override
            public void onComplete(@NonNull Task<String> task) {
              if (!task.isSuccessful()) {
                Log.w(TAG, "Fetching FCM registration token failed", task.getException());
                return;
              }
    
              // Get new FCM registration token
              String token = task.getResult();
    
              // Log and toast
              String msg = getString(R.string.msg_token_fmt, token);
              Log.d(TAG, msg);
              Toast.makeText(MainActivity.this, msg, Toast.LENGTH_SHORT).show();
            }
        });

    Kotlin+KTX

    FirebaseMessaging.getInstance().token.addOnCompleteListener(OnCompleteListener { task ->
        if (!task.isSuccessful) {
            Log.w(TAG, "Fetching FCM registration token failed", task.exception)
            return@OnCompleteListener
        }
    
        // Get new FCM registration token
        val token = task.result
    
        // Log and toast
        val msg = getString(R.string.msg_token_fmt, token)
        Log.d(TAG, msg)
        Toast.makeText(baseContext, msg, Toast.LENGTH_SHORT).show()
    })

    C++

    firebase::InitResult init_result;
    auto* installations_object = firebase::installations::Installations::GetInstance(
        firebase::App::GetInstance(), &init_result);
    installations_object->GetToken().OnCompletion(
        [](const firebase::Future& future) {
          if (future.status() == kFutureStatusComplete &&
              future.error() == firebase::installations::kErrorNone) {
            printf("Installations Auth Token %s\n", future.result()->c_str());
          }
        });
        

    Unity

    Firebase.Messaging.FirebaseMessaging.DefaultInstance.GetTokenAsync().ContinueWith(
      task => {
        if (!(task.IsCanceled || task.IsFaulted) && task.IsCompleted) {
          UnityEngine.Debug.Log(System.String.Format("FCM registration token {0}", task.Result));
        }
      });
    
  2. Firebase Console 탐색 메뉴에서 A/B 테스팅을 클릭합니다.
  3. 초안을 클릭하고 마우스를 실험 위에 가져간 다음 컨텍스트 메뉴()를 클릭하고 테스트 기기 관리를 클릭합니다.
  4. 테스트 기기의 FCM 토큰을 입력하고 테스트 기기로 전송할 실험 대안을 선택합니다.
  5. 앱을 실행하고 선택한 대안이 테스트 기기에 수신되는지 확인합니다.

실험 관리

원격 구성, 알림 작성기 또는 Firebase 인앱 메시지 중 무엇으로 실험을 만드는지에 관계없이 실험을 검증 및 시작하고, 실험이 실행되는 동안 모니터링하고, 실행 중인 실험에 포함된 사용자 수를 늘릴 수 있습니다.

실험이 끝나면 우수한 대안에 사용된 설정을 기록해 두고 이후에 모든 사용자에게 이 설정을 적용하거나 다른 실험을 진행할 수 있습니다.

실험 시작

  1. Firebase Console 탐색 메뉴의 참여 섹션에서 A/B 테스팅을 클릭합니다.
  2. 초안을 클릭하고 실험 제목을 클릭합니다.
  3. 실험에 포함될 사용자가 앱에 있는지 검증하려면 초안 세부정보를 펼치고 타겟팅 및 분포에서 0%보다 큰 숫자가 있는지 확인합니다(예: 기준과 일치하는 사용자 1%).
  4. 실험을 변경하려면 수정을 클릭합니다.
  5. 실험을 시작하려면 실험 시작을 클릭합니다. 한 번에 프로젝트당 최대 24개의 실험을 실행할 수 있습니다.

실험 모니터링

실험이 일정 시간 진행되면 실험의 진행 상황을 확인하고 지금까지 실험에 참여한 사용자의 결과가 어떤지 살펴볼 수 있습니다.

  1. Firebase Console 탐색 메뉴의 참여 섹션에서 A/B 테스팅을 클릭합니다.
  2. 실행 중을 클릭하고 실험 제목을 클릭합니다. 이 페이지에서는 다음을 포함하여 진행 중인 실험에 대한 다양한 관찰 및 모델링된 통계를 확인할 수 있습니다.

    • 기준과의 차이(%): 기준과 비교하여 특정 대안의 측정항목 개선도를 측정한 값입니다. 대안의 값 범위를 기준의 값 범위와 비교하여 계산합니다.
    • 기준 초과 가능성: 특정 대안이 선택한 측정항목의 기준을 초과할 것으로 예측되는 확률입니다.
    • 사용자당 observed_metric: 실험 결과를 기준하여 시간 경과에 따라 측정항목 값이 예상되는 범위입니다.
    • 전체 observed_metric: 기준 또는 대안에서 관찰된 누적 값입니다. 이 값은 각 실험 대안의 실적을 측정하고 개선, 값 범위, 기준 초과 가능성, 최적의 대안이 될 가능성을 계산하는 데 사용됩니다. 대상 측정항목에 따라 이 열에 '사용자당 기간', '사용자당 수익', '유지율', '전환율' 등의 라벨을 지정할 수 있습니다.
  3. 일정 시간(FCM 및 인앱 메시지의 경우 최소 7일, 원격 구성의 경우 14일) 동안 실험이 진행된 후 이 페이지의 데이터에 '최우수 대안'이 있다면 어떤 대안인지 표시됩니다. 일부 측정항목은 데이터를 시각적으로 표현하는 막대 그래프가 함께 제공될 수 있습니다.

모든 사용자에게 실험 적용

목표 측정항목을 기준으로 가장 우수한 대안이 판명될 때까지 실험이 충분히 진행되었으면 이를 사용자 전체에 적용할 수 있습니다. 이렇게 하여 앞으로 모든 사용자에게 게시할 대안을 선택할 수 있습니다. 실험을 통해 우열이 명확히 가려지지 않은 경우에도 대안 중 하나를 모든 사용자에게 적용할 수 있습니다.

  1. Firebase Console 탐색 메뉴의 참여 섹션에서 A/B 테스팅을 클릭합니다.
  2. 완료됨 또는 실행 중을 클릭하고 모든 사용자에게 적용할 실험을 클릭한 다음 컨텍스트 메뉴()를 클릭하고 대안 적용을 클릭합니다.
  3. 다음 중 하나를 수행하여 실험을 모든 사용자에게 적용합니다.

    • 실험에서 알림 작성기를 사용하는 경우 메시지 전파 대화상자를 사용하여 이전에 실험에 참여하지 않았던 나머지 타겟팅 사용자에게 메시지를 보냅니다.
    • 원격 구성 실험의 경우 업데이트할 원격 구성 매개변수 값을 결정할 대안을 선택합니다. 실험을 만들 때 정의된 타겟팅 기준은 템플릿에 새 조건으로 추가되어 실험에서 타겟팅되는 사용자에게만 적용되도록 합니다. 원격 구성에서 검토를 클릭하여 변경사항을 검토한 후 변경사항 게시를 클릭하여 적용을 완료합니다.
    • 인앱 메시지 실험의 경우 대화상자를 사용하여 독립형 인앱 메시지 캠페인으로 적용해야 하는 대안을 결정합니다. 선택하면 FIAM 작성 화면으로 리디렉션되어 게시하기 전에 필요한 경우 변경할 수 있습니다.

실험 확장

A/B 테스팅에서 실험에 참여하는 사용자 수가 부족하여 우열을 가릴 수 없는 경우 실험의 분포를 늘려 앱 사용자층에서 실험에 참가하는 비율을 높일 수 있습니다.

  1. Firebase Console 탐색 메뉴의 참여 섹션에서 A/B 테스팅을 클릭합니다.
  2. 수정하려는 실행 중 실험을 선택합니다.
  3. 실험 개요에서 컨텍스트 메뉴()를 클릭한 후 실행 중인 실험 수정을 클릭합니다.
  4. 타겟팅 대화상자에는 현재 실행 중인 실험에 있는 사용자의 비율을 높일 수 있는 옵션이 표시됩니다. 현재 백분율보다 큰 숫자를 선택하고 게시를 클릭합니다. 그러면 지정한 비율의 사용자에게 실험이 적용됩니다.

실험 복제 또는 중지

  1. Firebase Console 탐색 메뉴의 참여 섹션에서 A/B 테스팅을 클릭합니다.
  2. 완료됨 또는 실행 중을 클릭하고, 실험 위에 마우스를 가져간 다음, 컨텍스트 메뉴()를 클릭하고, 실험 복제 또는 실험 중지를 클릭합니다.

사용자 타겟팅

다음과 같은 사용자 타겟팅 기준을 사용하여 실험에 포함할 사용자를 타겟팅할 수 있습니다.

타겟팅 기준 연산자    참고사항
버전 포함,
제외,
정확히 일치함,
정규식 포함
실험에 포함할 하나 이상의 앱 버전 값을 입력합니다.

포함, 제외 또는 정확히 일치함 연산자를 사용하는 경우 쉼표로 구분된 값 목록을 제공할 수 있습니다.

정규식 포함 연산자를 사용하면 RE2 형식의 정규 표현식을 만들 수 있습니다. 정규 표현식은 타겟 버전 문자열의 일부 또는 전부와 일치할 수 있습니다. ^$ 앵커를 사용하여 타겟 문자열의 시작, 끝 또는 전체와 일치시킬 수도 있습니다.

잠재 사용자 다음을 모두 포함,
다음 중 1개 이상 포함,
다음을 모두 포함하지 않음,
다음 중 최소 1개를 포함하지 않음
실험에 포함될 수 있는 사용자를 타겟팅하는 애널리틱스 잠재고객을 하나 이상 선택합니다. Google 애널리틱스 잠재고객을 타겟팅하는 일부 실험에는 애널리틱스 데이터 처리 지연 시간이 발생하므로 데이터가 누적되는 데 며칠이 걸릴 수 있습니다. 일반적으로 생성 후 24~48시간 이내에 적격한 잠재고객으로 등록된 신규 사용자 또는 최근 생성된 잠재고객에게 이러한 지연이 발생할 가능성이 가장 높습니다.
사용자 속성 텍스트:
포함,
제외,
정확히 일치함,
정규식 포함

숫자:
<, ≤, =, ≥, >
애널리틱스 사용자 속성은 실험에 포함될 수 있는 사용자를 선택하는 데 사용되고, 다양한 옵션으로 사용자 속성 값을 선택할 수 있습니다.

클라이언트에서는 사용자 속성에 문자열 값만 설정할 수 있습니다. 숫자 연산자를 사용하는 조건의 경우 원격 구성 서비스는 해당 사용자 속성의 값을 정수/부동 소수로 변환합니다.
정규식 포함 연산자를 사용하면 RE2 형식의 정규 표현식을 만들 수 있습니다. 정규 표현식은 타겟 버전 문자열의 일부 또는 전부와 일치할 수 있습니다. ^$ 앵커를 사용하여 타겟 문자열의 시작, 끝 또는 전체와 일치시킬 수도 있습니다.
기기 국가 해당 없음 실험에 포함될 수 있는 사용자를 선택하는 데 사용되는 하나 이상의 국가 또는 지역입니다.  
기기 언어 해당 없음 실험에 포함될 수 있는 사용자를 선택하는 데 사용되는 하나 이상의 언어입니다. 이 타겟팅 기준은 원격 구성에서만 사용할 수 있습니다.
최초 실행 초과
미만
사이
사용자가 앱을 처음으로 실행한 날짜를 기준으로 사용자를 타겟팅하며 일 단위로 지정됩니다. 이 타겟팅 기준은 Firebase 인앱 메시지에서만 사용할 수 있습니다.
마지막 앱 참여 초과
미만
사이
사용자가 앱을 마지막으로 사용한 날짜를 기준으로 사용자를 타겟팅하며 일 단위로 지정됩니다. 이 타겟팅 기준은 Firebase 인앱 메시지에서만 사용할 수 있습니다.

A/B 테스팅 측정항목

실험을 만들 때는 가장 우수한 대안을 결정하는 데 사용되는 기본 또는 목표 측정항목을 선택합니다. 또한 각 실험 대안의 실적을 더 잘 파악하고 사용자 유지, 앱 안정성, 인앱 구매 수익 등 대안마다 다를 수 있는 중요한 추세를 추적할 수 있도록 다른 측정항목도 추적해야 합니다. 실험에서 목표 이외의 측정항목을 최대 5개까지 추적할 수 있습니다.

예를 들어 앱에 새 인앱 구매를 추가했고 두 가지 '유도' 메시지의 효과를 비교하려고 한다고 가정해 보겠습니다. 이 경우 가장 실적이 좋은 대안이 가장 높은 인앱 구매 수익을 가져온 알림을 나타내도록 하기 위해 구매 수익을 목표 측정항목으로 설정하기로 결정할 수 있습니다. 또한 향후 전환과 사용자 유지를 유도한 대안을 추적하기 위해 추적할 기타 측정항목에 다음을 추가할 수 있습니다.

  • 예상 총 수익: 총 인앱 구매와 광고 수익이 두 대안 간에 어떻게 다른지 확인합니다.
  • 유지(1일), 유지(2~3일), 유지(4~7일): 일일/주간 사용자 유지 추적

다음 표에서는 목표 측정항목과 기타 측정항목이 계산되는 방식을 상세히 확인할 수 있습니다.

목표 측정항목

측정항목 설명
비정상 종료가 발생하지 않은 사용자 실험 중에 앱에서 Firebase Crashlytics SDK가 탐지한 오류를 경험하지 않은 사용자의 백분율입니다.
예상 광고 수익 예상 광고 수입입니다.
총 추정 수익 구매 및 추정 광고 수익의 합산 값입니다.
구매 수익 모든 purchasein_app_purchase 이벤트의 합산 값입니다.
유지(1일) 앱을 매일 다시 사용하는 사용자 수입니다.
유지(2~3일) 2~3일 이내에 앱을 다시 사용하는 사용자 수입니다.
유지(4~7일) 4~7일 이내에 앱을 다시 사용하는 사용자 수입니다.
유지(8~14일) 8~14일 이내에 앱을 다시 사용하는 사용자 수입니다.
유지(15일 이상) 앱을 마지막으로 사용하고 15일 이상 경과한 후에 앱을 다시 사용하는 사용자 수입니다.
first_open 사용자가 앱을 설치 또는 재설치한 후 처음으로 실행할 때 트리거되는 애널리틱스 이벤트입니다. 전환 유입경로의 일부로 사용됩니다.

기타 측정항목

측정항목 설명
notification_dismiss 알림 작성기에서 보낸 알림을 닫을 때 트리거되는 애널리틱스 이벤트입니다(Android 전용).
notification_receive 알림 작성기에서 보낸 알림이 백그라운드 앱에 수신될 때 트리거되는 애널리틱스 이벤트입니다(Android 전용).
os_update 기기 운영체제가 새로운 버전으로 업데이트되는 시점을 추적하는 애널리틱스 이벤트입니다. 자세한 내용은 자동으로 수집되는 이벤트를 참조하세요.
screen_view 앱의 화면 조회를 추적하는 애널리틱스 이벤트입니다. 자세한 내용은 화면 조회수 추적을 참조하세요.
session_start 앱의 사용자 세션 수를 계산하는 애널리틱스 이벤트입니다. 자세한 내용은 자동 수집 이벤트를 참조하세요.

BigQuery 데이터 내보내기

BigQuery에서 A/B 테스팅과 관련된 모든 애널리틱스 데이터에 액세스할 수 있습니다. BigQuery를 사용하면 BigQuery SQL로 데이터를 분석하여 다른 클라우드 제공업체로 내보내거나, 커스텀 ML 모델에 데이터를 사용할 수 있습니다. 자세한 내용은 Firebase에 BigQuery 연결을 참조하세요.

BigQuery 데이터 내보내기를 최대한 활용하려면 Firebase 프로젝트에서 'Blaze' 요금제(사용한 만큼만 지불)를 사용해야 합니다. BigQuery에서는 데이터 저장, 스트리밍 삽입, 데이터 쿼리에 대한 요금이 부과됩니다. 데이터 로드 및 내보내기는 무료입니다. 자세한 내용은 BigQuery 가격 책정 또는 BigQuery 샌드박스를 참조하세요.

시작하려면 Firebase 프로젝트가 BigQuery에 연결되어 있어야 합니다. 왼쪽 탐색 메뉴에서 설정 > 프로젝트 설정을 선택한 후 통합 > BigQuery > 연결을 선택합니다. 이 페이지에는 프로젝트에 포함된 모든 앱에 대해 BigQuery 애널리틱스 데이터 내보내기를 수행할 수 있는 옵션이 표시됩니다.

실험의 애널리틱스 데이터를 쿼리하려면 다음 단계를 따르세요.

  1. 활성 실험 목록에서 원하는 실험을 선택하여 실험 결과 페이지를 엽니다.
  2. 실험 개요 창의 컨텍스트 메뉴에서 실험 데이터 쿼리를 선택합니다(무료 등급의 프로젝트에서는 이 옵션을 사용할 수 없음).

    그러면 검토를 위해 실험 데이터의 자동 생성된 쿼리 예시가 미리 로드된 BigQuery 콘솔의 쿼리 작성기가 열립니다. 이 쿼리에서 키에는 실험 이름이, 값에는 실험 대안이 포함된 사용자 속성으로 인코딩됩니다.

  3. 쿼리 작성기에서 쿼리 실행을 선택합니다. 결과가 하단 창에 표시됩니다.

BigQuery의 Firebase 데이터는 매일 한 번만 업데이트되기 때문에 실험 페이지에 제공되는 데이터가 BigQuery 콘솔에 제공되는 데이터보다 최신일 수 있습니다.