Ⅰ.評価方法を堅固に固定させます
毎年その年の特徴を表す質問項目を付け加えたり、入れ替えたりしながら調査をしたほうがタイムリーなランキングができそうに思えます。しかしタイムリーな調査には実は大きな欠点があります。項目内容が変わってしまうと、ランキングの変化が、項目内容の変化によるものか、ブランドの実力の変化によるものか、区別できなくなってしまうからです。比較可能性という観点からは、測定方法・計算方法を変化させないという基本方針は極めて重要なことです。ブランド・ジャパンではランキングを計算する質問項目・調査方法・計算方法を可能な限り変えずにランキングを公表します。
Ⅱ.評価対象は柔軟に変化させます
定量的に価値が測定されるブランドは、毎年実施される事前の定性的な想起調査で選考されます。全てのブランドにエントリーの可能性が開かれています。したがって調査主体の狭量な思い込みによって特定のブランドが排除される可能性がありません。さらに歴史の浅い、誕生して間もないブランドがランキングの上位に位置することもありえます。定性的調査と定量的調査を効果的に組み合わせることによって、ブランド・ジャパンは、人々の心の中にあるブランド勢力図の中心に居続けます。
Ⅲ.調査データから客観的に計算します
ブランド・ジャパンの指数・ランキングは、学者・マスコミ・評論家・経営者などの専門家の意見を全く反映しません。させません。偏見・利益相反・思い込み・ポジショントーク・プロモーション・人脈・特別扱い、その他、あらゆる雑音・思惑から距離を置きます。ブランド・ジャパンは、不偏・不党・正確・公正・中立なブランド価値測定を旨とします。
ブランド・ジャパンでは、基礎データに重みをかけて合計した値を標準化してブランド指数を計算しています。ここでは、①基礎データ、②傾向スコアによる調整、③重みの決定、④標準化、⑤指数の比較、に分けて考え方や方針に関して説明いたします。
① 基礎データ
調査票による調査では、しばしば基礎となるデータの尺度の水準が問題になります。たとえば、あるブランドを「嫌いである」「やや嫌いである」「どちらともいえない」「やや好きである」「好きである」に、それぞれ1点から5点を与えて集計する方法は5件法と呼ばれます。この場合「嫌いである」と回答するより「やや嫌いである」と回答するほうが、嫌いである程度は、当然ながら低いと考えられます。つまり5件法は、回答者の抱いているブランドイメージの順序的な大小を反映させています。ところが実際には、しばしばそれ以上のことをデータに期待してしまいます。たとえば「嫌いである」より「やや嫌いである」に2倍の点数を与えます。「嫌いである」より「好きである」に5倍の点数を与えます。この場合、何故2倍なのか、あるいは5倍なのかは問えませんし、誰にも明快な答えはできません。
このような恣意性がランキングに与える悪影響や不安定さを排除するために、ブランド・ジャパンでは、「確率」を基礎データとして採用します。つまり調査票中の項目の中で「はい(あてはまる)」「いいえ(あてはまらない)」で回答する形式に注目し、
基礎データ=(「はい」と回答した人数)/(当該ブランドの有効回収数)
で計算される確率を基礎データとして利用しています。確率をデータとして利用すれば、たとえば基礎データの値が0.1である場合よりも、0.2である場合のほうが、「はい」と回答する確率が2倍であると解釈できます。ランキングを決める基礎となるデータの意味が明快です。
② 傾向スコアによる調整
ブランド・ジャパンは、プライバシーの保護や経済性のために、無作為抽出ではなく、有意抽出に基づいたWeb調査を利用しています。これは標本抽出理論の観点からは望ましくない特徴です。ブランドランキングは民意の集約を目指しています。したがって母集団から無作為にデータを収集することが、本来的には望ましいのです。しかし無作為抽出調査はプライバシー保護の世論に押され、年々実施が困難になりつつあります。かかる費用も膨大です。その意味で有意抽出によるWeb調査は時代の趨勢です。このような社会情勢に応えるために、ブランド・ジャパンでは基礎データを傾向スコア(propensity score)*によって補正し、母集団の確率に近づけています。
ブランド・ジャパンのWeb調査について、傾向スコアで補正した結果を例示しましょう。補正の精度を検証するため、無作為抽出による郵送調査の結果を見ないで、どれほどそれに近づけられるかを確認してみます。図1はある損害保険会社、図2はある百貨店、図3はあるチョコレートの補正前(a)と補正後(b)の結果です。それぞれの図の(a)は、Web調査の補正前と郵送調査の比率の同時分布です。図の(b)は、Web調査の補正後と郵送調査の比率の同時分布です。
同時分布には16個の点が打たれています。それぞれの点は各々の調査で「親しみを感じる」「勢いがある」などの16の質問項目に対して「当てはまる」と回答した比率を表しています。それらはブランド指数を計算するための質問項目です。
図中のy=xの直線上に点が近いほど、Web調査の結果が無作為抽出による郵送調査の結果に近づけられていることを示しています。図を観察すると、補正前の状況に比べて、補正後のほうが45度の直線に16個の点が近づいており、傾向スコアによる補正が適切に機能している様子が観察されます。
※傾向スコアに関するオリジナル論文:Rosenbaum, P. R. and Rubin, D. B. "The Central Role of the Propensity Score in Observational Studies for Causal Effects". Biometrika, 70(1):pp41-55, 1983.
※「ブランド・ジャパン」における傾向スコアの活用に関する論文:豊田秀樹・川端一光・中村健太郎・片平秀貴 「傾向スコア重み付け法による調査データの調整 -ニューラルネットワークによる傾向スコアの推定-」 行動計量学 第34巻1号, pp101-110, 2007.
図1:補正前(a)
縦軸:Web調査の結果/横軸:郵送調査での結果
図1:補正後(b)
縦軸:Web調査の結果/横軸:郵送調査での結果
図2:補正前(a)
縦軸:Web調査の結果/横軸:郵送調査での結果
図2:補正後(b)
縦軸:Web調査の結果/横軸:郵送調査での結果
図3:補正前(a)
縦軸:Web調査の結果/横軸:郵送調査での結果
図3:補正後(b)
縦軸:Web調査の結果/横軸:郵送調査での結果
③ 重みの決定
ブランド・ジャパンの指数を計算する基礎データは確率です。しかし個々の項目に対する反応確率を眺めていてもランキングはできません。ここでは基礎データを統合し、ランキングにまとめあげるための重みについて説明します。ブランド指数は、
ブランド指数=重み1×基礎データ1+重み2×基礎データ2+・・
のような確率表現された基礎データの重み付き合計です。
たとえば水素と酸素を2:1の割合に混ぜて水を作る。あるいは国算理社による入学試験で、国算を1.5倍して、理社を1倍して足した値を入学試験のテスト得点にするようなものです。水素と酸素の場合は物質の性質によって、入学試験の場合には選抜の理念によって「重み」が決まります。つまりデータとは異なるソースを利用して重みが決められます。ところがブランド価値を上手に表現する重みを恣意性を排除して異なるソースから定めることは容易なことではありません。かといって重みを恣意的に決めるとランキングの信頼性は低下してしまいます。そこでブランド・ジャパンでは、重み自体もデータから客観的に定めています。具体的にはブランド力を決める下位概念を定め、その構造を共分散構造モデル(covariance structure model)を用いて表現し、基礎データに対する重みを決めます。
図4:コンシューマー市場(BtoC)編のパス図
図5:ビジネス市場(BtoB)編のパス図
④ 標準化
ブランド指数の本質は、確率表現された基礎データの共分散構造モデルによる重み付き和です。けれども、指数の解釈を容易にするために1次変換を施しています。具体的には平均が50、標準偏差が10の標準得点として提供されています。これを偏差値といいます。偏差値というと入試ランキングのそれが想像され、あまりイメージがよくないかもしれませんが、偏差値は純粋に統計学的な指標です。偏差値は必ずしも入試の難易度や学力の高低を表す概念ではありません。つまりブランド指数が60なら偏差値60のブランド力、ブランド指数が50なら平均的なブランドというように、なじみの深い物差しでブランド指数を解釈することが可能です。
ここまでの説明を聞いて「おいおい、上位のブランド指数は100を超えているではないか!100を超える偏差値なんて聞いたことがないぞ。」と思った人がいるかもしれません。学力試験の成績のように左右が対称で釣鐘型のヒストグラムを描くデータから偏差値を計算すると、通常は、80以下の値が偏差値の最大値になりますから、そのような疑問をお持ちになっても無理はありません。でも計算違いではありません。偏差値が100を超える場合があるのは、ブランド指数の分布の形のためです。
図6はある年のBtoB編のブランド総合力のヒストグラムです。一見して左右対称ではなく指数が高い少数のブランドと、それ以外のブランドから形成されていることがわかります。このような分布を、正に歪んだ分布とか、正に裾を引いた分布といいます。BtoC編のブランド総合力も同様に正に歪んでいます。偏差値はヒストグラムが正に歪んでいる場合には100を超えることもあるのです。
図6:ビジネス市場(BtoB)編・総合力のヒストグラム
⑤ 指数の比較
ブランド・ジャパンのブランド指数は、基礎となる確率データを共分散構造分析によって得られた重みで1次変換し、全体のデータに関して平均50・標準偏差10になるように2度目の1次変換をして求めています。1次変換は、何度繰り返しても1次変換ですから、ブランド指数は要するに確率データの1次変換です。したがってブランド指数自体は気温や西暦や位置エネルギーと同じように、差を計算してもかまいません。たとえばブランド指数が70のブランドと65のブランドとのブランド力の差は、65のブランドと60のブランドとのブランド力の差と同じと考えてよいわけです。このように差を解釈できる尺度(物差し)を間隔尺度と言います。
それでは年度間の比較、たとえば去年と今年のブランド・ジャパンの比較は可能でしょうか。
この問いに正確に答えるならば、ちょっと難しい言い方になりますが「指標の差に意味を持たせることはできないけれども、分布の中の相対的な位置の比較は可能である」ということになります。
たとえばB大学の昨年の入試偏差値は58であり、今年は55になった場合には、通常は入試難度が下がったといいます。
ところが厳密にいうならば、昨年と今年とでは受験した生徒の集団が違うわけですから、学力レベルを絶対評価で比較した場合に、必ずしも下がったとはいえないのです。
18歳人口減少など全体集団の学力低下やその逆が生じている可能性もあるからです。
しかし分布の中の相対的位置としてなら、入試難易度が下がったと解釈しても間違ってはいないでしょう。
この意味で年度間の比較は可能です。BtoC編とBtoB編の指標間の比較も同じ意味で可能ですから、積極的に比較を行ってください。
最後に下位集団間での比較について解説いたします。
男性と女性のどちらのスコアが高いかという男女別比較や、30歳代・40歳代など、任意に選んだ年齢カテゴリの比較など、下位集団間での比較は可能なのでしょうか。
結論から申し上げるならば、下位集団のスコアは不安定なので、その比較は目安程度にしかなりません。
理由は2つあります。1つは指標を計算するデータが少ないからです。
男女別のスコアはそれぞれ約半分のデータから計算されますし、年代別や地域別のスコアはさらに少ないデータから計算されます。
このためスコアの標準誤差が大きくなり、結果が安定しないのです。
もう1つの理由は、傾向スコアの逆数による重み付き比率を求めていないからです。
逆数の平均は「値が小さい要素があると結果が安定しない」という欠点があります。
全体指標ほどのデータ数があれば結果は安定するのですが、下位集団のデータ数では安定した結果が期待できません。
このため下位集団のスコアには傾向スコアによる補正を実施していません。また全体スコアが、必ずしも男女のスコアの平均的な値になるとは限らないという性質が生じます。
連載:ブランドづくり、5つのヒント
〜ブランド・ジャパン企画委員会からの提言〜
豊田 秀樹 氏
ブランド・ジャパン企画委員 早稲田大学 文学学術院 教授
心理統計学、教育測定学、マーケティング・サイエンス、統計学のエキスパートとして2002年版より結果分析を担当。著書に『SASによる共分散構造分析』(東京大学出版会、1992年)、『購買心理を読み解く統計学』(東京図書、2006年)などがある。