統計で信頼できるサンプル数の決め方とは?計算方法と目安を解説

マーケティング・データ分析
統計で信頼できるサンプル数の決め方とは?計算方法と目安を解説

アンケート調査などで信頼性の高いデータを集めるためには、適切なサンプル数を設定することが不可欠です。

サンプル数が少なすぎると結果の信頼性が揺らぎ、多すぎると時間やコストが無駄にかかってしまいます。
一般的に最低でも30サンプルが必要とされますが、調査の目的によって最適な数は異なります。

この記事では、統計学的な根拠に基づいたサンプル数の計算方法から、すぐに使えるサンプル数の目安までを具体的に解説します。

お店やサービスをもっと良くしたい!と思っているけど、何から手を付ければいいか分からない!と言ったお悩みをお持ちではありませんか?

ファンくる」では、ブランド選択理由や店舗毎特性など、お客様の体験を可視化できるようになりました。

特許を取得した独自解析によって、ブランド戦略や商圏戦略、業務改善をご支援します。
経営の意思決定や現場改善に繋がるデータ活用に課題を感じている方はお気軽にご相談ください。
>>ファンくるのサービス概要を見る

統計の信頼性を決める「サンプル数」の基礎知識

統計調査には、調査対象のすべてを調べる「全数調査」と、一部を抽出して全体を推測する「標本調査」があります。

時間や費用の制約から、多くの調査は標本調査によって行われます。
この標本調査において、結果の信頼性を左右するのが「サンプル数」です。

適切なサンプル数を確保することで、調査結果が調査対象全体の意見や傾向をどれだけ正確に反映しているか、その精度が決まります。

そのため、目的に応じたサンプル数を設定するための計算方法を理解しておくことが重要です。

まずは用語を整理!「サンプル数」と「サンプルサイズ」の定義

統計調査において「サンプル数」とは、調査対象としてデータを集める個人の数や件数を指し、「n数」とも表現されます。

「サンプルサイズ」という言葉もよく使われますが、一般的なアンケート調査の文脈ではサンプル数とほぼ同じ意味で用いられることがほとんどです。

厳密に言えば、統計学の分野によっては、グループの数をサンプルサイズと呼ぶなど区別されるケースもありますが、基本的には調査に協力してくれた人の人数を示す言葉として理解しておけば問題ありません。

この記事でも、回答者数を「サンプル数」として扱います。

信頼できるサンプル数を計算するための5ステップ

統計学的な根拠に基づき、調査の目的に見合った信頼できるサンプル数を算出するには、いくつかの指標を設定していく必要があります。

まず調査対象の全体像である「母集団」を定義します。
次に、結果のブレ幅である「許容誤差」(標本誤差とも呼ばれます)と、結果の確からしさを示す「信頼水準」(信頼度、信頼係数とも呼ばれます)を決めます。

これらに加え、回答のばらつき(標準偏差や出現率)を考慮することで、最終的に必要なサンプル数を導き出すことができます。
これらのステップを踏むことで、精度の高い調査設計が可能になります。

一般的に、サンプル数を算出するステップは、母集団の定義、許容誤差と信頼水準の設定、回答のばらつきの考慮など、主に3つか4つとされています。

ステップ1:調査対象となる「母集団」の規模を把握する

サンプル数の計算における最初のステップは、調査対象となる全体の集団、すなわち「母集団」の規模を正確に把握することです。

例えば「自社製品を利用している30代男性」を調査対象とする場合、その該当者全員の数が母集団の規模となります。
この数値は、後に行う計算の基礎となるため、できるだけ正確な値を把握することが求められます。

ただし、日本の総人口のように母集団が非常に大きい、あるいは規模の特定が困難な場合は、計算上、母集団の数を無限とみなして算出を進めることも一般的です。

ステップ2:どこまで許容できるか「許容誤差」を決める

許容誤差とは、調査で得られた結果と、母集団全体の真の値との間に生じるズレを、どの程度まで許容できるかを示す割合のことです。

これは標本誤差とも呼ばれます。
例えば、許容誤差を5%に設定すると、調査結果が「支持率40%」だった場合、実際の母集団の支持率は「35%〜45%」の範囲にあると推定できます。

この許容誤差を小さくすれば調査の精度は上がりますが、その分より多くのサンプル数が必要になります。

一般的な市場調査などでは5%に設定されることが多いです。

ステップ3:結果の確からしさを示す「信頼度」を設定する

「信頼度」は、同じ調査を何度も繰り返した場合に、得られた結果が設定した許容誤差の範囲内に収まる確率を示し、信頼水準とも呼ばれます。

一般的に、市場調査や世論調査では95%に設定されることが標準的です。
信頼度95%とは、「同様の調査を100回行ったら、そのうち95回は結果が許容誤差の範囲内に収まる」という確からしさを意味します。

より高い精度が求められる医療分野の研究などでは99%が用いられることもありますが、信頼度を高く設定するほど必要なサンプル数は増加します。

ステップ4:想定される「回答比率」を考慮する

「回答比率」とは、質問に対する回答のばらつきの度合いを示す指標です。
「はい」「いいえ」で答える二者択一の質問の場合、それぞれの回答が何%ずつになるかの予測値を指します。

この回答比率が「50%」のとき、つまり意見が真っ二つに分かれる状態が、統計的に最もばらつきが大きいと判断されます。
そのため、必要なサンプル数もこの場合に最大となります。

過去のデータなどから回答比率を予測できない場合は、最も安全な数値である50%に設定して計算を進めるのが一般的です。

ステップ5:必要な回収数を算出し配布数を決める

ここまでのステップで設定した母集団の規模、許容誤差、信頼度、回答比率の数値を使い、必要なサンプル数を計算します。

この計算は、Web上で公開されているサンプル数計算ツールなどを利用すると簡単です。
算出された数値は、あくまで「有効な回答として回収すべき目標数」である点に注意が必要です。

実際のアンケートでは無効回答や未回答が発生するため、目標数を確保するには想定される回収率を考慮して配布数を決めなければなりません。

例えば、回収率が25%で目標が400サンプルの場合、1600人に配布する必要があります。

計算いらず!標本誤差から見るサンプル数の目安

毎回数値を設定して計算するのが難しい場合や、調査設計の初期段階で大まかな規模感を知りたいときには、サンプル数の目安を覚えておくと便利です。

ここでは、多くの調査で基準となる信頼度95%、回答比率50%を前提とした場合に、標本誤差の大きさ別に必要となるサンプル数の目安を紹介します。

これらの数値を把握しておけば、調査にかかる費用や時間を見積もる際の参考になります。

【目安1】標本誤差を約15%に抑えたいなら50サンプル

サンプル数が50の場合、標本誤差は約15%になるとされています。これは調査結果に±15%程度のズレが生じる可能性を示しており、統計的な信頼性は高いとは言えません。

例えば、あるサービスの満足度が50%という結果でも、実際の満足度は約35%から65%まで幅広い範囲にあると推定されます。

そのため、このサンプル数はあくまで大まかな傾向を把握するためのものであり、本格的な調査前のプレ調査や、組織内での簡易的な意見収集といった、厳密な精度が求められない限定的な用途に適しています。

【目安2】標本誤差を約10%に抑えたいなら100サンプル

サンプル数を100まで集めると、標本誤差は約9.8%まで小さくなります。
調査結果のズレが±10%程度に収まるため、最低限の信頼性を担保したい場合の一つの基準となる数字です。

小規模な調査や、Webサイトなどで公開される簡易的なアンケート結果として用いられることがあります。

ただし、例えば商品の購入意向が30%という結果の場合でも、実際の購入意向は20%から40%の範囲にある可能性があり、重要な意思決定の根拠とするには、まだ誤差が大きいと感じられるかもしれません。

【目安3】標本誤差を約5%に抑えたいなら400サンプル

多くの市場調査や公的な世論調査で目標とされる標本誤差5%を達成するには、約400のサンプル数が必要となります。

正確な計算では384という数字が導き出されますが、覚えやすさから400が一般的な目安として広く認知されています。

この水準であれば、調査結果は十分に信頼性が高いと見なされ、精度の高い分析や戦略立案に活用できます。

例えば、支持率が50%という結果であれば、実際の値は45%から55%の間に収まると高い確率で推定でき、コストと精度のバランスが取れた現実的な目標値と言えます。

調査の精度をさらに上げる!信頼性を高めるためのポイント

信頼できる調査結果を得るためには、適切なサンプル数を確保することが基本ですが、それだけでは不十分な場合があります。

調査全体の設計や実施方法に注意を払うことで、結果の質と信頼性をさらに向上させることが可能です。

ここでは、サンプル数の確保に加えて、調査から得られる情報の価値を最大化するための2つの重要なポイントについて解説します。

ポイント1:調査の目的や仮説を明確に設定する

信頼性の高い調査の第一歩は、「この調査を通じて何を明らかにしたいのか」という目的を明確に定義することです。

目的が具体的であれば、聴取すべき質問項目が絞り込まれ、回答者にとって答えやすく、分析しやすい質の高いデータを収集できます。

目的が曖昧なまま調査を始めると、質問数がいたずらに増え、回答者の負担が大きくなることで、回答の質が低下する原因にもなります。

「〇〇という仮説は正しいか」といった具体的な仮説を立てることで、調査設計が洗練され、結果の解釈も容易になります。

ポイント2:回答データの偏りをなくし品質を確保する

十分なサンプル数を集めたとしても、その回答者の属性に偏りがあれば、調査結果は母集団の意見を正しく反映できません。
例えば、特定の性別や年代の回答者ばかりになってしまうと、結果もその層の意見に引きずられてしまいます。

これを避けるためには、母集団の構成に合わせて性別・年齢などの割り付けを行う「割付法」が有効です。

また、回答時間が極端に短い、あるいは矛盾した回答をしているといった不誠実なデータを除外する「データクリーニング」の作業も、データの品質を担保し、調査全体の信頼性を高める上で欠かせません。

まとめ

統計調査において、結果の説得力は適切なサンプル数の設定に大きく依存します。
母集団の規模や求める精度に応じて計算する方法が最も確実ですが、標本誤差から逆引きした目安(誤差5%で400サンプルなど)を参考にすることも実用的です。

ただし、単に数を集めるだけでなく、調査の目的を明確化し、回答者の偏りをなくしてデータの質を確保することも同等に重要です。

これらの要素を総合的に考慮して調査を設計することで、得られる情報の価値は大きく向上します。