量的研究で必要なサンプル数の質問をよく受けます。
競争的資金を得た大きな調査ならばともかく、卒論や修論で行う調査では統計的に必要な数と実際に収集できる数には乖離がある場合が多く、これまでの経験からおよそ100~200と答えています。
正確に計算することはできますか、といった質問をうけることもあり、それに対しては統計ですからサンプル数を計算式で算出する、というのが回答になります。
必要な数字は出現率(母比率)と誤差と信頼度です。
出現率(母比率)は調査対象とする集団(母集団)に、調査する条件を満たす対象がどれぐらい含まれるかの比率で
0 < 出現率(母比率) < 100の範囲、
誤差はサンプルの比率が出現率(母比率)の上下で何%の範囲内にあるか(サンプル数を出したいときは上下で何%の範囲内にしたいか)の比率で
0< 誤差 < 100の範囲、
信頼度は母集団の平均値が信頼区間内に入る確率(サンプル数を出したいときは何%の確率にしたいか)のことで
90< 信頼度 < 100の範囲、となります。
例えば、100のサンプルに対して、信頼度90%、誤差が5%だと90のサンプルについてサンプル比率と母比率との差が上下5%内にあるということになります。
実際の調査では出現率(母比率)はわからないことが多いので、、一番厳しい(大きい)数字が出てくる50%を入れておくと確実です。
実際の数式はこのブログの一番上の画像におきました。
これは、エクセルで以下の関数を入れても計算できます。
=NORMSINV(1-(1-信頼度/100)/2)^2/サンプリング誤差^2*出現率*(100-出現率)
例えば、誤差が5.0%、信頼度が95.0%、出現率が50.0%だと必要なサンプルサイズは384となります。
しかしながら、実際、一学生としてこのサンプル数を集めることは難しく、およそ、指導教官の方々は経験上から必要と考えられる数を教示される場合が多いです。
「だから、なんぼやねん!」、と言われそうですが、私の個人的な感覚からは(あいまいな書き方ですみません。)相関を出す必要があるならば150から200ぐらいかなと思います。
目安の一つとして参考にされてください。