BLOG
ブログ

知っていると見方が変わる!集計のちょっと役立つ話

アンケート集計2019.01.18 [Fri]

こんにちは。
データセレクト日比野です。

 

前回、集計について基本的なことをお話しました。
簡単に言うと「集計とは、データをまとめて見やすく“可視化”すること」でしたよね。
詳しくは一つ前のブログ「集計と統計の違いは?アンケート集計の基本」をご覧ください。

 

では、今回はもう少し具体的に、グラフの種類や細かい数値を見ていきましょう。

「実際に集計を行う時や、業者に頼む時に知っているとちょっと役立つ!」そんなお話です。

 

――――――――――――――――――――――――

 

集計をより見やすく、正確に。
そのために知っておきたいこと。

 

――――――――――――――――――――――――

 

-------------------------------------------
-------------------------------------------

1. グラフの種類、使い分け
1-1. 主なグラフ3つ
1-2. ちょっと役立つポイント~グラフ編~

2. 気にしておきたい数値の話
2-1. 平均値、中央値、最頻値
2-2. ちょっと役立つポイント~数値編~

3. 最後は人の判断力

 

-------------------------------------------
-------------------------------------------

 

1. グラフの種類、使い分け

 

1-1. 主なグラフ3つ

 

データの可視化と聞いて、すぐに思い浮かべるのがグラフではないでしょうか。
とは言え、グラフにも色々ありますよね。例えば…、

 

○円グラフ
 お馴染みの丸いグラフ。円の全体を100%として、各項目の比率によって分割。
 細かい種類は、分割円、補助円グラフ付き円グラフ、補助縦棒付き円、ドーナツなどがある。

 

○帯グラフ
 円グラフを長方形の帯状にしたグラフ。主に項目間の構成比を比較するために使う。

 

○棒グラフ・折れ線グラフ
 項目ごとにニョキニョキと棒が生えているようなグラフ。こちらもよく見かけるタイプ。
 縦軸がパーセンテージ、横軸が項目、が一般的。
 この時の棒の頂点を隣同士で結んだ線のグラフのことを折れ線グラフと言う。

 

というように、種類も様々。
ではここで、お役立ちポイントをお話しましょう。

 

 

1-2. ちょっと役立つポイント~グラフ編~

 

○円グラフの表し方

 

 

 

この円グラフ2種類を見てください。

実は両方とも表1の内容をグラフにしたもの。

さて、どちらが「いいグラフ」でしょうか。ちょっと考えてみてください。その理由まで考えられたら素敵です。

正解は…、

 

そう、「グラフ2 右側のグラフ」です!

 

パッと見、「グラフ1」は3Dで描かれていて立体的でなんか見栄えいいし、カッコいい!

確かにそうなんです。そうなんですが、グラフの本来の目的は「正確に構成比を表すこと」

 

「グラフ1」は、手前の「31~40歳」が大きく、奥の「51~60歳」が小さく見えませんか?
でもこれ、実は同じ21%。
遠近法によって奥行きが出てしまい、見え方が変わってくるのです。
それにより、本来の結果とは違う印象を与えてしまい、グラフとしての価値を疑われることにもつながります。

 

基本的に“グラフで3Dは使わない”は、集計の常識です。

 

同様に「グラフ3」をご覧ください。

 

 

たとえ2Dのグラフでも、色をグラデーションにすると、光の反射具合で認識を誤らせる場合もあります。

ですから、こちらも集計ではタブー。
ベタ塗りでパキッと比較しやすく、が鉄則です。

 

○円グラフと棒グラフの使い分け

 

また、グラフにも得手不得手があります。

一番ポピュラーな円グラフですが、項目が多いと分割の線が細かくたくさん入ってしまって、わかりづらくなることも。
そのため、項目が多い場合は「グラフ4」のような棒グラフにすると比較しやすくなります。

円グラフは、項目が少ない時に使いたいグラフ。

例えば、「はい」「いいえ」や、「男性」「女性」など多くても4~5項目くらいが限界で、それ以上になると、表示されているものの差が把握しづらくなります。

 

つまり、共通するポイントは「パッと見て比較できる正確さ」
それこそが、集計における“可視化”の真髄と言えるのです。

 

2. 気にしておきたい数値の話

 

2-1. 平均値、中央値、最頻値

 

ここからはちょっと数値の話をしましょう。

たくさんあるデータを1つの数字で表した値を「代表値」と言いますが、これには主に3種類あります。

 

○平均値
 各データの値の合計をデータの総数で割った値。

 

○中央値
 データを小さい順に並べた時に、ちょうど中央に位置する値。
 その値が2つある時は、2つの平均を取る。

 

○最頻値
 データの中で、最も頻繁に出現する値。

 

うーん、そう言われてもなんだかよくわからない…。
確かに!ということで、毎月のお小遣いを例に、その使い分け方をご説明しましょう。
ご自分のお小遣いと照らし合わせながら考えてみてください。

 

 

ちょっと役立つポイント~数値編~

 

○平均値

 


 

 

この表の右端45,167円、というのが平均値。
金額を全部足して、A~Fまでの人数6で割った数値です。

ですが、考えてみてください。

 

「月45,000円相当のお小遣い」。

 

なんだか夢のようですね!
毎日豪華なランチで豪遊も可能です。

 

実際、表のF以外の人は平均値45,167円を下回っています。
このからくりは、一番多いFの金額150,000円が、明らかに他と比較して飛び抜けているということ。

このように飛び抜けて大きな値、または小さな値のことを「外れ値」と言います。

外れ値がある場合に平均値を算出すると、その値に引っ張られておかしな結果になるのです。

このような場合に登場するのが、中央値です。

 

 

○中央値

 

 

中央値は、外れ値がある場合に、その影響を受けずに真ん中あたりの数値を表すことが可能です。

アンケートの場合、手書きで数字を記入してもらう場合もありますよね?
そんな時は要注意。

例えば、単位に「万円」とあるのに、「10,000」と記入されていたり(本当は「1」万円なのに、「10,000」万円、そう、10億円!)など、明らかに記入・入力ミスが発生しがちなのです。
その場合には、外れ値を無効回答として平均値を出すか、中央値を取るかなど、集計を行う人の判断が必要になります。

 

○最頻値

 

また、最も頻繁に登場する値である最頻値(この表の場合は18,000円)も、外れ値の影響を受けません。しかし、データの数が少ないと「2回しか出てこないのに最頻値になった」など、その信憑性が問われたり、複数の数値が最頻値になる場合もあるので注意が必要です。

 

 

3. 最後は人の判断力

 

いずれにしても、データをチャチャッと入力して表やグラフにすればいい、というものでもないのが集計業務。

 

そこには、元となったアンケートがどんなものか、どんなデータが必要かなどを加味しながら、その都度判断していく専門性も必要不可欠です。

 

そうして最適な可視化が行われ、その先の統計や分析に大いに役立つことこそ、集計の醍醐味。

集計を行う際に、ぜひ知っておきたいお役立ちポイントは、同時に、集計の奥深さや面白さに触れることでもあるのです。

 

いかがでしたか?
専任の集計スタッフがそろったデータセレクトなら、豊富な実績と専門性で、様々なご要望におこたえします。
ぜひ一度、ご相談ください。

 

アンケート調査集計のページはこちら

お問い合わせはこちらより

0120-300-155

back to list

CONTACT US
無料見積依頼・お問い合わせは
お気軽にどうぞ

お問い合わせ・無料見積

タップすると電話がかけられます 0120-300-155 [営業時間]9:00〜18:00 [定休日]土日祝


プライバシーマーク 国際規格「ISO27001」

COPYRIGHT c Data Select Corporation. ALL RIGHTS RESERVED.