基礎知識
適切なグラフの選択
※ 以下の説明を読む前に、前項(基本統計量)の内容を理解する。
グラフの作成に際しては、「どのような種類(パラメトリック?ノンパラメトリック?)や構造(1変量?2変量?)のデータ」を使って「何を示す(中心代表値間の差?2変量の関係?)」のか、あらかじめ整理して、最適なグラフの種類(棒グラフ?折線グラフ?散布図?など)を選ぶ必要がある。
以下に、「生理学」で多用される(教科書や参考書でなじみのある)4種類のグラフについて、その概要を示す。なお、Excelにおいては、メニューバーの「挿入−グラフ」を選択するか、「グラフウィザード」のアイコンをクリックすれば、グラフの作成が開始できる。
-
1. 棒グラフ
-
複数のパラメトリック変量間の相違を示す際に用いる。バーが平均値を、誤差線が標準偏差を表す(「基本統計量」の項で述べた通り、平均値と標準偏差はセットで図示する。「データ数」は図示できないため、図中や図の欄外に「n = 6」のように表示する)。
-
2. 折線グラフ
-
横軸の「量的な推移(増大など)」や「経時」に伴う、縦軸の値の変化を示す際に用いる。プロットが平均値を、誤差線が標準偏差を表す。
-
3. 箱ヒゲ図(ボックス・プロットと呼ばれる場合もある)
-
複数のノンパラメトリック変量間の相違を示す際に用いる。バーの下端が第1四分位数を、上端が第3四分位数を、バー内の横線が中央値を表す。最新のExcelでは箱ヒゲ図を描けるが、やや扱いは難しい。必要に応じてインターネット等の解説サイトを見ると良いが、そもそも本当に箱ヒゲ図を使うべきなのか(根拠を説明できるのか)、入念に検討する必要がある。
-
4. 散布図
-
2変量間の関係を示す際に用いる。2変量のデータ(例えば、ヒトの身長と体重がセットになったデータ)について、横軸に説明変数(身長)、縦軸に目的変数(体重)を取り、「横軸から垂直に伸ばした線」と「縦軸から水平に伸ばした線」の交点にプロットを打って得られる。
打たれたプロットの集合は2変量の関係を表し、その概観が
- 右上がりのとき、正の相関関係がある
- 左上がりのとき、負の相関関係がある
- 一様のとき、無相関である
と考えられる。また、ふくらみが小さい(より「線」に近い)とき、相関係数は±1.0に近い。