【エクセル;リテラシーレベル】

(1)『エクセルを使いこなそう』タブをみて、一通り操作をしてみて、これは使いやすい、と感じるものを覚えて、今後、積極的に使いましょう。(※ ちなみに、前操作『Ctrl+Y』はお勧めです。)

(2) 一度は、エクセルの算術演算子を使って式を入力してみると、計算方法を理解したうえで、統計ソフトを使えたりするようになると思います。実は、大学院(修士課程)に在籍していたころ、検定をエクセルのみ(アドインやエクセル関数を使わない条件)で行う授業がありました。正直なところ、大変でした。。。ただ、その経験があったからこそ、数式の統計学的意味が理解できるようになったと思います。これは、今の時代もやるべきだと考えています。ボタンを押せば答えが出る、という一見すると便利でしかない統計ソフトも多いと思いますが、原理を理解せずに使用するのであれば、それはブラックボックスのような道具でしかなく、学術的な進展は期待しにくいかもしれません。なお、カイ二乗検定で、2行×2列のクロス集計表(分割表)から独立性を検定することが可能です。ただ、2×2のクロス集計表に期待度数が5以下になるセルがある場合は、カイ二乗検定ではなく、フィッシャーの直接確率検定を推奨します。というのも、カイ二乗検定は近似した方法のため、ある程度データ数が多い場合にP値を出すものだからです。                                                               

(3) VLOOKUP等を駆使して、一度、作成しておくと『座席表』『三者面談の予定表』『クラス内の電話帳』等、必要に応じてアレンジできます。具体例はTeamsに載せておきます。興味のある人は積極的に学習してみましょう。

(4) PEASON等を駆使して、計算してみましょう。合計、平均以外にも使えそうな関数があることを確認しましょう。

(5) COUNTIF等を駆使して、分かりやすい表を作ってみましょう。

【行列の覚え方】図は、駿台予備校に通っていたころ、数学の先生が教えてくれた『行列の覚え方』。迷うことがないので、こういう覚え方も便利ですね。あと、別件で、駿台と言えば、化学の石川先生。『新理系の化学』を買うように勧めた直後、「もし買った後に後悔したら必ずお金は返すことを約束する。仮に、全員が言ったとしても、その程度のお金はいつでも持っている。」と言い切っていた(ほぼ女子全員が「かっこいい~。」みたいなことを言っていた)。物理の山本先生も、「『物理入門』には魂を込めている」みたいなことを言っていました。英語の表先生も同様です。「私は、ほくろの位置が左だ。」とか言っていました(分かる人には分かる)。こうした先生方からは、今でも色あせない情熱を感じています。ありがとうございます。この3人の先生は学生運動の話をよくされていました。本当に凄い時代にイニシアチブを発揮されながら、生き抜いてきたんだと思いました。そう考えると、受験勉強で感じる悩みの数々は、本当にちっぽけなもの、と浪人時代に真剣に思っていました。それはそうと、あの当時の駿台受験叢書は、間違いなく名作揃い。まさに不朽の名作。例えば、『必修物理』は今では伝説の参考書。また、一見すると単なる公式集『数学コメンタール』も入試問題を解きながら使えば、もの凄く理解が促進される驚きの参考書。「新理系の化学」「物理入門」「必修物理」等、今でも大切に使っています。。。

【エクセル;アドバンスレベル】

(1) マクロで『出欠状況一覧表』を作成してみましょう。具体例はTeamsに載せておきます。興味のある人は積極的に学習してみましょう。

【平均値ほか】

(1) 何度も使ったことがあり、既に知り尽くしていたと思っていた『平均値』についてですが『誤差を最小にする真の値』という説明ができたでしょうか。

(2) 年齢の幅が広く、若者とお年寄りしか利用者がおらず、真ん中の年齢の人数が誰もいないのでその平均年齢では児童公園の利用者という説明が出来ない。データやグラフに惑わされてはいけないと言ういい例だと思います。今回は、中央値などを用いて、本当の事実を説明することが大切です。

【参考文献】羽山博(2007),マンガで学べる!統計解析,ナツメ社,1-23.

(3) 問(1)に示したように普段使用しているはずの用語の本質を理解していないことはたくさんあると思います。例えば、『偏差値』も何気なく使うと思いますが、この機会に、頑張って説明してみましょう。分散は、各ケースの偏差を一辺とする正方形の面積で、それが、全ケースの正方形の面積の平均と同じという計算をしています。こう解釈すれば、標準偏差は、正方形の一片です。しかも、標準偏差(σ)は平均値から、±σの範囲に68%のケースが含まれる(シグマの法則)があるので、標準偏差の値が小さいというのは、平均値に偏っていることを意味します。この特徴を生かしたのが、偏差値です。

【アンケート

(1) 標本の大きさの統計学的な最低基準は存在していません。ただ、絶対的ではないが、400とみる見方もあります。このことを証明してみましょう。ただ、言うまでもなく、400あれば、それで全て解決と思ってはいけません。

例)A新聞購読者400人で日本全体の意見はわかりません。

例)A新聞購読者400人へのアンケート調査より、A新聞、Y新聞、M新聞購読者100人づつ(合計300人)の方のデータの方が偏りが少ないかもしれません。

例)例えば「〇〇政権を支持しますか。」というだけの問いの場合、その経緯、理由等の背後にあるものは、人それぞれの状況としか言いようがないですね。

【統計ソフトR】

(1)  データを>x<-c()でまとめて、mean(x)、median(x)、max(x)-min(x)、sd(x)で求める。別解;”psych”パッケージのdescriveBy(x)。

(2) descriveBy()を使うと、歪度、尖度、がtype=3で計算されるので注意が必要。エクセル、SAS、SPSSではtype=2。これを確かめるのは、”e1071”パッケージのskewness(x,type=3)、kurtosis(x,type=3)とすることで確認できる。

(3) summary()を使おう。四分位範囲は、IQR()。別解;5数要約>fivenum()、第1四分位数>quantile(,0.25)、第3四分位数>quantile(,0.75)でも良い。

(4) ヒストグラムは>hist()。幹葉図は>stem()。。。(STEM?幹葉図は外れ値の発見の際に便利)。箱ひげ図は>boxplot()。