教育データサイエンス

教育データサイエンスとは、何か。少なくとも「未来予測」「意思決定」の2つの要素があると考えています。実際に、身の回りには、「内閣支持率」「視聴率」「評価損益(つみたてNISA)」など多くの統計があります。こうした統計データを集め、その意味を一目でわかるように示すこと、即ち、一部のデータから全体像を予測することに価値があります。STEM教育では「道具としての数学」でしたが、教育データサイエンスでは、問題解決をするための「道具としての統計学」です。まずは、これを身に付け、より良い意思決定をしていくことが重要です。

 【参考文献】2022.2.15 国研令和3年度教育研究公開シンポジウム 招待講演「教育データサイエンスの可能性とその教育」 Sanne Smith氏 Program Director at Stanford University

※ 調査によってデータを集めると、僅かなデータから全体像を予測することができます。これは『スプーン一杯の僅かな量から料理全体の味を予測する(所謂、味見)』に似ています。


道具としての統計学(記述統計学 & 推測統計学)

Statistics『統計学』 ☜ State『国家』 ☜ 人口、国力等を正確に測るという意味があります。【参考文献】石崎克也、渡辺美智子(2018)、身近な統計、放送大学教材.

 

1 情報収集(PPDACサイクルを事例として)

意志決定の最適化プロセスとしての PPDAC サイクル】本格的な分析は、目的に応じたデータ収集です。特に、PPDACサイクル(ニュージーランドの教育で, 戦後日本の品質管理の分野で使われていた PDCA サ イ ク ル を 応 用 し たPPDAC “Problem, Plan, Data, Analysis and Conclusion” という問題解決プロセス)が参考になります。統計と聞くと、既にデータがあって、そのデータを分析する、と考えがちですが、本来はデータ収集からデータの解釈のプロセス全体を見通す必要があります。そのプロセスの一つにPPDACサイクルがあるのです。ナイチンゲールは、PPDACサイクルにような統計的マネジメントを実践していたことでも有名です。【参考文献】日本統計学会(2012),日本統計学会公 式認定統計検定 3 級対応データの分析,東京図書, 148-151.

ナイチンゲールが『クリミアの天使』と呼ばれた理由が分かりました。。。そもそも発想が、すごいです。とはいえ、発想といっても、単にアイディアのことだけでなく、その時代背景も考慮すると、もっと深い意味があると思います。

【統計的調査】データを集計し、統計量を示すことが目的のようになるのは本末転倒です。そのために、学校教育におけるデータサイエンスでは、所謂、古典的統計学に偏る内容で構成しておらず、古典的統計学と、古典的情報学を学びながら、学校教育現場で何ができるかを考えています。統計の分析は、あくまでもデータの記述です。先行研究を調査したうえで、自分自身で調査結果を読み、解釈し、考察する、ことができることが必要です。

 

2 データの種類

質的 名義尺度 区別のみ

質的 順序尺度 区別と順序

量的 間隔尺度 差のみ意味がある

量的 比率尺度 差も比も意味がある

 

3 統計分析

統計学の手法を用いて現象を分析し、データから有益な情報を得ようとする営みを統計分析”Statistical analysis”と言います。統計学には大きくは記述統計”Descriptive statistics”と推測統計”Inferential statistics”があります。

3ー1 データの記述(記述統計学):集団に属する全てのデータを収集し、その集団の特徴を記述し、考える。

手もとにあるデータを何らかの数値に要約したり、グラフを用いたりしてデータの概要を把握する。Rなら、”Psych”サイコロジーパッケージのdescribeBy関数で、瞬時に計算できる。

3-2 データに基づく推測(推測統計学):集団から一部のデータを収集し、その集団の特徴を推測し、考える。

手もとのデータの結果を統計的に一般化するために、データの性質を推測(例えば、検定、相関)する。(⇨演習問題 アンケート(1))