網站首頁 個人範例 行業範例 行政範例 職場範例 校園範例 書信範例 生活範例 節日文化範例
當前位置:文學範文吧 > 行業範例 > 教師

“數據分析觀念”的內涵及教學建議

欄目: 教師 / 發佈於: / 人氣:2.71W

“數據分析觀念”的內涵及教學建議數學教育熱點問題系列訪談錄

“數據分析觀念”的內涵及教學建議

摘要:統計是數據分析的科學和藝術,統計課程的核心是發展學生的數據分析觀念。準確把握數據分析觀念的內涵是進行統計課程設計、教科書編寫和教學實施的必要前提和重要基礎。體會數據中藴涵着信息、認識到需要根據問題的背景選擇合適的方法、通過數據分析體驗隨機性是數據分析觀念的重要方面。義務教育階段統計教學關鍵是使學生想到用數據,願意“親近”數據,能從數據中提取信息。

關鍵詞:數據分析觀念;教學建議

我國在基礎教育階段將統計作為重要的學習內容,隨着大家對統計教學的不斷探索和實踐,人們逐漸認識到對於統計學習而言,重要的不是畫統計圖、求平均數等技能的學習,而是發展學生的數據分析觀念。那麼,數據分析觀念到底體現在哪些方面呢?如何設計課程和實施教學,才能更好地發展學生的數據分析觀念呢?本文訪談了東北師範大學著名統計學家史寧中教授,並輔助於資料查詢等形式就這些問題提出了一些思考。

一、發展學生的數據分析觀念

問:您在多種場合不斷強調,無論哪一部分內容的學習,都應該抓住這部分的核心內容,那麼統計學習的核心內容是什麼呢?

▲史教授:首先必須明確的是,我們希望在課程中給出一些關鍵詞。關鍵詞是某部分學習的核心內容。核心內容不是指具體的知識點,甚至不是指具體的知識本身,而是概括很多知識的共性所反映出來的思想和思維方式,這個就叫做核心詞,或者叫做核心內容。統計最核心的就是數據分析,統計是處理數據的一門科學和藝術。在這部分內容中,我們提出了數據分析觀念的核心詞,就跟代數學習裏的數感、符號意識、模型等都是核心內容。

▲問:統計的核心是數據分析,那麼到底是什麼是數據呢,數據與數有什麼關係呢?

▲史教授:我們在義務教育階段處理的數據主要是用數來表達的,當然這些數都是有實際背景的。脱離實際問題的單純地數的研究是數與代數的內容,不是統計的內容。但是,這些年隨着信息的迅速增長,我們需要擴大對數據的認識。事實上,現在的數據不僅僅是數,圖是數據、語句也是數據。比如,人們在網上經常用GOOGLE來進行檢索,GOOGLE是用統計的方法來進行語句檢索,此時統計處理的是語句,我們把這些都叫做數據。

▲問:能不能這樣理解,只要藴含着一定信息,無論是什麼表現形式,就是數據,統計能幫助人們從這些數據中提取出大量的信息?

▲史教授:是這樣的。人們在實際生活和各行各業中面臨的數據越來越多,必須樹立利用數據的意識,掌握一些分析數據的方法和模型。所以,數據分析觀念是非常重要的。數據分析觀念主要體現在三個方面:第一,瞭解在現實生活中有許多問題應當先做調查研究,收集數據,通過分析做出判斷,體會數據中是藴涵着信息的。第二,瞭解對於同樣的數據可以有多種分析的方法,需要根據問題的背景選擇合適的方法。第三,通過數據分析體驗隨機性。

二、數據隨機性的內涵和教學

(一)數學隨機性的內涵

問:對於很多人而言,對第三點“通過數據分析體驗隨機性”都比較陌生。首先遇到的一個困難是,數據隨機性的涵義是什麼呢?

▲史教授:簡單而言,數據的隨機主要有兩層涵義:一方面對於同樣的事情每次收集到的數據可能會是不同的;另一方面只要有足夠的數據就可能從中發現規律。舉一個例子,袋中裝有若干個紅球和白球,一方面,每次摸出的球的顏色可能是不一樣的,事先無法確定;另一方面,有放回重複摸多次(摸完後將球放回袋中,搖晃均勻後再摸),從摸到的球的顏色的數據中就能發現一些規律,比如紅球多還是白球多、紅球和白球的比例等。

問:那麼,構成數據隨機性的原因主要有哪些呢?

▲史教授:一般來説,產生隨機有兩方面的原因。

一方面,是運用部分來推斷總體,我們知道這是統計的一個基本思想。這裏首先假設每一次實驗取得的數據是來源於一個總體的,這是很重要的一個假設。比如上面提到的摸球例子,第一需要假設摸的是同一個袋子裏的球,而且是有放回的摸;第二,摸之前需要晃一晃,搖晃均勻了。為什麼要強調這些呢,就是要保證每一次要處理的事情都是一樣的,數據是來源於一個總體的。有了這個假設後就去做重複實驗,每一次在摸之前,你不可能知道這次摸的是什麼結果,但是摸的次數多了,就能估計出來摸到各種結果的可能性是多大,由此推斷總體的情況。比如在上面的例子中,可以推斷袋子中什麼顏色的球多,各種顏色球的比例,如果知道了袋中球的總數,我們還可以推斷出各種球的數量。但是,由於是用部分來推斷總體,就不能擔保推斷一定是準確無誤的,而是允許結論可能出錯。好的統計方法的主要標誌就是出錯的可能性較小。

另一方面,是重複測量中的誤差。對一些數據,特別是連續型數據總是有測量誤差的,而產生誤差的原因是多方面的。比如多次測量同一人的身高,由於測量工具、觀察者的角度、測量時間等各種各樣的原因,每次測量的結果可能都是不一樣的,測量數據是隨機的。但是如果出現隨機誤差的平均是零,也就是有時候比真實結果大一點,有時候比真實結果小一點,平均下來零,這個時候就能研究了,如何進行研究這裏就不細談了。主要是以上兩方面原因構成了我們研究問題的隨機性。

(二)數據隨機性的教學

問:説到這裏,我感覺您非常強調運用統計(數據分析)來幫助學生體會隨機。不少老師有這樣的一個困惑,概率也是研究隨機現象的,在概率中教師也組織學生做了很多摸球、擲硬幣等遊戲。那麼為什麼又提出數據的隨機性呢?

▲史教授:我聽了一些課,老師們經常這樣處理:比如對於擲一枚均勻的.硬幣,先得到出現正面或反面的概率是二分之一,然後讓學生通過反覆擲硬幣去驗證這個結果(二分之一)。這裏有兩個問題。第一,一個硬幣,先假定它出現正面和反面的可能性是二分之一,這是數學(或者稱為概率)。這個二分之一是通過概率的定義得到的,不是依靠擲硬幣驗證出來的。實際上,學生做了很多次實驗也得不到二分之一,反而更加糊塗了。第二,運用定義的方式教學隨機,不能很好的培養學生的隨機觀念。

需要指出的是,我們贊成做實驗,贊成運用統計的思想來做實驗。統計是通過數據來獲取一些信息,來幫助人們做出一些判斷。同樣是擲硬幣的問題,在統計上就會這樣設計實驗:先讓學生多次擲硬幣,計算出現正面的比例(頻率),然後用頻率來估計一下出現正面的可能性是多大。如果這個可能性接近二分之一的話,就推斷這個硬幣大概是均勻的,這是統計的思想。

對於先給出定義,教師往往比較習慣,而對於“逆過來”通過數據來進行推斷,教師往往比較陌生。為了幫助大家理解,再闡述一下上面的摸球的例子。同樣是一個袋子裏有5個球,4個白球、1個紅球,如果讓學生通過摸來驗證出現白球的可能性是五分之四、出現紅球的可能性是五分之一,這不是統計。統計是這樣的,告訴學生們袋子裏有很多球,有白顏色的和紅顏色的。讓孩子們去摸,摸到一定程度的時候,學生髮現摸出白球的次數比紅球的次數多,由此推斷袋子裏白球可能比紅球多。進一步的話,能推斷出白球和紅球的比例大概是多少。再告訴球的總數的時候,能夠估計出來幾個白球和幾個紅球,這個是統計的過程。

我並不是反對前一種教法本身,而是説如果這麼教,藴含的隨機思想並不強,學生也不感興趣,都知道了概率為什麼還要做實驗。而後來的這種教法,學生體會到每一次摸的結果事先都不知道,但是摸多了能夠幫助我們做一些判斷。這樣一來,學生既體會了隨機,又感受到了數據中藴含着信息,我想這種類似於“猜謎”的活動學生也會很有興趣。

問:實際上,並不是簡單地贊成或反對做實驗,而是做實驗的目的。不是通過實驗去驗證概率是多少,而是通過實驗從數據中獲取信息,對總體做一些推斷。説到做推斷,老師們還有一個困惑,因為數據是隨機的,用部分的數據進行估計有時可能會估計得準一些,有時會偏差很大。那麼這種推斷是不是有點“瞎猜”的味道,能不能保證這種估計是合理的。

▲史教授:這裏絕不是“瞎猜”。還是上面摸球的例子(袋子裏有5個球,4個白球,1個紅球),我們知道如果真是隨機摸球的話,那麼出現白球的概率是五分之四。而實驗中,要使摸球的頻率剛好是 五分之四(十分之八)的可能性並不大。但是如果取一個範圍,比如在十分之七和十分之九之間,此時頻率落在這個範圍內,用它去進行估計是可以接受的。如果要使摸出白球的頻率落在這個範圍之間的可能性達到80%的話,通過計算只要做27次左右的實驗;如果要使95%的可能性落在這個範圍內的話,摸球的次數要增加,大概是60次左右。所以,實際上有相當多的科學依據在後邊支撐着我們做類似摸球的試驗。也就是雖然不能保證估計得完全一致,但能保證在一定實驗次數下,估計值與實際情況相差不大的可能性是很大的。

問:聽了您的解釋挺有啟發的。是不是雖然不能達到100%的精確,但無論實際情況需要多高的精確度,都可以計算出需要做多少次實驗來保證達到這個精確度?

▲史教授:是這樣的。因此,我們可以提供一些數據,如果想達到95%的可能性,你至少要摸多少次球。再比如社會上通過打電話做民意調查,不可能給所有擁有電話的人都打,如果調查允許在一定的誤差範圍內,通過計算可以提供至少需要打電話的數量。當然計算中需要概率的知識,從這些例子中我們也能看到統計與概率的聯繫。

問:通過上面的兩種教法和您的分析,我們可以感覺到概率是定義出來的,它的推理方式是主要是演繹;而統計是用數據來進行推斷,它的推理方式主要是歸納。兩種思維方式是不一樣的。

▲史教授:是這樣的。統計體現了與傳統數學不一樣的思路,而這種思路是培養學生歸納能力的最好方法之一。在義務教育階段,也有一些素材可以讓學生經歷歸納的過程,比如歸納一些公式和規律,但這些公式和規律往往都是準備好了的。很難找到讓學生真正通過歸納自己得到結論的素材,但是通過統計可以讓學生做一些,所以説,運用