樣本數的設定,固然要考慮一般抽樣原則,但也必需兼顧TEPS的主要目標:除了提供敘述性的統計數據外,更能做進一步的因果機制的分析,以回答基礎研究與政策的問題。因果分析愈深入,通常需要的樣本數就愈高,甚至高出一般描述性統計樣本的數十倍,仍不一定有足夠的統計變異量,去做精確的推論。
總樣本數 --- 做為一個公用的多目的調查,我們可以想到許多重要的研究主題,會需要3,000個以上的樣本數。使用國外panel教育調查資料,而在一流社會學、經濟學期刊中發表的論文,大部份分析都使用一萬到兩萬名學生。國際上有關學校的重要學術研究,都有上千的學校數。就以美國國會於1964年立法要求執行的教育調查研究計畫為例,調查對象就包括了將近4,000所學校,僅是高中學生的樣本數就將近25萬人,其研究報告的The Coleman Report就改寫了美國近代的教育研究的歷史。相對而言,我們的資料庫所牽涉到的學生總數不算特別多。
學校數 ---- 就以美國教育部1988年的中學生長期追蹤調查(NELS:88)而言,其資料就包括約1,000所學校及兩萬多名的8年級學生。我們只抽到539所學校,其中必須兼顧各級學校(國中、高中/職和五專)、各類學程、公私立、以及城鄉之差異,所以從統計分析的角度來看,這個數目已經不甚理想,若要進行學校層次,較為細緻的分析,可能會捉襟見肘。其中對學生樣本數的考量,是因為深入的因果分析對大樣本之需求,而不是因為美國人口眾多。
班級數 ---- 台灣的中學與美國的不一樣,每個年級都有固定的班級,而不是隨著科目而重組,因此,原則上研究者可以區分班級和學校對學生學習的效應。但因為在每所學校必須盡量多抽一些班級,才能達到有效區分的目的,所以在經費的限制下,我們每個年級約抽了1,000至1,200班(每所學校平均約四班)。其實這個班級數也只和NELS的學校數差不多,如果要與學校的效應區分的話,這樣的班級數顯然不算多。
每班的抽樣人數 ----由於TEPS採用三個類屬層次(nested groups)的設計,所以必須要有足夠的學校數、班級數和學生數,才能應付未來使用者對多層次因果機制分析的需求。每一個層次在進行多變項因果分析時的統計精確性,是本計畫樣本設計之關鍵所在。為了確保一定程度的統計穩定性,再加上流失率的考量,第一波調查至少每班15人。