所以要進行一個試驗,去證實或者了解想要知道的結果。
這時候的你應該如何開始規劃你的實驗呢?
首先我們先來了解一些名詞,以便之後敘述的方便性。
1.變因(variable)?變級(level)?傻傻分不清楚。
很多人常會把變因跟變級搞混,舉個例子就很容易懂了。
這裡有很重要的一個概念,就是你要很清楚、明白的了解你的試驗目的,
設計完才知道能不能達成這樣的目的。
舉例說明:我們假設吃果糖容易變胖
狀況一:
試驗目的:我想要了解吃果糖是不是真的容易變胖
變因:是否有吃果糖
變級:果糖與對照組的糖類
狀況二:
試驗目的:我想要了解吃不同量的果糖變胖的程度是不是不一樣
變因:果糖攝取量
變級:0, 10, 20, 30克等。
狀況三:
試驗目的:我想了解吃不同的糖、不同量變胖的程度是否一致。
變因:糖類來源+攝取量
變級:各種糖類,不同攝取量
這樣因該很容易分辨變因跟變級了
2.逢機(隨機, random)
逢機簡單的說就是機會均等,例如說逢機分組,就是將物品分入每一組的機率相等。
另一個意義就是希望每組都是均質的。
3.常態分布(Normal distribution)
這就是大家熟悉的鐘型曲線
也就是常態分布曲線,他有他數學上的定義,事實上我也不是很熟。
一個正負標準偏差,佔總量約68%,正負兩個標準偏差約95%。
這未來會出現在ANOVA的分析上,我們要確認資料是呈常態分布,才能滿足分析的條件。
4.敘述性統計
包含平均值(mean)、標準偏差(standard deviation)、標準機差(standard error)、中數、眾數等
這些代表的意義,大家可以翻一下統計課本,STD跟SE的差異就是SE多除以n開根號。
但其意義不太相似,有興趣的人在進一步再去研究。
簡單的說STD是各觀測值跟平均值差異的平均,SE是各觀測值之間差異的平均。
另外在一些變方分析表(ANOVA table),會出現
SEM(standard error of mean) or MSE(Mean Square Error) 都是指所有變異的平均值。
不論是試驗造成的,個體造成的,一些無法控制的變異總和的平均。
理論上這值越小,表示你試驗所能控制得變異越多,也就是試驗設計是OK的。
5.變異係數(coefficient of variation)
其實他也算是敘述性統計,但因為他常被提起,所以分開講。
他的算法很簡單,也很容易懂,就標準偏差/平均值 X 100%。
他通常都拿來檢測你的標準偏差是否過大,也就是個體差異太大或有其他因素在影響觀測值。
下一篇,將講一些試驗設計的名詞解釋,包括區集、T-Test、變方分析(ANOVA)、複因子等
沒有留言:
張貼留言