星期一, 1月 19, 2009

【研究】3.01 試驗開始之前:名詞解釋(上)

當讀了無數的paper,與教授不知討論了多少次,終於孵出一個idea。
所以要進行一個試驗,去證實或者了解想要知道的結果。
這時候的你應該如何開始規劃你的實驗呢?
首先我們先來了解一些名詞,以便之後敘述的方便性。

1.變因(variable)?變級(level)?傻傻分不清楚。
   很多人常會把變因跟變級搞混,舉個例子就很容易懂了。
   這裡有很重要的一個概念,就是你要很清楚、明白的了解你的試驗目的,
   設計完才知道能不能達成這樣的目的。
   舉例說明:我們假設吃果糖容易變胖
   狀況一:
   試驗目的:我想要了解吃果糖是不是真的容易變胖
   變因:是否有吃果糖
   變級:果糖與對照組的糖類

   狀況二:
   試驗目的:我想要了解吃不同量的果糖變胖的程度是不是不一樣
   變因:果糖攝取量
   變級:0, 10, 20, 30克等。

   狀況三:
   試驗目的:我想了解吃不同的糖、不同量變胖的程度是否一致。
   變因:糖類來源+攝取量
   變級:各種糖類,不同攝取量
   這樣因該很容易分辨變因跟變級了

2.逢機(隨機, random)
   逢機簡單的說就是機會均等,例如說逢機分組,就是將物品分入每一組的機率相等。
   另一個意義就是希望每組都是均質的。

3.常態分布(Normal distribution)
    這就是大家熟悉的鐘型曲線
    
    也就是常態分布曲線,他有他數學上的定義,事實上我也不是很熟。
    一個正負標準偏差,佔總量約68%,正負兩個標準偏差約95%。
    這未來會出現在ANOVA的分析上,我們要確認資料是呈常態分布,才能滿足分析的條件。

4.敘述性統計
    包含平均值(mean)、標準偏差(standard deviation)、標準機差(standard error)、中數、眾數等
    這些代表的意義,大家可以翻一下統計課本,STD跟SE的差異就是SE多除以n開根號。
    但其意義不太相似,有興趣的人在進一步再去研究。
    簡單的說STD是各觀測值跟平均值差異的平均,SE是各觀測值之間差異的平均。
    另外在一些變方分析表(ANOVA table),會出現
    SEM(standard error of mean) or MSE(Mean Square Error) 都是指所有變異的平均值。
    不論是試驗造成的,個體造成的,一些無法控制的變異總和的平均。
    理論上這值越小,表示你試驗所能控制得變異越多,也就是試驗設計是OK的。 

5.變異係數(coefficient of variation)
    其實他也算是敘述性統計,但因為他常被提起,所以分開講。
    他的算法很簡單,也很容易懂,就標準偏差/平均值 X 100%。
    他通常都拿來檢測你的標準偏差是否過大,也就是個體差異太大或有其他因素在影響觀測值。
    
下一篇,將講一些試驗設計的名詞解釋,包括區集、T-Test、變方分析(ANOVA)、複因子等



沒有留言: