2007年11月7日 星期三

多少數據才足夠

多少數據才足夠?
進行生物實驗時,由於生物體內或生物間的差異,許多時相關的代謝作用並不是很穩定的,因此,需要讀取多個數據,然後取其平均值計算。

但究竟需要多少數據呢?

基本的原則是: 偏差大的話,所需數據便愈多!

當然,理論上,數據肯定愈多愈好,但收集數據是花時間的,祇要有足夠的可信度,讀取太多數據是不值得的。

試看看以下 3 組數據:





























1 st 2nd3rd
A10119
B10155
C119--



雖然平均值一樣是 10,但你覺得哪一組數據的平均值可信度較大?

答案顯然是 A組吧。

其實 B 組的實驗設計的結果也未必不可信,不過相對於 A 組來說是較差吧。要提高 B 組平均值的可信度,你可以增加實驗的數據量,例如讀取 10 次,然後計算其平均值。

至於 C 組? 數據太少吧!

但假如時間不足夠的話,究竟我們又應該進行哪些實驗呢?
又試試看以下兩個實驗:

第一組










































1 st 2nd3rd
A10119
B5

87
C4

5--
D------


第二組




































1 st 2nd3rd
A1011--

B5
8--

C4
5--
D2

3

--


兩組實驗同樣祇有8個數據,你認為應該進行哪一個呢?

答案肯是第一組,於第一組中,起碼有6個數據是可用的; 但於第二組實驗中,由於所有情況皆沒足夠數據可供計算平均,因此所有數據皆未達可信程度,即是可算是沒有任何數據。

沒有留言: