我已經看到隨機誤差定義為隨著測量次數達到無窮大而平均為0的誤差,並且該誤差同樣可能為正或負。這僅需要大約零的對稱概率分佈。但是,將這個問題輸入Google時,我沒有發現任何來源表明隨機錯誤可能不是高斯。為什麼隨機誤差必須是高斯的?
我已經看到隨機誤差定義為隨著測量次數達到無窮大而平均為0的誤差,並且該誤差同樣可能為正或負。這僅需要大約零的對稱概率分佈。但是,將這個問題輸入Google時,我沒有發現任何來源表明隨機錯誤可能不是高斯。為什麼隨機誤差必須是高斯的?
隨機誤差一定是高斯嗎?
錯誤通常是高斯的,但並非總是如此。 以下是一些物理系統,其中隨機波動(或“誤差”(如果您處在變化的事物構成誤差的情況下)不是高斯):
曝光在光檢測器中的兩次點擊之間的時間分佈是指數分佈。$ ^ {[a]} $
光電探測器在固定時間內的點擊次數是泊松分佈。
由於均勻分佈的角度誤差,光束在一定距離外照射目標的位置偏移是柯西分佈。
我已經看到隨機誤差定義為隨著測量次數達到無窮大而平均為0的誤差,並且該誤差同樣可能為正或負。這只需要大約零的對稱概率分佈。
有些分佈的正負權重相同,但不對稱。 例: $$ P(x)= \ left \ {\ begin {array} {ll} 1/2 & x = 1 \\ 1/4 & x = -1 \\ 1/4 & x = -2 \,。 \ end {array} \ right。$$
但是,在Google中輸入此問題時,我沒有找到任何來源表明隨機錯誤可能不是高斯。為什麼隨機誤差必須是高斯的?
不容易找到非高斯隨機誤差的引用這一事實並不意味著所有隨機誤差都是高斯:-)
如其他答案中所述,由於中心極限定理,自然界中的許多分佈都是高斯分佈。 中心極限定理說,給定根據函數$ X(x)$分佈的隨機變量$ x $,如果 if $ X(x)$具有有限的第二矩,則給定另一個隨機變量$ y $定義為$ x $的許多實例的平均值,即 $$ y \ equiv \ frac {1} {N} \ sum_ {i = 1} ^ N x_i \,,$$ 分佈$ Y(y)$是高斯分佈。
問題是,許多物理過程是較小過程的總和。 例如,電阻兩端的波動電壓是來自許多單個電子的電壓貢獻之和。 因此,當您測量電壓時,您將獲得基本的“靜態”值,以及由噪聲電子產生的一些隨機誤差,由於中心極限定理,該誤差是高斯分佈的。 換句話說,高斯分佈很常見,因為自然界中如此多的隨機事物來自許多小貢獻的總和。
但是,
在很多情況下,潛在錯誤機制的組成具有 not 有限的第二矩的分佈;柯西分佈是最常見的例子。
在很多情況下,錯誤根本不是許多小潛在貢獻的總和。
這兩種情況均會導致非高斯誤差。
$ [a] $:請參見另一篇Stack Exchange帖子。
原因可能是中心極限定理:當您添加許多獨立隨機變量時,它們的總和將形成正態分佈,而與它們各自的概率分佈無關。如果您沒有有關錯誤起因的信息,或者您有多個錯誤源,則可以使正態分佈成為一個很好的猜測。此外,正態分佈通常發生在現實世界的過程中。
這裡的回答者通常回答了一個不同的問題,即經驗變量是否應為高斯,但是21joanna12詢問了實驗誤差,這承認了完全不同的分析。我可以推薦的關於該問題的最佳資源是E T Jaynes撰寫的《概率論:科學的邏輯》第7章。簡而言之,錯誤是高斯的,這有充分的理由(儘管並非總是如此):
但是,短秒。7.12(我完整復制了該示例)提供了一些示例,這些示例我們預期不會出現高斯誤差:
一旦我們理解了高斯推理成功的原因,我們還可以看到非常罕見的特殊情況,其中不同的採樣分佈將更好地表達我們的知識狀態。例如,如果我們知道錯誤是由於某些小物體不可避免的旋轉而產生的,則當它成角度 $ \ theta $ span >,錯誤為 $ e = \ alpha \ cos \ theta $ span>,但實際角度未知,稍微分析表明,先驗概率分配 $ p(e | t)=(\ pi \ sqrt {\ alpha ^ 2-e ^ 2})^ {-1},\,e ^ 2< \ alpha ^ 2 $ span>,正確描述我們對錯誤的了解狀態。因此,應該使用它代替高斯分佈;由於它具有較高的上限,因此與高斯方法相比,它可能會產生更好的估計值-即使 $ \ alpha $ span>未知,因此必須從數據中進行估計(或可能是需要估計的參數。
或者,如果已知錯誤的形式為 $ e = \ alpha \ tan \ theta $ span>,但 $ \ theta $ span>未知,我們發現先驗概率為柯西分佈 $ p(e | I)= \ pi ^ {-1} \ alpha /(\ alpha ^ 2 + e ^ 2)$ span>。儘管這種情況很少見,但我們將發現它是一個具有指導意義的練習,可以對柯西採樣進行分析 分佈,因為可能發生質上不同的事情。正統裁判認為這是“病理性例外情況”,但貝葉斯分析並不困難,這使我們能夠理解。
請注意,這些示例使用與Sec相同的貝葉斯技術。 7.11。
許多物理現象的例子似乎受非高斯統計的支配。例如,在混合介質中光的多重散射中會產生Levy分佈,其中光子路徑長度遵循該分佈。
我認為,只要您遇到罕見但重要的事件,就會看到非高斯統計數據,例如黑子的分佈,兩次地磁反轉之間的時間等。高斯很好,因為它可以使分析相對容易計算(除了已經給出的原因)。在動力學系統中,對於非混沌系統,能量的能級間隔(通常)由泊松統計決定,而對於混沌系統,則由Wigner型統計決定。
徵費飛行的整個領域是巨大的。特別是在激光冷卻中。這本書很棒: Lévy統計和激光冷卻:罕見事件如何使原子靜止
各種答案出現在這裡;我會添加一些還沒有的東西。
首先,為了使隨機誤差的期望值為$ 0 $,並且可能是正值或負值, b>不必使它們的分佈對稱於$0。$很容易找到很多反例。
現在假設 $$ Y_i = \ alpha_0 + \ alpha_1 x_ {1,i} + \ cdots + \ alpha_p x_ {p,i} + \ varepsilon_i \ text {for} i = 1,\ ldots,n。 $$ 我們假設
錯誤$ \ varepsilon_i $是隨機的;術語$ \ alpha_0 + \ alpha_1 x_ {1,i} + \ cdots + \ alpha_p x_ {p,i} $不是。實際上,“隨機”是指每次您獲取新樣本$(Y_1,\ ldots,Y_n)$時,$ n $錯誤都會發生變化,而與先前$ n $觀測值的樣本無關。但是$ i = 1,\ ldots,n $的$ n \ times p $數字$ x_ {1,i},\ ldots,x_ {p,i} $不變;因此不是隨機的。
每個錯誤的期望值為$ 0。$
有些事情我們不 b>假設:
請注意,最小二乘估計值\\ alpha_k $的$ \ widehat \ alpha_k $是線性組合$$ c_1 Y_1 + \ cdots + c_n Y_n,\ tag 1 $$其中係數$ c_1,\ ldots,c_n $取決於$ n \ timesp $數字$ x_ {1,i},\ ldots,x_ {p,i} $為$ i = 1,\ ldots,n。$
在這些假設下,我們可以證明,在所有線性組合$(1)$中,它們是$ \ alpha_k的無偏估計量,$估計均方誤差最小的那個是產生最小二乘估計的那個
那是高斯-馬爾可夫定理。
因此,我們不需要高斯分佈即可得出結論。
量化誤差是均勻分佈的隨機誤差的常見實際示例。
例如,您有一個電子秤,可讀出到最接近的0.1克。您在其中放入2.5376克粉末,其讀數為“ 2.5”。然後,您放入3.6264克粉末,其讀數為“ 3.6”。等等。您的讀數存在錯誤,在這種情況下,每次都是-0.05到+0.05之間的均勻分佈的隨機數。當然,從字面上看,它不是隨機的-它是輸入的確定性函數-但在許多情況下,可以將其視為隨機的。
(當然,與往常一樣,當您平均許多量化誤差時,它會通過中心極限定理接近高斯。)