題:
您如何證明$ S =-\ sum p \ ln p $?
Gerenuk
2011-09-07 23:14:48 UTC
view on stackexchange narkive permalink

如何證明熵的公式$ S =-\ sum p \ ln p $?顯然,微觀層面上的系統完全由微觀運動方程式確定。因此,如果要在此基礎上引入一條定律,則必須證明一致性,即熵不能作為假設。我可以想像它是從一般系統的概率論中得出的。您知道這樣的行嗎?

一旦有了這樣的推理,對它的假設是什麼?這些假設對特殊系統是否無效?這些系統會不會服從熱力學,統計力學並且不會具有任何溫度,無論其通用性如何?

如果是熱力學/stat.mech。完全籠統,您如何將它們應用在一個點粒子繞另一點旋轉的系統上?

您可能需要研究信息理論。這就是香農熵。有趣的是,對於漢密爾頓系統,這是一個恆定的運動!您有一個非常有趣的問題,但是答案可以填滿書本。
香農熵是存在的,但為何仍將其用於物理學尚無定論。香農熵可能有一些預設。那麼物理學為什麼能滿足這些前提呢?
您如何定義$ S $?
我想答案的正確輪廓是從經典熱力學開始,進入卡諾/可逆熱機,找到熵作為狀態函數,然後再深入研究靜態機械對其進行微觀解釋...似乎是一項艱鉅的工作...
常見的卡諾論據無濟於事。一般而言,應該如何將其與所有微觀過程聯繫起來的問題仍然像以前一樣開放。之前一定有人嘗試過嗎?我知道普通文獻,但它不存在:(; S是人們用來顯示不可逆性的任何東西。
粒子的統計物理學,Mehran Kardar,第2章,第7節,第50頁,信息,熵和估計
四 答案:
Ron Maimon
2011-09-08 11:59:51 UTC
view on stackexchange narkive permalink

該定理被稱為無噪編碼定理,它經常在信息理論書中以笨拙的方式得到證明。定理的要點是計算每個變量的最小位數,您需要對從$ 1 ... K $中選擇的N個相同隨機變量的值進行編碼,這些變量的值$ i $在$ 1 $和$ K $之間是$ p_i $。在N大限制內,每個變量平均需要的最小位數被定義為隨機變量中的信息。這是您需要在計算機中記錄的每個變量的最小信息位數,以便以完美的保真度記住N個副本的值。

如果變量是均勻分佈的,那麼答案很明顯:對於N次擲有$ K ^ N $個可能性,對於$ CN $個比特有$ 2 ^ {CN} $個可能性,因此對於大N來說$ C = \ log_2(k)$。少於CN個比特,您將無法對隨機變量的值進行編碼,因為它們的可能性均相同。除此之外,您將擁有更多空間。這是統一隨機變量中的信息。

對於一般分佈,您只需一點點大數定律即可得到答案。如果您有許多隨機變量的副本,則概率之和等於1,

$$ P(n_1,n_2,...,n_k)= \ prod_ {j = 1} ^ N p_ {n_j} $$

對於大的N,此概率由類型i的值數等於$ Np_i $的那些配置所控制,因為這是類型i的平均數。因此,任何典型配置上的P值都是:

$$ P(n_1,...,n_k)= \ prod_ {i = 1} ^ k p_i ^ {Np_i} = e ^ {N \ sum p_i \ log(p_i)} $$

因此對於概率不是非常小的那些可能性,概率或多或少是恆定的並且等於上述值。這些並非不可能的可能性的總數M(N)是使概率之和等於1所需要的。

$$ M(N)\ prope e ^ {-N \ sum p_i \ log(p_i)} $$

要對每N個簽中實現M(N)個可能性中的哪個進行編碼,因此您需要一些足以對所有這些可能性進行編碼的B(N)位:

$$ 2 ^ {B(N)} \ propto e ^ {-N \ sum p_i \ log(p_i)} $$

這意味著

$$ {B(N)\ over N} =-\ sum p_i \ log_2(p_i)$$

所有次導常數都被較大的N限制所淘汰。這就是信息,上面的漸近等式是Shannon無噪聲編碼定理。要使其嚴謹,您需要對大量估計值進行一些仔細的限制。考慮一下您選擇隨機變量的兩個值併兩次獲得相同值的可能性:

$$ P_2 = \ sum p_i ^ 2 $$

這顯然是一個估計要選擇多少個不同的值。如果您問以k為單位獲得相同值k次的概率是什麼,則為

$$ P_k = \ sum p_i p_i ^ {k-1} $$

如果您問$ k = 1 + \ epsilon $投擲後重合的概率是多少,您將獲得香農熵。

信息中的熵

要從Shannon信息中恢復統計機制,您可以得到:

信息的熵

p>

  • 宏觀守恆量(或其熱力學共軛物),能量,動量,角動量,電荷和粒子數的值
  • 宏觀約束(或其熱動力共軛物)

然後,微觀結構的統計分佈是相空間上的最大熵分佈(盡可能少的信息為您所知),滿足以下約束:數量與宏觀數量相匹配。

最後一部分是關於均衡狀態。顯然,這很高興,因為有很多文獻將信息理論用於非均衡統計。機甲。過去,我對後者的工作方式非常困惑,因為它似乎想一無所獲-真正的非平衡狀態可能無限複雜。我最終意識到(通過Jaynes),一個人可以用“可重現”代替平衡條件,而實際上無論如何總會意味著後者。 (續)
(續)這會推送統計信息。具有更多由推理驅動的功能,這可能與OP的問題更好地吻合。關鍵是我們進行實驗,發現某些實驗控制足以實現某些結果---邏輯上它們之間有足夠的關係來指定宏觀行為,這只是邏輯。如果我們隨後知道微觀行為,則可以玩這種最大熵的遊戲,並得出實驗的統計力學。
@genneth:如果我認為有一個可以使用此描述的示例,我會這樣做。你知道什麼系統嗎?我知道的唯一最大熵分佈是在平衡stat-mech中。在其他任何地方,這都只是一個可怕的零位近似。
http://bayes.wustl.edu/etj/articles/stand.on.entropy.pdf很長,但是相當不錯。最後,它有很長的一段將Kubo運輸關係概括為高階術語,這可能是我見過的最整潔的一次。一個比較平淡的玩具示例是進動自旋-假設您觀察了一段時間的橫向自旋,則可以構造具有該運動的非平衡密度矩陣。例如,即使接近平衡,也很難通過給定電流正確地構建狀態。
這很有趣!但是,它錯過了一個問題:(它沒有回答為什麼我應該對已經完全由其他定律確定的系統應用熵。為什麼我要假設系統是最大熵分佈?必須證明這一點。也不應該是一個容易動搖的論點,我的問題的第二和第三段也被忽略了,許多人聲稱,一切都遵循熵(黑洞,生命……),好,所以我有一個粒子盤旋另一個,p_i是什麼?
@Gerenuk:您對此的直覺是錯誤的,因為您已經習慣了可以看到粒子的情況,因此知道粒子在哪里以及始終在多快的速度。如果您不知道粒子在哪裡,則存在與粒子關聯的熵,並且p_i是一個p(x,v),可以在任何位置和速度下找到它。黑洞熵的定律是不同的,生命與熵無關(但並不違反熵)。
-1
-1
@Gerenuk:我知道您在哪裡錯了,答案非常簡單並且眾所周知。 Jaynes參考文獻中已對它進行了完全處理,對此我無能為力了。我上面提到的是在很多地方都沒有出現的東西,即無噪聲編碼的簡單說明,因為這證明了$ p \ log(p)$是合理的。其他所有內容都是哲學,Jaynes很好地解釋了這一點(在上面的鏈接中)。
我發現這種解釋非常清楚。如果您不在大學裡任教,這個世界是錯誤的。
-1
...我不會成為精英的一部分,因為我不相信精英。只有當他們同意付給我不到4萬美元並且不給我任何身份或認可時,我才會擔任大學教職。這不可能發生,因為這是大學教授權力的稀釋,他們在這個社會中非常努力地進入上流社會。這是_為什麼_他們不稱職。您不能同時做科學和上流社會。它們是不兼容的活動。
Nathaniel
2012-01-19 22:55:01 UTC
view on stackexchange narkive permalink

從基本假設中得出$ \ sum p \ log p $公式的最佳(IMHO)推導方法是Shannon最初給出的公式:

Shannon(1948)一種通信數學理論。貝爾系統技術雜誌。 http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6773024

但是,香農並不關心物理學,而是關心電報,因此他的論證出現在信息傳遞的背景,而不是統計機制。要了解香農的作品與物理學的相關性,最好的參考文獻是埃德溫·傑恩斯(Edwin Jaynes)的論文。他寫了幾十篇關於這個問題的論文。我最喜歡的是公認的相當長的

Jaynes,E.T.,1979年,“我們站在最大熵的什麼位置?”在“最大熵形式主義”一書中,R。D. Levine和M. Tribus(編輯),M。I. T. Press,劍橋,麻薩諸塞州,第2頁。 15; http://bayes.wustl.edu/etj/articles/stand.on.entropy.pdf

Felix
2011-10-30 02:19:02 UTC
view on stackexchange narkive permalink

如果需要熵是廣義的,並且取決於微觀狀態概率$ p $,則可以理解熵$ S =-\ sum p \ ln p $的函數形式。

考慮一個由兩個獨立的子系統A和B組成的系統$ S_ {AB} $。然後$ S_ {AB} = S_A + S_B $和$ p_ {AB} = p_A p_B $,因為A和B解耦了。

$$ S_ {AB} =-\ sum p_ {AB} \ ln p_ {AB} =-\ sum p_ {A} \ sum p_B \ ln p_A-\ sum p_ {A} \ sum p_B \ ln p_B $ $

$$ =-\ sum p_ {A} \ ln p_A-\ sum p_B \ ln p_B = S_A + S_B $$此自變量有效直到一個因數,結果就是玻爾茲曼統計力學中的常數$ k_B $:$ S =-k_B \ sum p \ ln p $,這是由於Gibbs所致,早於Shannon。

出色的答案,當然是最好的答案,因為它適用於所有事物(馮·諾依曼熵,香農熵,玻爾茲曼-吉布斯熵)。但是,您忘記了重要的一點:您還需要將$ S $限制在正值範圍內(出於同樣的原因,在熱力學勢擴展中,體積應限制在正值範圍內)。否則,定義$ S \ propto \ ln p $已經完成了擴展性工作,負號和結構$ p \ ln p $分別來自於正性要求和有界性。
Henry
2014-01-21 02:48:08 UTC
view on stackexchange narkive permalink

從純粹的物理學角度來解決這個問題,這就是系統的吉布斯熵。首先,儘管可以擴展熵的概念,但我們通常在討論平衡熱力學,這當然是首次引入吉布斯熵的地方。

您當然是正確的,在技術上可以完全描述動力學他們的運動方程式,但是對於熱力學這個主題並沒有太大的需求。我的意思是說,熱力學在某些方面不像物理學中的其他學科那樣“基礎性”,因為它沒有嘗試對正在研究的系統提供所有內容的完整描述。您通常是在討論大型系統(因此要尋找宏觀屬性),或者討論與大型環境交互的小型系統。 (例如,談論電子的溫度並沒有太多意義)。實際上,搜索這樣的系統的確定性描述是完全不切實際的(即使沒有混沌理論和量子力學,方程式的數量也是如此)

使用平衡統計熱力學(它是根據微觀描述的平均值尋找經典熱力學的正當理由),因此,我們從等式原理開始先驗概率表示對於一個孤立的系統,該系統長期以來一直處於單獨狀態(模糊,但基本上處於平衡狀態),系統可用的每個微狀態都同樣可能被佔據。這是一個很大的假設,並且很多人希望能夠對其進行正確的論證,但是人們經常在對稱性上爭論不休(根據您掌握的信息,我們沒有理由假設某個特定的微狀態比任何其他)。不僅如此,它還可以工作。

玻爾茲曼(Boltzmann)假定隔離系統的熵為$ S = k \ ln(\ Omega)$,其中$ \ Omega $是系統可用的微狀態數(假設離散數量的微狀態,尤其是當您談論玻耳茲曼/吉布斯熵時。這是一個假設,但必須與經典的熱力學熵保持一致。當您考慮系統與環境熱接觸且微態概率不再相等時,吉布斯熵是對此的自然擴展。您可以證明它與許多系統的經典熱力學熵是一致的,並且確實表明瞭如何將熵視為衡量系統微觀細節不確定性的指標。



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...