2025年2月7日 星期五

Data-driven science(數據驅動科學)

 Data-driven science(數據驅動科學)既不是經驗公式(empirical formulas)也不是第一原理(first principles),主要是因為數據驅動的方法具有不同的科學方法論基礎:

與經驗公式(Empirical Formulas)的區別

經驗公式是基於實驗數據的擬合,通常來自觀察和測量,但缺乏理論推導。例如,天體運行的開普勒定律是在大量觀測數據的基礎上歸納出的,並沒有從更基本的物理定律推導而來。

數據驅動科學雖然也依賴數據,但其目標更進一步——不僅是擬合數據,而是試圖發掘數據背後的結構與動力學規律。例如,使用稀疏回歸(SINDy)來從數據中學習微分方程,這比純粹的經驗公式更接近數學建模。

與第一原理(First Principles)的區別

第一原理指的是從基本物理定律(如牛頓運動定律、量子力學、熱力學定律等)出發,通過數學推導得到具體系統的行為。例如,從牛頓力學可以推導出行星運動的方程,而這些方程能夠解釋開普勒定律。

數據驅動科學並不依賴這些物理定律,而是讓數據自己「說話」,通過機器學習或統計方法發掘潛在規律。例如,Brunton 及其團隊開發的方法可以根據時間序列數據找出支配系統的動力學方程,這種方法可能不需要事先知道任何物理定律。

總結
數據驅動科學介於經驗公式與第一原理之間:
不像經驗公式那樣只是對數據做曲線擬合,而是試圖找出數據背後的微分方程或數學模型。
不像第一原理那樣完全依賴基本物理定律,而是利用數據來學習模型,有時甚至能補充或改進現有的物理理論。

這樣的方法對於研究複雜系統(如湍流、非線性動力學、神經科學等)特別有價值,因為這些系統往往難以僅靠第一原理推導出完整的描述方程。

沒有留言:

張貼留言