大資料分析中,因果和關聯的區別和聯絡是什麼?

時間 2021-06-06 18:30:13

1樓:

我覺得是不得已而為之

1 因果關係(causation)比關聯關係(correlation)更強,有因果關係必定有關聯關係。

運算上其實是沒有差別的,是因果還是關聯完全看試驗的前提條件,所以有條件當然是知道因果更好

可是因果關係有乙個前提條件,隨機分配(random assignment),大資料研究的物件通常非常多,通常不可能去分配被研究物件,只能被動觀察結果。

所以只能忽悠說我們不關心因果。

2 另一種不得已而為之的是許多變數之間本身就沒有因果關係,僅僅是關聯關係。

2樓:王俊巨集律師

在大資料這個概念出現之前看過社會學上對於因果的定義,供您參考。

因果只有倆個事件同時具備以下三點的時候,才可以說事件之間是因果關係。第一,倆個時間是關聯的。就是說總是同時出現。

第二,原因在前,結果在後。第三,原因消除的話,結果也就消除了。

至於您提到的有人說的「大資料分析的時候不再注重因果關係,而更注重關聯關係」。我想可能是機器學習和統計學研究問題的不同的思路。統計學研究問題的時候,非常注重結構,注重模型的合理性以及顯著性之類的東西(或者其他的理論基礎和要求),而機器學習更多的是通過泛化過程中的準確程度來比較模型的好壞。

這個在吳喜之老師的一本書中有比較多的分析。

大資料分析和大資料研發的區別?

Rorschach 比較常見的情況下,大資料分析這種強調的是從複雜的資料和關係裡面尋找關係 趨勢等等顯著地統計量來給決策提供資訊支援的。比較強調的能力是公司所在行業的領域知識,資料分析能力,對資料的敏感程度,資料視覺化技術,溝通能力特別是面向非技術職能人員的共同能力。大資料開發人員有一部分是做資料平...

大資料分析Python和R的區別與聯絡?

資料分析知識分享 R和Python都是開源程式語言,在資料科學領域廣泛使用。難怪有人在同一行業中尋找職業可能想要獲得這兩種工具中的一種或最好是這兩種工具的專業知識,以便能夠在快速發展的資料科學和分析市場中找到自己的利基。但是,當初學者希望同時學習兩者時應該怎麼做?R主要是一種面向功能的程式語言。如果...

可以幫我分析一下大資料分析和大資料工程的區別嗎?

九道門聊資料 首先要這兩者的的定義是什麼,工作的內容是什麼?雖然兩者上都會用到程式設計的技術 但是工程師的工作方式在接到乙個專案之後是有標準化的流程,標準化的流程更像是乙個工程。我們在實施工程的時候要將工程細化到每乙個點應該怎麼做,要百分之百的完成這些設計的要求。資料分析師的工作性質和工程師的就不一...