大資料和 資料探勘 是何關係?

時間 2021-05-06 12:57:34

1樓:好好學習

資料探勘可延伸至演算法推薦、個性化定製

大資料是乙個泛化的概念,是所有資料的集合。而資料探勘是在這些大資料中尋找資料間的聯絡,從而勾勒使用者畫像,更好地找到更匹配提供服務。

2樓:無所不能的小裁縫

大資料指的對海量的資料進行處理並得到有用資訊的一種能力,是包含資料探勘的,兩者是息息相關的。

資料探勘需要人工智慧、資料庫、機器語言和統計分析知識等很多跨學科的知識。

資料探勘的出現需要條件:

1、 海量的資料。

2、 計算機技術大資料量的處理能力。

3、計算機的儲存與運算能力。

4、 交叉學科的發展。

3樓:大資料培訓傅一航

兩者不是同乙個層面的概念,沒法比較的。

資料探勘,是一種技術的說法,指從資料中找到未知的規律。

大資料,可以認為是一種應用場景和應用需求。它要求考慮資料的採集、儲存、分析、視覺化等等技術。當然,大資料的核心也是應用:從資料中發現有價值的資訊,這一點可由資料探勘來實現。

從這個方面講,資料探勘是大資料技術中的其中一種而已。

4樓:HCocoa

不是有明確的定義的嗎?

大資料就是「用總體代替抽樣」,核心是「總體」,優勢是可以發現長尾的東西,適應網際網路時代;而分析大資料時可能會用到資料探勘技術:這就是它們的關係。

不過,在抽樣的年代(小資料時代),也會用到資料探勘技術,所以大資料更多指的是海量資料處理技術。

5樓:

說一下我的粗鄙理解

大資料就一炒作的概念,一般人們說大資料,第一反應就是有很多資料(其實不僅需要多的資料,還需要全的資料),在很多資料基礎之上做各種各樣的事情,比如資料金礦挖掘,什麼走勢分析,什麼資料變現等等。

資料探勘就是一門以演算法和資料為基礎的技術,一般也是在大體量資料基礎之上來做挖掘,但這並不是必須的。

6樓:地主

大資料可以理解為乙個技術手段、平台、工具或者是一種思想

而資料探勘是工作目標,在沒有大資料概念之前,資料探勘可以用關係型資料庫、分析型資料庫等等,現在只不過多了乙個選擇,而且是乙個很好用的技術手段。

7樓:

我覺得大資料和深度學習一樣,是讓艱深的計算機概念得到公眾認知和認可的有效嘗試,無論是 「大」字還是「深度」,都非常形象也很直觀地展示了這些研究課題的挑戰和意義,雖然這些研究課題在相關研究領域早已被探索了幾十年。

8樓:

大資料表面看上去理解就是資料量很大,這就涉及到儲存計算,比較火爆的就是hadoop spark分布式計算儲存 ,要計算海量資料裡面還涉及到資料探勘資料分析。

9樓:何棟棟

簡單來說,資料探勘應該比大資料出現得早。人們在進行生產(商業也算哦)的過程中會發現有一些資料,這些資料伴隨著生產過程產生,必然包含著一些規律,人們就想用一些方法把枯燥資料裡的秘密挖掘出來,於是動用統計啊計算啊機器學習之類的方法(方法不重要,能挖出秘密重要),把這個過程叫做資料探勘;而大資料,只是泛泛而談罷了,大致指的是海量資料,是個大概念,不具體。

10樓:圖靈Don

以山西開礦的煤老闆為例:

開礦的前提是有礦,包括煤礦的儲藏量,儲藏深度,煤的成色。

之後是挖礦,要把這些埋在地下的礦挖出來,需要挖礦工,挖礦機,運輸機。

之後是加工,洗煤,煉丹,等等。

最後才是轉化為銀子。

資料行業十分類似:

挖掘資料的前提是有資料,包括資料的儲藏量,儲藏深度,資料的成色。

之後是資料探勘,要把這些埋藏的資料探勘出來。

之後是資料分析輸出,要把這些資料視覺化輸出,指導分析、商業實踐。

直到這一步,才創造了價值。

所謂的大資料,大約就是說現在有座正在形成的巨型礦山,快去搶占成為煤老闆吧,下乙個蓋茨興許將在這裡誕生。

11樓:張偉棋

關於大資料的定義很多,引述 Doug Laney 2001 關於大資料的主流定義。

翻譯易有偏差,下面是英文定義,從容量(Volume),速率(Velocity)和種類(Variety)三個方面來闡述:

Volume.Many factors contribute to the increase in data volume. Transaction-based data stored through the years.

Unstructured data streaming in from social media. Increasing amounts of sensor and machine-to-machine data being collected. In the past, excessive data volume was a storage issue.

But with decreasing storage costs, other issues emerge, including how to determine relevance within large data volumes and how to use analytics to create value from relevant data.

Velocity.Data is streaming in at unprecedented speed and must be dealt with in a timely manner. RFID tags, sensors and smart metering are driving the need to deal with torrents of data in near-real time.

Reacting quickly enough to deal with data velocity is a challenge for most organizations.

12樓:周李

個人覺得資料探勘是一門技術,是相對比較狹義上的乙個概念。

而大資料更像乙個產業,資料探勘當然是其乙個核心技術。但是,大資料與資料探勘不同的是,他還涉及到其他廣泛的技術,其中代表的如視覺化技術,資料儲存和管理技術。

大資料不僅僅是利用資料探勘技術從資料中挖掘有用的資訊, 他還要採取海量資料,通常要分布實時處理,最後利用要組織資料探勘技術得到的資訊,向使用者直觀的展示這些資訊~

13樓:張揚

現在經常說的大資料:包括資料來源,大資料儲存,資料探勘演算法模型,資料探勘的挖掘框架,挖掘結果使用等多方面。

通常意義資料探勘:大量資料探勘,小量資料探勘 ,主要說的挖掘的框架和演算法模型。

這是我的理解。

14樓:徐曉軼

兩回事,大資料是海量資料環境下如何還能保持對某個訪問會話的快速響應。資料探勘是從大量的歷史資訊中總結出有用的知識。這是兩個層次上的事情。

資料探勘原則上是可以不需要大資料的,因為它對響應速度並無要求,它看重的是挖掘出來的知識的效用。但對於海量資料環境下,如果沒有大資料的相關資料快速供給能力,那麼資料探勘所消耗的計算資源可能使得其根本無法完成或成本太高。

資料探勘和資料分析之間的聯絡,搞資料分析基礎是啥?就業情況怎樣?

mengyuancf 資料分析的基礎是要具備一定的數學 統計統籌的知識,當然你可定具備了,另外需要掌握一些必備的工具軟體的使用 如R Python excel 資料可基礎等 也就是你說的程式設計那一塊,這個在資料分析領域是屬於基礎知識的,只要你懂些即可,最關鍵的確實是你說的偏理論的東西,如演算法 資...

請問做資料分析和資料探勘用那種語言較好?

Trevor 工具是為了幫你更高效的解決問題,技術是為業務服務的,所以建議你應該先熟悉你所在行業的業務背景,看看經常遇到的是什麼問題,建立一套解決問題的思路,然後運用工具去幫助你解決問題。那麼提到工具,excel 肯定是最基本,然後就是sql,不管是關係型資料庫或者大資料平台,都可以根據需求去取數,...

大資料分析 資料探勘用什麼例子來練習?

NLPIR 大資料探勘 資料探勘根據行業的不同其訓練的文字語料也不同,在一般情況分為 經濟 政治 文化 體育 環境 教育 軍事等類別,每乙個類別都有自己的特性,所以要按照自己的行業要求進行大資料語料訓練。由於篇幅原因在這裡就分享乙個文化方面的資料探勘訓練過程 分析 紅樓夢 作者是否為同乙個人?針對 ...