大資料聽著很牛,實際上也很牛嗎?

時間 2021-05-07 04:42:19

1樓:月落不提

其他的大資料人工智慧我都不信,純純外五縣

我就信王者榮耀大資料精準匹配四個彩筆隊友

多少沾點雷射雨,絕對夠用

Timi

真實打真實

牛必打牛比球怕累

2樓:你的孤獨雖敗猶榮

大資料和過去的客戶關係管理在本質上都是一樣的。有資料,不一定意味著你可以獲得商業的成功,用不好小資料,十年前不能有效使用客戶關係管理系統的,今天也不一定能夠用好大資料。

3樓:

嗯,很牛。

從比較容易理解的角度來說,你聽過的周易啊、星座啊什麼的,都是大資料。

大資料不是你說的收集很多使用者資料,並且用機器簡單處理一下,你說的這個只是大資料的滄海一粟。實際上大資料能辦到的事太多了。

比如,我舉個栗子(這個只是在腦海中思考過,沒有實際處理)我想做乙個知乎大V,我每天回答無數問題都火不了,直到有一天,我想到乙個好法子:我去回答使用者關注多,回答少的問題,我不就火了麼?

於是,我用python寫了乙個寥寥數行的爬蟲,稀里嘩啦地爬了一百萬條我熟悉領域的知乎問題以及資料,然後放到excel裡,用資料透視表小小的篩選了一下。很快,我就拿到了乙個高效度的問題列表。接下來我去回答就好了,成為知乎大V只是時間問題而已。

你瞧,這還不算是大資料,只是小資料而已。

4樓:勇敢的心

很牛。歪個樓,說個小資料的事。

乙個滴滴司機,接了乙個乘客,乘客讓去樓下接他,接上,送到,按下不表。

第二次,又是這個乘客,幾乎是同乙個時間段(凌晨),樓下接他,接上,送到第一次的同乙個地方。

第三次,從這個乘客上班的地方接上,送到他樓下。

這三次接同一位乘客,可以說是小資料了吧。但是他的家在哪,單位在哪,什麼時間,愛去什麼地方,司機都知道了。

細思極恐。

5樓:

例如,在面對高增長的海量資料(比如千億級別)或者半結構化資料的情況下,傳統的資料庫技術可能是完全處理不了的,但是大資料技術可以。

相反,在很多時候,大資料技術在效能和功能強度方面相比傳統資料庫技術並沒有明顯的優勢(與大眾的印象不太一樣)。

6樓:魚君

很牛。所謂大資料,就是量大且複雜到人工無法輕易獲取、整合的資料。

這個「大」的量是個天文數字,而機器可以獲取、整合、處理,甚至比較精確地分析,能極大效率地提高資訊處理速度,讓資訊更直觀地呈現在人們眼前,極大地便利了人們進行進一步的分析。

7樓:假裝很淡定

就是很牛,工資嚇你一跳。但也不要挑戰老闆的耐心,你得盡快把資料的業務價值發揮展現出來,否則這時間一長,老闆給你發這麼高的工資,突然哪天可能就不高興了。

8樓:楊津津資料分析獅

說白了就是樣本更大更全面,而傳統的統計、分析手段不能高效的拿到這些樣本、也不能處理這麼大的資料。

現在中國的大資料,或者能看到的大資料分析,只是在資料量上獲得了進步,量級能達到,但是在分析上,還做不到完全以資料為客觀支撐,輸出最終結論的。現在的分析結果看上去都是為了驗證已有的經驗而用資料往上靠的。

我們任重而道遠啊,一定要跳出現有的經驗框架才能進步。

9樓:密小亞

資料很重要,但是,資料有很多玩法,同乙個基礎資料,繪製成圖表,可以得出截然不同的結論,看你想怎麼玩,想呈現的是什麼。。。。

以下是示範:

10樓:Amanda0117

很多產業都會用到大資料,現在流行的熱詞:大資料+、AI+,其實談的就是接下來跟產業的深度融合。現在大資料分析用的比較多的產業除了具有天然資料屬性的金融行業,還有零售、快消、工業。

工業網際網路的建設,也是以資料為基礎的,還有環保領域。2023年,預計有不少大資料公司的戰略會轉向與產業融合的方案或者平台,比如,埃睿迪就提了"基於大資料的綠色工業網際網路平台",主要應用於工業工藝流程過程中的優化、環保指標的控制,其實是整合了其之前主要指向產品的工業大腦和環境大腦,在工業領域的應用。

11樓:雷奐裘

我在亞馬遜上只買書、而且是比較嚴肅的書、但是它給我的電子郵件都是向我推銷3m抹布、搞演算法的這些大資料科學家是在鬧著玩嗎?[衰]

12樓:打碼小能手

統計學界一句名言:「人們信上帝。除了上帝,任何人都必須用資料來說話。

」早在2023年,有文章提出大資料正在對每個領域都造成影響。在商業,經濟,社會生活,犯罪學、科研各領域,決策行為將通過資料及資料分析而得出,不再是

大資料需要滿足3個特點:規模性、多樣性和高速性,當然,還有人認為它還具有價值性、真實性等。

資料獲取是大資料時代計算機資訊處理的首要環節,只有對現實世界的實時狀態進行快速獲取與資訊化、數位化表達,才有可能以統一化的資料格式對資料進行儲存與管理,為後續資料分析與規律挖掘提供規範化的資料集收集海量的各種型別的資料,並快速獲取影響未來的資訊的能力。

大資料已經逐步滲透到人們工作生活的諸多領域中,科技公司在創新技術上全力投入,成為世界雲計算和大資料的技術發展的重要一員。大資料產業的發展將推動全球經濟由粗放型向集約型轉變,未來,決定、評價各界價值的最大核心在於大資料,這將對提公升企業整體競爭力具有意義深遠的影響。

13樓:尚露殉

回到問題本身,大資料的確很牛,這是因為大資料技術很難。這其中資料異構性與決策異構性的關係對大資料知識發現與管理決策的影響尤其重要。由於大資料本身的複雜性,這一問題無疑是乙個重要的科研課題,對傳統的資料探勘理論和技術提出了新的挑戰。

所以從事大資料研發工作是一件難度很大的事情,這也是為什麼大家都感覺到大資料高深莫測了。

大資料的發展已經在各個領域帶來了實際價值,現如今大資料的應用十分廣泛,金融、汽車、餐飲、電信、能源、體能和娛樂等在內的社會各行各業都已經融入了大資料的印跡。目前華為雲依託於華為公司雄厚的資本和強大的雲計算研發實力在大資料技術方面處於國際領先地位。基於大資料技術,企業可以發展物聯網以及人工智慧,在更多的領域開發新的藍海。

14樓:流明

聽起來很牛,實際上根本不是什麼從石頭縫裡蹦出來的技術。隨著網上的資訊量越來越大,為了處理這麼大規模的資訊需要使用的新的技術,從本質上來講和高中計算機的資料庫管理是一樣的。

就是這麼簡單。

15樓:木木

非常有潛力的乙個領域,人工採集資料耗時耗財耗力,遠沒有利用專業的資料採集軟體採集的資料準確,而且可以和該領域的相關企業合作,你想要什麼樣的資料他們可以配置,簡單便捷。同時,大資料領域對個人技術水平要就不高,初學者容易入門。

16樓:芭比蔻油

大資料是網際網路大時代的乙個趨勢,不少企業都相繼推出了大資料平台,像京東永珍、天元資料,而且大資料的應用範圍十分廣泛,涵蓋政治經濟各個方面。泛泛來說,還是很牛的。

17樓:

的確很牛,但是需要乙個能發揮它作用的環境。隨著網路規模日益龐大,人們構築的軟體系統日益複雜,大資料的應用也會日益廣泛,而顯示出它的作用。

18樓:

大資料不管聽著還是實際上都很牛。看待每一樣事物都不能單一的從乙個方面來,如果你說「資料收集和分析都變得更快更智慧型,僅此而已吧。 」這就很單一的看待大資料了。

大資料並不是1.2.3.

4.5......這些資料,它的複雜性是用人工是無法計算的。

除此之外,資料收集和分析不僅僅是更快更智慧型,還有就是更精準,更貼近實際情況,這樣才能提高效率。如果這都是「僅此而已」,那麼可能是還沒有深入的使用並挖掘到大資料的價值吧。

19樓:陽光財稅

中科普開大資料培訓課程:別在該吃苦的年紀選擇安逸,如今在這裡選擇了中科普開的培訓課程:http://t.cn/R5S3wsA是乙個不錯的選擇

20樓:Lilian Xu

國內的大資料很牛,因為確實能從海量人群中生產出海量的資料,讓IT工程師們忙活一圈。

國外的大資料很牛,因為確實能從海量資料中挖掘出有料的結果,讓資料科學家忙活一陣。

21樓:生物製藥自動化

我覺得大資料真正能提煉出來的東西是為了消費導向的話作用可能不大,本身如果是經常網購的人,還會繼續網購,而不經常網購的人能夠給到推薦也很少。倒是在基礎和工程行業急需這種大資料支援,可以加快科學研究!

22樓:徐辰

大資料到底是個什麼東西呢,舉個例子,比如說排序這麼簡單的一件事,教科書上肯定給你講了冒泡選擇什麼的,但這些都是要順序操作的,不符合大資料思維。另外還有的heap merge quick sort,其中heap也只能順序搞,merge略好,但教科書上只說一分二,併發度顯然不夠,而且要多輪shuffle+reduce,並行度受限,quick sort類似,這些都不夠好。

可見傳統的排序都不太符合大資料思維,那麼到底哪種排序演算法最符合呢?

在這裡我隆重推薦————Sleep sort!

Sleep sort對於Hadoop/Spark極度友好!只需一輪shuffle一輪reduce即可完成排序!還可在Storm上用流計算的方式實現!

並行度可以高達要排序資料的總個數!這才是真正的大資料排序演算法!

Sleep sort,你值得擁有!

23樓:qaqabincs

跑來吐槽。@馬春荃的答案裡說Gartner給出的定義是胡扯,實在是自己思考不夠啊:

「大資料」是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。

其實我覺得總結得挺到位。只不過主要不是從技術的角度,而是從業務需求的角度。

為啥需要「新處理模式」?因為資料量大到需要很多臺資料同時處理,然後就引出當前高票答案裡說的一眾技術問題需要解決。這是「新」的含義之一。

另外,一是最早TB級資料在小型機系統架構橫行時代也是可以處理的,只不過投資巨大,因為技術掌握在少數幾家廠商手中(所謂IOE,IBM/ORACLE/EMC等)。現在被GAY(google/amazon/yahoo)等公司用PC伺服器為主的分布式技術超越,故也有「新」意。

更強的決策力:以前在使用關聯式資料庫技術時代,決策支援系統又被IBM叫做BI,現在因為資料量大,需要使用更多非關係型資料處理技術了,決策可依賴的情報資料遠超以往、處理速度遠超以往,所以說是「更強」。

洞察發現力:網際網路普及之前,資料分析往往只有事後分析需求,網際網路使得實時分析的需求場景大量增多,比如說網際網路廣告使實時推薦大行其道,衍生了很多相關演算法,稱之為「更強的」洞察發現,也是無可厚非的。

流程優化能力:從成熟度模型角度,一種特定業務的IT化是否完善,往往可以分為幾個階段,從未定義、到「已定義」再到「可量化」,又從區域性到全流程,最後變成全程可優化。這個最後階段就是所謂「流程優化」能力了。

你想啊,要實時對業務處理流程進行優化,不得從各個相關環節採集資料嘛,感測器少不了,有了感測器實時出資料,而且各處都有(比如無處不在的攝像頭),那資料量不是海量、高速增長嗎。加上貫穿業務流程多環節,物流資料、交易資料、客服資料……各種各樣的,當然就多樣化了。最後,這些資料都蘊含著或多或少的商業資訊,甚至競爭情報,能不是「資訊資產」嗎?

所以說,人家老牌諮詢企業的名頭不是白來滴。

有哪些聽起來很歡快實際上很悲傷的歌曲?

竹田 子守唄。被重新填詞變成了 祈禱 歌詞特別暖心,但小時候第一次聽就覺得不太對勁,調子涼冰冰的,歌詞背後像是有什麼東西讓人極不舒服。一直到兩年前,我才知道這首歌原來是翻唱的,原詞如下 守 守著孩子已經厭倦了,盆 先 盂蘭盆節來到前,雪雪已經飄了,子 泣 孩子也在哭。盆 來 盂蘭盆節到了,何 有什麼...

有哪些聽起來很浪漫,實際上很殘酷的事?

吾笑我 大學畢業時有人打著不想錯過的名號在寢室樓下表白,說什麼沉默了四年終於鼓起勇氣在最後的時刻牽你的手,只為了今生不再錯過。屁嘞,一群生計與前途都還沒著落的愣頭青懂個屁啊,不過是眼看著就要各奔東西了,想打個免費炮後提褲子走人罷了,真以為那麼多的愛在心頭口難開? 再也沒有以後 你愛的人口中的等待。等...

有哪些通常被認為很髒,實際上很乾淨的東西?

蘇慧宇 多數事物是否有菌,大多決定於其所處環境。清新乾淨或者消毒的環境必然菌少或無菌,相應其中事物也必然菌少或無菌。所以問題不成立。如果非要說那些恆定環境的東西,眾多答案裡剛剛釋放的尿已經勝出了。 我想認識地球 Sunny下的大地泥土!要是真髒我們早死了,空氣中有水,水吸收藍光,藍光會殺菌!用放大鏡...