大資料資料血緣是什麼,跟資料質量有什麼關係?

時間 2021-05-07 03:02:50

1樓:冰洋

資料血緣屬於資料治理中的乙個概念,是在資料溯源的過程中找到相關資料之間的聯絡,它是乙個邏輯概念。

資料質量是相對於資料接入,清洗的乙個相關概念,一般接入的資料質量不高,都要通過對原資料的清洗跟業務理解從而對資料進行歸類,彙總,保證後期資料分析出來的結果更準確。

資料地圖是從多維資料分析衍生過來的乙個概念,多源異構的資料經過清洗,ETL相關操作之後,形成相互關聯的資料形態,可以便於我們找尋所需要的資料

2樓:嘉慧Lincoln

Data Lineage 資料血統 = Data Provenance 資料起源 = Data Pedigree 資料譜系

具體可見:http://citeseerx.

ist.psu.edu/viewdoc/download?

doi=10.1.1.

406.8789&rep=rep1&type=pdf

3樓:

血緣一般是講資料生產的路徑,比如通過資料A資料B產生了資料C,那麼C的父血緣就是A和B,反之亦然。

質量一般是為資料配置了一系列的質量檢查規則,比如非空檢查,唯一檢查等等!檢查結婚即是質量。

地圖一般是集中的元資料管理系統,可以在這裡搜尋資料(結構定義)

大資料華而不實麼?大資料的本質是什麼?

冰洋 這個要看你怎麼來看了。大資料與其說是一種技術,不如說它是一種思維方式更適用。本質是提公升效率。通過大量資料的統計,分析,挖掘等手段,來發現資料之中的規律,從而達到為新業務賦能的目的。我們的記錄最簡單的形式就是EXCEL,WORD,PPT,PDF這些檔案,複雜一點的就是放在不同資料庫中,當資料庫...

大資料是什麼?與資料庫是什麼聯絡?

九月鷹飛 大資料,需要儲存到資料庫中。資料庫中的資料量大了,比如十億 百億條,這就是大資料。資料庫有多種型別,大資料有結構化 非結構化 半結構化,要根據資料型別和資料量等決定選擇用什麼樣的資料庫。比如時序相關的資料,可以用時序資料庫。 加公尺谷大資料老師 在IT技術領域,資料庫技術是重要的支撐性技術...

大資料是什麼意思?

冷冷冷摳門 愛吃大蝦的貓咪 這位叔叔不願意跟我辯論並且拉黑了我。我只好在這裡艾特您。並貼出原回答。不過畢竟我沒有那麼幼稚,所以我不會拉黑您。您可以暢所欲言。我說35歲的女人也有魅力。然後這位叔叔說讓我用大資料說話。並且說他查了並貼給我豆瓣統計資料。請問各位,豆瓣這個統計資料可以作為大資料來應用嗎? ...