国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關注微信公眾號

談談阻礙數據建模的五大借口
2022-11-24   數據驅動智能

  隨著大數據和數據湖的發展,數據建模似乎瀕臨滅亡。數據湖的開發者留下了大量數據沼澤,所以建模活動還是必須的。那么為什么仍然存在關于數據建模的問題呢?當然有各種各樣的原因。有些問題至少已有30年歷史,而最近人們更加認為使用云數據平臺和分析數據架構的ELT方法所致。下面我們看看常見的阻礙數據建模的原因:


  1.缺乏興趣——企業真的不在乎

  盡管CIO和CEO宣傳“數據驅動”,但對于某些企業而言,數據的管理和利用并沒有放在主要日程上,至少在高層是這樣。這可能是可以理解的——并非每個企業都是“數據企業”;數據可能很重要,但僅在特定的獨立領域內使用。有些組織從事采購和銷售產品、提供法律顧問等行業,這并不是說他們不使用數據,而是,就目前而言即使使用Excel這種處理工具也滿足使用了。

  這可能發生在傳統的組織中,可能發生在行業領軍企業,也可能發生在技術初創企業中,在這些組織中,良好的數據是運營次要考慮因素。

  解決方案:除非組織遭受足夠多的數據相關痛苦,或者高級管理層選擇支持戰略性數據支持業務方法,否則數據建模以及治理和其他數據內容將主要在項目級別完成,以實現本地目標。

  2.缺乏“全局”——沒有全面的業務數據模型

  數據建模通常被視為支持運營和分析產品開發的詳細活動,從數據策略中刪除,并且僅作為詳細業務分析的一部分影響業務用戶。但是,如果沒有組織數據分布的高級地圖,公司如何“數據驅動”,或者業務領域如何就數據所有權和責任達成一致?CDO應該如何合理跨越多個應用程序或孤島的數據,每個應用程序或孤島都有相互獨立的目標,成為“客戶”的真正來源,或者了解特定數據流的原因?

  90年代的情況是龐大、詳細的3NF“企業數據模型”,通常會運行到100或1000個實體。有時,這是為特定行業“現成”購買的,但隨后需要在企業內部進行驗證和調整。毫不奇怪,這些做法通常會陷入困境,被更緊迫的業務優先事項所取代。

  解決方案:高級“業務數據建模”或“概念數據建模”的藝術已經存在超過15年。在經驗豐富的從業者手中,對于中型企業或部門,應該可以在1-3個月內制作出良好的初稿,包括與企業所有部門的適當互動。通常,這可以與針對更多高級管理人員和員工的數據素養練習一起完成。隨著從一個業務域更詳細的數據工作引發對概念或全新概念的差異化的需求,可以改進和擴展這樣的模型。

  從“頂層”開始數據建模本身就非常有用,這是組織數據處理方法的基礎。

  3.數據作為應用程序完成或事后的想法

  盡管許多應用程序產生并依賴于數據,但一直存在一種趨勢,尤其是程序開發中,忽視數據建模,而不是應用程序設計中首要事情。這尤其體現在兩個方面:

  a)使用第三方程序加速業務能力

  許多應用程序都有自己的數據模型,該模型存在于“要么接受要么放棄”的基礎上——您可以調整數據需求,以適應應用程序的數據模型。另一方面,其他應用程序積極鼓勵業務用戶進行本地定制,而不考慮數據模型是否真的有意義。

  更廣泛的集成問題可能會被擱置一旁,只要應用程序可以獲取或交換數據以滿足即時需求,也許是通過API。一些應用程序甚至積極阻止在其自身環境之外提取數據。

  解決方案:僅購買能夠提供清晰數據模型和/或用于分析目的的精心構建的提取/數據共享選項的應用程序。建議將這部分作為采購必要條件,而不僅僅是“是/否”的回答。

  b)內部應用程序開發人員將數據建模視為事后的想法

  這是企業內部的問題,開發人員通常在時間壓力下工作,向內部或外部用戶提供數據展示,這些用戶對數據的存儲方式沒有直接興趣。

  解決方案:數據建模師應該是任何應用程序團隊的核心部分。數據模型初稿通常應該是開始第一個真正的敏捷開發的先決條件。將產生的數據供下游使用,無論是出于操作目的還是分析目的,都應該是整體框架的一部分。這是數據驅動開發的最佳實踐,數據網格模式強烈建議這種做法。

  4.效率問題——建模只會減慢速度

  模型就是這樣——對現實世界的簡化。在進行數據建模的情況下,通常會捕獲一些隱式規則和關系,希望能夠適應企業管理其現實世界交互的方式。

  90年代的關系建模被認為太慢了,識別實體、關系和屬性的視圖通常被業務變化和新數據源所取代,并且在捕獲和傳輸在線事件時未能增加價值。隨著組織從生產純物理產品轉向更多數字產品,定期更改成為常態,建模被視為阻礙或與保持最新所需相沖突。

  解決方案:在在線應用程序中,半結構化“文檔模型”方法提供了事件封裝和可擴展模式的一定程度的靈活性。使用此類結構的最佳實踐隱含地承認3NF分析的原則。分析數據平臺轉而提供對JSON等格式的本地支持,并具有不同程度的承諾。

  在分析領域,DataVault方法通過歸納關鍵實體之間的關系、識別來源的多樣性和高變化概率以及構建歷史記錄來提供敏捷性。

  數據網格建議將大部分建模留給本地域——盡管它也提倡雙時態建模方法,并談到需要通用標準、一種新的建模方法,甚至一種語言來實現跨域的“可組合性”。

  最終,為用例或應用構建正確類型的模型是成功的最佳秘訣,無論是文檔、3NF、DataVault還是維度。雖然建模首先是一項邏輯活動,在底層數據平臺中支持一系列具有良好性能的數據建模方法可以顯著簡化邏輯到物理的映射。

  5.直接獲取數據——數據沼澤遺留問題

  雖然大數據運動是由互聯網生成的龐大數據驅動的,但它也是對復雜性和數據變化率問題的回應。隨著一些組織開始通過利用一切數據產生巨大收益,人們越來越不愿意丟棄任何數據。而且數據湖從業者認為,建模已經過時了。現在,當連接大型數據集或多表模型的數據很痛苦時,創建大量非規范化數據集的動力就非常強烈,通常會導致大量重復。對數據安全的忽視也進一步助長了這一趨勢。

  受此經驗的影響,基于云的“現代數據堆棧”中出現的兩個互補趨勢出現了一些阻力:“廉價”存儲和“轉換(ELT)模式”。

  許多云數據平臺參與者至少在某種程度上將存儲與計算分開。云對象存儲具有彈性且相對成本低。大量數據出于未知原因被保留,原始數據或建模不佳的數據被直接使用并且從未正確集成。雖然存儲很便宜,但不斷增長的數據量推高了按消費定價的計算,使平臺提供商有鼓勵客戶不要在乎數據建模。

  這筆費用不能完全回避——即使是廉價存儲的數據有時也應該被刪除,無論是為了減少混亂、降低濫用風險還是讓地球更輕盈。

  許多組織已經轉向分層數據建模方法,其中第一層采用“原始”數據,無論是直接匹配OLTP系統上的表格,還是未經提煉的JSONWeb和IoT日志。這種ELT模式并不新鮮,例如在Teradata等平臺上的數據倉庫模式和實施中很常見,已有十年或更長時間。理想的目標是原始層饋送到更多層,通常是反映某些規范模型(例如3NF或DataVault)的一致性層和針對最終用戶的表示或交付層(通常按維度建模)。

  將數據保存更長時間是有正當理由的——監管(證明你五年前所做的是合法的)、網絡安全(攻擊模式可以發展數月)、數據科學和長期分析(將原始數據轉化為新功能)、或者僅僅是利用直接的內置歷史從舊數據重構下游新產品的能力。與此相反的是隱私法規和違規風險,以及將半衰期短的數據保存太久的環境成本。最終,這又回到了數據所有權和“為什么”的問題上。

  解決方案:僅僅因為可以忽視,并不意味著應該這樣。具有可靠治理、良好的數據高級模型和可靠數據架構的組織可以受益于更便宜的存儲和易于使用的平臺支持的數據底座和轉換模式。不急于對數據進行詳細的過度建模并在其價值確定之前花費大量的計算周期和工程師時間進行轉換可能是有價值的。

  同樣,讓我們現實地看待數據的“半衰期”,尤其是原始數據——很少有法規要求保留超過7年的歷史,而ML模型則更少,除非著眼于長期的事件。您的數據平臺在捕獲依賴關系和訪問歷史記錄方面有多好?這有助于識別那些從未或很少使用的數據集,并避免因擔心下游后果而保留數據。

  總之…

  就像數據中的許多好東西一樣,良好的建模源于組織承諾、適當應用良好實踐和模式的技能、精心設計的流程以及設計師的優秀技能。在大多數數據平臺上,不進行建模是災難性的。

熱詞搜索:大數據 數據湖 數據建模

上一篇:數據流量和處理對環境有巨大影響
下一篇:最后一頁

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
国产日产欧美一区| 一区二区三区欧美久久| 国产欧美一区二区精品婷婷 | 日韩一级高清毛片| 久久精品噜噜噜成人av农村| 精品久久久久久无| 国产精品乡下勾搭老头1| 精品国产第一区二区三区观看体验| 国产伦精品一区二区三区免费| 国产精品沙发午睡系列990531| 日本黄色一区二区| 精品午夜一区二区三区在线观看| 中文字幕不卡的av| 宅男噜噜噜66一区二区66| 国产精品一区二区三区网站| 亚洲精品国产一区二区精华液| 欧美一区二区私人影院日本| 成人精品在线视频观看| 香蕉影视欧美成人| 国产精品卡一卡二卡三| 777久久久精品| av在线播放成人| 青青草国产精品亚洲专区无| 成人免费视频在线观看| 亚洲精品一区二区三区99| 色8久久精品久久久久久蜜| 国产精品影视在线| 美女一区二区三区在线观看| 一区二区三区欧美日韩| 国产精品美女久久久久久| 欧美老女人在线| 91啪亚洲精品| jvid福利写真一区二区三区| 国产最新精品精品你懂的| 亚洲福利电影网| 亚洲天堂a在线| 国产欧美日韩另类视频免费观看| 91精品国产综合久久香蕉的特点 | 欧美成人a视频| 欧美日韩精品欧美日韩精品| www.色综合.com| 成人综合婷婷国产精品久久免费| 美女网站色91| 蜜臀久久久久久久| 五月天亚洲精品| 午夜激情综合网| 亚洲成人1区2区| 亚洲一区二区三区在线播放| 亚洲精品国产第一综合99久久| 国产精品久久一卡二卡| 国产欧美1区2区3区| 亚洲国产精品传媒在线观看| 国产视频在线观看一区二区三区 | 91久久精品国产91性色tv| caoporen国产精品视频| 9色porny自拍视频一区二区| www.爱久久.com| 在线一区二区观看| 欧美午夜精品一区二区蜜桃 | 美日韩一级片在线观看| 青青草成人在线观看| 日本强好片久久久久久aaa| 三级久久三级久久| 九九九精品视频| 成人三级伦理片| 91国产成人在线| 在线电影院国产精品| 欧美电影免费提供在线观看| 久久久久久久久久电影| 国产精品麻豆欧美日韩ww| 欧美高清在线视频| 日韩美女啊v在线免费观看| 一区二区三区蜜桃网| 午夜精品成人在线视频| 国产自产2019最新不卡| 91美女片黄在线| 日韩欧美中文字幕制服| 国产精品护士白丝一区av| 亚洲线精品一区二区三区八戒| 午夜久久电影网| 国产精品亚洲专一区二区三区| 91丝袜美女网| 欧美大片在线观看一区| 成人欧美一区二区三区白人| 日韩电影在线观看电影| 成人毛片在线观看| 欧美二区三区的天堂| 国产精品美女久久久久高潮| 日韩精品免费专区| 床上的激情91.| 日韩欧美123| 一区二区在线电影| 精品一区二区三区免费| 日本道免费精品一区二区三区| 欧美一区日韩一区| 中文字幕在线不卡视频| 蜜桃av噜噜一区二区三区小说| 成人精品在线视频观看| 日韩一区二区三| 一区二区三区四区亚洲| 国产一区二区不卡| 欧美日韩性生活| 日韩伦理av电影| 国产精品12区| 91精品国产综合久久精品麻豆| 中文字幕日韩一区| 国产成人在线视频免费播放| 91精品国产综合久久久蜜臀粉嫩 | 欧美成va人片在线观看| 夜色激情一区二区| 国产成人丝袜美腿| 91精品国产全国免费观看| 亚洲乱码国产乱码精品精的特点 | 日本午夜一区二区| 色婷婷亚洲综合| 国产精品夫妻自拍| 国产精品一区二区免费不卡 | 国产精品欧美极品| 韩国av一区二区| 日韩欧美一二区| 日韩精品亚洲专区| 欧美精品自拍偷拍| 五月天丁香久久| 欧美日韩免费视频| 一级特黄大欧美久久久| av高清不卡在线| 中文字幕日韩一区| 99精品欧美一区二区蜜桃免费| 国产日本亚洲高清| 国产.欧美.日韩| 国产精品伦理一区二区| 成年人国产精品| 亚洲精品国产高清久久伦理二区| 一本色道久久综合亚洲aⅴ蜜桃| 国产精品超碰97尤物18| 99热精品一区二区| 亚洲女子a中天字幕| 欧美性一二三区| 男男视频亚洲欧美| 欧美大片在线观看| 国产老肥熟一区二区三区| 国产精品三级av| 97se亚洲国产综合在线| 亚洲最快最全在线视频| 91精品国产aⅴ一区二区| 国内久久精品视频| 亚洲天堂av一区| 欧美一区二区三区思思人| 久久av中文字幕片| 中文字幕在线视频一区| 欧美午夜一区二区三区| 久久精品理论片| 中文字幕一区二区在线播放| 精品污污网站免费看| 狠狠色狠狠色综合系列| 欧美国产1区2区| 欧美久久久一区| 国产91高潮流白浆在线麻豆| 亚洲国产精品综合小说图片区| 日韩欧美国产一区二区在线播放| 国产电影精品久久禁18| 亚洲人亚洲人成电影网站色| 3atv在线一区二区三区| 国产成人精品一区二区三区四区 | 亚洲美女电影在线| 精品久久久久久久人人人人传媒| 成人国产精品视频| 秋霞影院一区二区| 亚洲日本欧美天堂| 26uuu色噜噜精品一区| 91黄视频在线观看| 精品一区二区三区香蕉蜜桃| 亚洲一区二区在线观看视频| 久久蜜桃香蕉精品一区二区三区| 99国产麻豆精品| 精品一区二区三区在线播放视频| 一区二区三区在线视频免费| 久久综合视频网| 欧美日韩国产一二三| 成+人+亚洲+综合天堂| 国产真实乱对白精彩久久| 一区二区免费在线| 国产精品久久久久久妇女6080| 精品国产乱码91久久久久久网站| 欧美日韩中文字幕一区| 97精品国产露脸对白| 国产成人亚洲综合a∨猫咪| 日韩主播视频在线| 一级日本不卡的影视| 18成人在线观看| 中文字幕av一区 二区| 精品日韩成人av| 日韩一区和二区| 91精品在线免费观看| 欧美日韩一区二区三区四区| 色综合激情五月| 欧美中文字幕一二三区视频| 99久久久无码国产精品| 成人免费视频caoporn| 国产91精品露脸国语对白|