本文作者:HDS中國區域技術總監 于希國
隨著大數據在醫療與生命科學研究過程中的廣泛應用和不斷擴展,其數量之大和種類之多令人難以置信。比如:一個CT圖像含有大約150MB的數據,而一個基因組序列文件大小約為750MB, 一個標準的病理圖則大得多,接近5 GB。如果將這些數據量乘以人口數量和平均壽命,僅一個社區醫院或一個中等規模制藥企業就可以生成和累積達數個TB甚至數個PB級的結構化和非結構化數據。
在中國,2010年,國家公布的“十二五”規劃中指出要重點建設國家級、省級和地市級三級衛生信息平臺,建設電子檔案和電子病歷兩個基礎數據庫等諸項目標,也就是推進醫療信息化的“3521”工程。過去由于缺少統一的電子病歷系統(EMR)標準,中國的電子病歷系統發展比較緩慢,醫院之間不能實現共享病患信息共享,醫療服務水平也因此受到影響。為改善這一現狀,國家會逐漸加大對電子病歷的投入,適應這一趨勢,各級醫院也將加大在數據中心,IT外包等領域的投入。而隨著醫療信息數據的幾何倍數增長,醫院信息存儲將越來越受到重視,醫療信息中心的關注點也將由傳統“計算”領域轉移到“存儲”領域上來。
有“弊”就有“利”
對于許多醫療和生命科學機構而言,努力控制大數據造成的呈螺旋上漲的成本、復雜性和風險已經成為一個至關重要的問題。然而,從另一個角度來看,醫療大數據能夠帶來的收益要遠遠超出管理它們的成本,如開放新的具有醫療價值的信息源、提高診斷準確性和速度、預測疾病和健康形態,以及取得生命科學創新的不同見解。美國管理咨詢公司麥肯錫全球研究院(MGI)預測,如果美國的醫療行業能夠有效利用不斷增長的大數據來提高效率和質量,那么每年可創造超過3000億美元的額外價值。而且,在歐洲的發達國家中,僅在提高運行效率一項上,政府行政管理部門就可以利用大數據節省1000億歐元以上的費用。
對于大多數成功的醫療機構來說,利用大數據已經成為提高生產力、改進護理水平、增強競爭力、加快增長和創新的關鍵策略。那么,我們該如何在兩方面進行平衡,實現可觀的效果和利潤呢?
答案存在于數據經濟學中,即如何使從數據中獲取價值的成本低于數據能產生的效益?如果我們能夠有效地將數據存儲、處理和保護成本降至最低,然后利用尖端技術將數據轉化成支持臨床需要與業務增長的可執行信息,我們就能實現最高的數據經濟效益。
醫療大數據的挑戰
然而,如何有效地將大數據存儲成本降至最低,是企業和IT領導者,尤其是內容驅動的醫療和生命科學企業面臨的根本性挑戰。因為除了數據數量和形態的迅速增加,醫療數據還需要越來越長的保留期。患者的病歷可能需要保存70或80年,甚至更長。許多情況下,病歷還必須以原始格式永久保存,以滿足法規遵從的要求。同樣,生命科學研究機構有選擇性的選擇價值足以保留和維護數十年的數據,以期為新研究提供依據。
另外,許多醫療與生命科學研究機構在竭力應對資源緊張、持續的業務增長和新醫療技術帶來的挑戰。事實上,存儲消費速度加快,存儲資產未得到充分利用,對空間的持續需求以及動力和冷卻成本的增加,都推動了總體擁有成本的不斷攀升。而且,一旦存儲系統的安全性出現問題,導致醫療數據丟失,醫院會面臨更嚴重的局面。對于研究機構來說,數據存取是創新和競爭力的核心。這樣看來,文件數據不斷增長導致的管理成本提升被認為是當今全球5000強公司面臨的五大難題之一,這種結論就不足為奇了。 2
醫療行業應對大數據的理想基礎架構
要實現最高數據經濟效益,關鍵是能夠對包括結構性數據和非結構性數據在內的所有醫療大數據進行集成,實現集中管理和更好的資源配置。為了整合醫院不同部門或不同生命科學系統的大數據,實現最充分的信息搜索和共享,理想的存儲架構必須是一個適用塊數據、文件和內容的集成系統,并且擁有強大的容量、性能和吞吐量,在處理、移動和訪問多個大型數據集和大量數據(數量常常達到數個TB甚至是PB)時能夠保持運行的一致性。為了盡量降低存儲成本并滿足臨床業務需要,理想的存儲架構還必須支持臨床創新的數據互操作性,必須能夠智能分層,根據訪問頻率、臨床價值和實際存儲成本自動完成數據分布。這種動態分層功能有助于進一步提高容量利用和資源配置水平,從而全面優化存儲資源的成本效率。
HDS文件和內容解決方案
HDS文件和內容解決方案由Hitachi Content Platform、Hitachi NAS Platform,、Hitachi Data Discovery Suite 以及Hitachi Data Ingestor組成,可以滿足在醫療和生命科學研究領域中存儲、管理、保護和搜索各類數據最嚴苛的要求,無論這些數據是pdf文件、醫學影像還是病患人口數據。另外,Hitachi Clinical Repository(HCR)為管理業務和健康數據、固定內容和圖像,應對DICOM/HL7數據讀取、數據整合、數據挖掘和數據分布這些獨特挑戰而設計的。它由Hitachi Content Platform(HCP)和DICOM/HL7網關組成,可基于HDS平臺、客戶解決方案或合作伙伴的應用平臺使用。這些解決方案所具有的獨特功能包括:
集成存儲 – 文件、內容和塊服務在單一管理界面中融合。通過跨平臺創建存儲池和利用虛擬化,客戶可以簡化管理,提高利用水平,并恢復或延長現有資產的使用壽命。
智能分層 – 動態分層存儲架構通過預定義存儲層、數據索引和制定自動將數據遷移到對應層的策略管理基于文件的數據(如pdf文件或醫學影像)。通過自動將活躍數據遷移到適當的平臺,你可以優化磁盤要求【例如:在低成本的SATA硬盤里存儲更多數據,同時減少在費用高昂的光纖通道、SAS或固態硬盤(SSD)上存儲數據】。這一策略根據精確的業務運行需求管理內容,不僅使文件和內容存儲更有效更加智能化,還提高了整個存儲系統的成本效率。
存儲優化 – 動態分層使閑置容量可以輕松得到再利用,重新確定現有資產用途以延長使用壽命,并自動將非活躍數據遷移到具有復制功能的內容倉庫。這使容量效率和利用率達到最大化,同時可以減少備份卷,并且能夠優化存儲資產的投資回報率。
內容感知搜索 – 本地自動感知能力可以識別所存儲數據的相關性。對使用單一接口的多種資源還可以進行聯合查詢,以便搜索數據并提供索引。內容感知搜索實現了文件和內容服務的真正同化,以滿足法律監管和企業要求,并可以管理內容引發的遷移和其他整體數據活動。
低成本存儲 – 通過集中建立存儲池、跨系統智能擴展和利用動態分層自動完成數據遷移,減少了管理節點,提高了存儲資產的使用經濟效率,也降低了對硬件的要求。管理、備份、容量規劃、動力和冷卻成本隨之降低,這些使固定資本(CAPEX)和 運營成本(OPEX)都大大降低。事實上,已經有數據證明HDS文件和內容解決方案最高可節省25%的管理成本和60%的備份成本。
邊緣到核心存儲 - 中心醫院還可以選擇為偏遠的醫療中心提供無縫的邊緣到核心的數據訪問支持,增強臨床醫師間的協作,通過進行有效控制來實現免備份存儲。
HDS文件和內容解決方案旨在幫助相關機構管控好大數據環境,利用統一、可擴展的管理平臺簡化大數據存儲復雜性、整合資源促進利用,調動數據以滿足業務需求,改進數據保護以提高合規性水平并降低風險。目前,包括江蘇省人民醫院、武漢市普愛醫院、無錫第二醫院 、中山大學附屬第一醫院、鄭州大學附屬第一醫院以及南京東南大學附屬中大醫院等在內的國內眾多醫療機構均已采用了HDS的相關解決方案。這些解決方案的目的是通過將可豐富企業價值、提高效率和競爭力的數據轉化為可執行的信息,最終從根本上使醫療與生命科學機構能夠實現最佳的數據經濟效益。