摘要:數據庫系統經過近50年的發展,雖然已經普遍商用,但隨著大數據時代的到來,數據庫系統在2個方面面臨挑戰.首先數據量持續增大期望單個查詢任務具有更快的處理速度;其次查詢負載的快速變化及其多樣性使得基于DBA經驗的數據庫配置和查詢優化偏好不能實時地調整為最佳運行時狀態.而數據庫系統的性能優化進入瓶頸期,優化空間收窄,進一步優化只能依托新的硬件加速器來實現,傳統的數據庫系統不能夠有效利用現代的硬件加速器;數據庫系統具有成百個可調參數,面對工作負載頻繁變化,大量繁瑣的參數配置已經超出DBA的能力,這使得數據庫系統面對快速而又多樣性的變化缺乏實時響應能力.當下機器學習技術恰好同時符合這2個條件:應用現代加速器以及從眾多參數調節經驗中學習.機器學習化數據庫系統將機器學習技術引入到數據庫系統設計中.一方面將順序掃描轉化為計算模型,從而能夠利用現代硬件加速平臺;另一方面將DBA的經驗轉化為預測模型,從而使得數據庫系統更加智能地動態適應工作負載的快速多樣性變化.將對機器學習化數據庫系統當前的研究工作進行總結與歸納,主要包括存儲管理、查詢優化的機器學習化研究以及自動化的數據庫管理系統.在對已有技術分析的基礎上,指出了機器學習化數據庫系統的未來研究方向及可能面臨的問題與挑戰.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社。
計算機研究與發展雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創新性,刊載內容涉及的欄目:綜述、計算機技術、計算機網絡、人工智能、計算機軟件、計算機應用等。于1958年經新聞總署批準的正規刊物。