要想在Python項目中使用MongoDB數(shù)據(jù)庫,需要在Python標準庫的基礎上添加對MongoDB的支持。截止到目前,常用的開發(fā)MongoDB的包為PyMongo。下面將針對PyMongo的相關內容進行詳細介紹。查看全文>>
目前比較流行的ETL工具有Pantlo Kertle、Howk、lormi PowerCene及DataStage,對這些工具的介紹如下。查看全文>>
數(shù)據(jù)的清洗轉換是指將抽取到的數(shù)據(jù)源表中的數(shù)據(jù),根據(jù)數(shù)據(jù)倉庫系統(tǒng)模型的要求進行數(shù)據(jù)的清洗、轉換等操作,保證來自不同系統(tǒng)、不同格式數(shù)據(jù)的一致性和完整性,并且要按照業(yè)務要求加載到目標表。數(shù)據(jù)的清洗轉換是ETL中最復雜的部分,主要任務是過濾掉不符合要求的數(shù)據(jù)。不符合要求的數(shù)據(jù)主要是有不完整的數(shù)據(jù)、錯誤的數(shù)據(jù)、重復的數(shù)據(jù)三大類。查看全文>>
數(shù)據(jù)的加載是ETL的最后一個階段,它的主要任務是將數(shù)據(jù)從臨時數(shù)據(jù)表或文件中加載到指定的數(shù)據(jù)倉庫中。-般來說,可以通過編寫sQL語句和利用加載工具將數(shù)據(jù)加載到數(shù)據(jù)倉庫中。查看全文>>
瀏覽器通過 WSGI 請求動態(tài)資源的過程可分為以下7個步驟:查看全文>>