Professional Documents
Culture Documents
Lecture 02 Data Warehouses - En.ar
Lecture 02 Data Warehouses - En.ar
com -
2
ﺩﻫﻨﺪﺳﺔ ﻭﺗﺼﻤﻴﻢ ﻣﺴﺘﻮﺩﻋﺎﺕ ATA
"ﻋﻨﺪﻣﺎ ﻳﺘﻮﺳﻊ ﻋﻘﻞ ﺍﻹﻧﺴﺎﻥ ﺑﻔﻜﺮﺓ ﺟﺪﻳﺪﺓ ،ﻓﺈﻧﻪ ﻻ ﻳﺴﺘﻌﻴﺪ ﺃﺑﻌﺎﺩﻩ ﺍﻷﺻﻠﻴﺔ ﺃﺑﺪﺍً".
2.1ﻣﻘﺪﻣﺔ
ﺗﻘﻮﻡﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺑﻤﻌﺎﻟﺠﺔ ﻛﻤﻴﺔ ﻫﺎﺋﻠﺔ ﻣﻦ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺣﻴﺚ ﻳﺰﻳﺪ ﺍﻟﺤﺠﻢ ﺑﺸﻜﻞ ﻛﺒﻴﺮ ﻓﻲ ﺣﺎﻟﺔ ﻗﻮﺍﻋﺪ ﺍﻟﺒﻴﺎﻧﺎﺕ
ﺍﻟﻌﻠﻤﻴﺔ.ﺗﻢ ﺗﺼﻤﻴﻢ ﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺑﻤﺨﻄﻂ ﺍﻟﻨﺠﻤﺔ ﺃﻭ ﻣﺨﻄﻂ ﻧﺪﻓﺔ ﺍﻟﺜﻠﺞ ] .[49ﻳﻤﻜﻦ ﺃﻥ ﺗﺴﺘﻐﺮﻕ ﺍﻻﺳﺘﻌﻼﻣﺎﺕ
ﺍﻟﺘﻲﻳﺘﻢ ﺗﻨﻔﻴﺬﻫﺎ ﻓﻲ ﻣﺨﻄﻂ ﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻗﺪﺭﺍً ﻫﺎﺋﻼ ًﻣﻦ ﺍﻟﻮﻗﺖ ﺑﺴﺒﺐ ﻋﻤﻠﻴﺔ ﺍﻻﻧﻀﻤﺎﻡ ﺑﻴﻦ ﺟﺪﻭﻝ ﺃﺑﻌﺎﺩ ﻭﺍﺣﺪ ﺃﻭ
ﺃﻛﺜﺮﻭﺟﺪﻭﻝ ﺍﻟﺤﻘﺎﺋﻖ .ﻓﻲ ﺃﻧﻈﻤﺔ ﺇﺩﺍﺭﺓ ﻗﻮﺍﻋﺪ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺍﻟﺘﺠﺎﺭﻳﺔ ،ﻳﺘﻢ ﺍﻗﺘﺮﺍﺡ ﺍﻟﻌﺪﻳﺪ ﻣﻦ ﻫﻴﺎﻛﻞ ﺍﻟﺘﺤﺴﻴﻦ ﻟﺘﻘﻠﻴﻞ ﺗﻜﻠﻔﺔ
ﺗﻨﻔﻴﺬﺍﻻﺳﺘﻌﻼﻡ .ﻭﺗﻨﻘﺴﻢ ﻫﺬﻩ ﺍﻟﻬﻴﺎﻛﻞ ﺇﻟﻰ ﻓﺌﺘﻴﻦ ﺭﺋﻴﺴﻴﺘﻴﻦ :ﺍﻟﻬﻴﺎﻛﻞ ﺍﻟﺰﺍﺋﺪﺓ ﻋﻦ ﺍﻟﺤﺎﺟﺔ ﻭﻏﻴﺮ ﺍﻟﺰﺍﺋﺪﺓ ﻋﻦ ﺍﻟﺤﺎﺟﺔ ].[8
ﺝﺣﺪﺙ
ﺗﻌﺪﺍﻟﻔﻬﺎﺭﺱ ﻭﻃﺮﻕ ﺍﻟﻌﺮﺽ ﺍﻟﻤﺎﺩﻳﺔ ﻭﺍﻟﺘﻘﺴﻴﻢ ﺍﻟﺮﺃﺳﻲ ﻫﻴﺎﻛﻞ ﺯﺍﺋﺪﺓ ﻋﻦ ﺍﻟﺤﺎﺟﺔ .ﺗﺘﻤﻴﺰ ﻫﺬﻩ ﺍﻟﻬﻴﺎﻛﻞ ﺑﺎﺭﺗﻔﺎﻉ ﺗﻜﻠﻔﺔ
ﺍﻟﺘﺨﺰﻳﻦﻭﺍﻟﺼﻴﺎﻧﺔ .ﺍﻟﺘﻘﺴﻴﻢ ﺍﻷﻓﻘﻲ ﻭﺍﻟﺘﻘﺴﻴﻢ ﺍﻷﻓﻘﻲ ﺍﻟﻤﺮﺟﻌﻲ ﻭﺍﻟﻤﻌﺎﻟﺠﺔ ﺍﻟﻤﺘﻮﺍﺯﻳﺔ ﻫﻲ ﻫﻴﺎﻛﻞ ﻏﻴﺮ ﺯﺍﺋﺪﺓ ﻋﻦ ﺍﻟﺤﺎﺟﺔ.
ﺗﺘﺠﻨﺐﻫﺬﻩ ﺍﻟﻬﻴﺎﻛﻞ ﺍﺯﺩﻭﺍﺟﻴﺔ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻭﺗﺴﻤﺢ ﺑﺘﻘﻠﻴﻞ ﺗﻜﻠﻔﺔ ﺍﻟﺘﺨﺰﻳﻦ ﻭﺗﻘﻠﻴﻞ ﺗﻜﻠﻔﺔ ﺍﻟﺼﻴﺎﻧﺔ ﺑﺸﻜﻞ ﻛﺒﻴﺮ .ﺍﻟﻌﻤﻞ ﺍﻟﺤﺎﻟﻲ
ﻫﻮﻓﻲ ﻣﺠﺎﻝ ﺗﺼﻤﻴﻢ ﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺍﻟﺬﻱ ﺳﻴﺘﻢ ﻋﺮﺽ ﺍﻷﺳﺎﺳﻴﺎﺕ ﻟﻪ ﺑﻌﺪ ﺫﻟﻚ.
9
ﺍﻟﻔﺼﻞ .2ﻫﻨﺪﺳﺔ ﻭﺗﺼﻤﻴﻢ ﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ
ﻳﻘﻮﻝﺑﻴﻞ ﺇﻧﻤﻮﻥ ،ﺍﻟﻤﻌﺮﻭﻑ ﺑﺄﺑﻮ ﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ":ﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻋﺒﺎﺭﺓ ﻋﻦ ﻣﺠﻤﻮﻋﺔ ﻣﻦ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻣﻮﺟﻬﺔ ﻧﺤﻮ
ﺍﻟﻤﻮﺿﻮﻉﻭﻣﺘﻜﺎﻣﻠﺔ ﻭﻣﺘﻐﻴﺮﺓ ﺯﻣﻨﻴﺎ ًﻭﻏﻴﺮ ﻣﺘﻄﺎﻳﺮﺓ ﻟﺪﻋﻢ ﻋﻤﻠﻴﺔ ﺍﺗﺨﺎﺫ ﺍﻟﻘﺮﺍﺭ ﻓﻲ ﺍﻹﺩﺍﺭﺓ[40]".
• ﻣﻮﺿﻮﻉﺍﻟﻤﻨﺤﻰ:ﻭﺍﻟﻔﻜﺮﺓ ﻫﻲ ﺑﻨﺎء ﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺍﻟﺘﻲ ﺗﺴﺎﻋﺪ ﻋﻠﻰ ﺗﺤﻠﻴﻞ ﺍﻟﺒﻴﺎﻧﺎﺕ .ﻋﻠﻰ ﺳﺒﻴﻞ ﺍﻟﻤﺜﺎﻝ،
ﻟﺘﺤﻠﻴﻞﻣﻜﺎﻟﻤﺎﺕ ﺷﺮﻛﺔ ﺍﺗﺼﺎﻻﺕ ،ﻳﻤﻜﻨﻚ ﺇﻧﺸﺎء ﻣﺴﺘﻮﺩﻉ ﺑﻴﺎﻧﺎﺕ ﻳﺮﻛﺰ ﻋﻠﻰ ﺍﻟﻤﻜﺎﻟﻤﺎﺕ .ﺑﺎﺳﺘﺨﺪﺍﻡ ﻣﺴﺘﻮﺩﻉ
ﺍﻟﺒﻴﺎﻧﺎﺕ،ﻳﻤﻜﻨﻚ ﺍﻹﺟﺎﺑﺔ ﻋﻠﻰ ﺳﺆﺍﻝ ﻣﺜﻞ "ﻣﺎ ﻫﻮ ﺃﻓﻀﻞ ﻭﻗﺖ ﻳﺴﺘﺨﺪﻣﻪ ﺍﻟﻌﻤﻼء ﺍﻟﺸﺒﺎﺏ ﻹﺟﺮﺍء ﺍﻟﻤﻜﺎﻟﻤﺎﺕ؟"
ﻫﺬﻩﺍﻟﻘﺪﺭﺓ ﻋﻠﻰ ﺗﻌﺮﻳﻒ ﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺣﺴﺐ ﺍﻟﻤﻮﺿﻮﻉ ،ﻓﻲ ﻫﺬﻩ ﺍﻟﺤﺎﻟﺔ "ﺍﻻﺳﺘﺪﻋﺎءﺍﺕ" ،ﺗﺠﻌﻞ ﻣﺴﺘﻮﺩﻉ
ﺍﻟﺒﻴﺎﻧﺎﺕﻣﻮﺟﻬﺎً ﻧﺤﻮ ﺍﻟﻤﻮﺿﻮﻉ.
• ﻣﺪﻣﺞ:ﻳﺤﺘﺎﺝ ﺍﻟﺘﻮﺟﻪ ﺍﻟﻤﻮﺿﻮﻋﻲ ﻟﻤﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺇﻟﻰ ﺗﻜﺎﻣﻞ ﺍﻟﺒﻴﺎﻧﺎﺕ .ﻳﺘﻄﻠﺐ ﺍﻟﺘﺮﻛﻴﺰ ﻋﻠﻰ ﺍﻟﻤﻮﺿﻮﻉ ﺃﻥ
ﻳﻘﻮﻡﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺑﺘﺨﺰﻳﻦ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻣﻦ ﻣﺼﺎﺩﺭ ﻣﺨﺘﻠﻔﺔ ﻓﻲ ﺗﻨﺴﻴﻖ ﺛﺎﺑﺖ .ﺗﺘﺠﻨﺐ ﻋﻤﻠﻴﺔ ﺍﻟﺘﻜﺎﻣﻞ ﻣﺸﺎﻛﻞ
ﻣﺜﻞﺗﺴﻤﻴﺔ ﺍﻟﺼﺮﺍﻋﺎﺕ ﻭﺍﻟﺘﻨﺎﻗﻀﺎﺕ.
• ﺗﻐﻴﺮﺍﻟﻮﻗﺖ:ﻓﻲ ﻋﺎﻟﻢ ﺍﻷﻋﻤﺎﻝ ،ﻫﻨﺎﻙ ﺣﺎﺟﺔ ﺇﻟﻰ ﺗﺤﻠﻴﻞ ﻛﻤﻴﺔ ﻫﺎﺋﻠﺔ ﻣﻦ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻭﻓﻘﺎً ﻻﺗﺠﺎﻫﺎﺕ ﺍﻟﻤﺸﺮﻭﻉ ،ﻭﻫﺬﺍ
ﻳﺘﻨﺎﻗﺾﺇﻟﻰ ﺣﺪ ﻛﺒﻴﺮ ﻣﻊ ﺃﻧﻈﻤﺔ ﺍﻟﺘﺸﻐﻴﻞ ،ﺣﻴﺚ ﺗﺘﻄﻠﺐ ﻣﺘﻄﻠﺒﺎﺕ ﺍﻷﺩﺍء ﻧﻘﻞ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺍﻟﺘﺎﺭﻳﺨﻴﺔ ﺇﻟﻰ ﺍﻷﺭﺷﻴﻒ.
ﺇﻥﺗﺮﻛﻴﺰ ﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻋﻠﻰ ﺍﻟﺘﻐﻴﻴﺮ ﺑﻤﺮﻭﺭ ﺍﻟﻮﻗﺖ ﻫﻮ ﺍﻟﻤﻘﺼﻮﺩ ﺑﻤﺼﻄﻠﺢ ﻣﺘﻐﻴﺮ ﺍﻟﻮﻗﺖ.
• ﻏﻴﺮﻣﺘﻄﺎﻳﺮ:ﻻ ﻳﻨﺒﻐﻲ ﺗﻐﻴﻴﺮ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺑﻌﺪ ﺗﺨﺰﻳﻨﻬﺎ ﻓﻲ ﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ .ﺍﻟﻬﺪﻑ ﻫﻮ ﺍﻟﻘﺪﺭﺓ ﻋﻠﻰ ﺗﺤﻠﻴﻞ ﻣﺎ ﺣﺪﺙ.
ﺗﺴﺘﺨﺪﻡﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻧﻤﻮﺫﺝ ﺍﻟﺘﺼﻤﻴﻢ ﺍﻷﺑﻌﺎﺩ ﺑﺪﻻ ًﻣﻦ ﺍﻟﻨﻤﻮﺫﺝ ﺍﻟﻌﻼﺋﻘﻲ ﺍﻟﻤﺴﺘﺨﺪﻡ ﻓﻲ ﻗﻮﺍﻋﺪ ﺍﻟﺒﻴﺎﻧﺎﺕ
ﺍﻟﺘﺸﻐﻴﻠﻴﺔ.ﺍﻟﺘﺼﻤﻴﻢ ﺍﻷﺑﻌﺎﺩ ﻟﻴﺲ ﻣﻔﻴﺪﺍً ﻷﻧﻈﻤﺔ ﺍﻟﺘﺸﻐﻴﻞ ﺑﺴﺒﺐ ﺍﻟﺘﻜﺮﺍﺭ ﻭﻓﻘﺪﺍﻥ ﺍﻟﺘﻜﺎﻣﻞ ﺍﻟﻤﺮﺟﻌﻲ ﻟﻠﺒﻴﺎﻧﺎﺕ .ﻳﺴﺘﺨﺪﻡ
) OLAPﺍﻟﻤﻌﺎﻟﺠﺔ ﺍﻟﺘﺤﻠﻴﻠﻴﺔ ﻋﺒﺮ ﺍﻹﻧﺘﺮﻧﺖ( ﺍﻻﺳﺘﻌﻼﻣﺎﺕ ﺍﻟﻤﻮﺟﻮﺩﺓ ﻓﻲ ﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ ﻭﻳﺴﺘﺨﺪﻡ ) OLTPﻣﻌﺎﻟﺠﺔ
ﺍﻟﻤﻌﺎﻣﻼﺕﻋﺒﺮ ﺍﻹﻧﺘﺮﻧﺖ( ﺍﻻﺳﺘﻌﻼﻣﺎﺕ ﺍﻟﻤﻮﺟﻮﺩﺓ ﻓﻲ ﻗﻮﺍﻋﺪ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺍﻟﺘﺸﻐﻴﻠﻴﺔ .ﻃﺎﻭﻟﺔ 2.1 .ﻳﻠﺨﺺ ﺍﻟﻔﺮﻕ ﺍﻟﺮﺋﻴﺴﻲ
ﺑﻴﻦﻗﻮﺍﻋﺪ ﺍﻟﺒﻴﺎﻧﺎﺕ ﺍﻟﺘﺸﻐﻴﻠﻴﺔ ﻭﻣﺴﺘﻮﺩﻋﺎﺕ ﺍﻟﺒﻴﺎﻧﺎﺕ.
10
.2.3ﻣﻜﻌﺐ ﺍﻟﺒﻴﺎﻧﺎﺕ
ﻣﻠﻔﺎﺕ
ﺇﻋﺪﺍﺩﺍﻟﺘﻘﺎﺭﻳﺮ
ﺍﻟﺒﻴﺎﻧﺎﺕﺫﻛﻴﺔ
OLAP
ﻣﺴﺘﻮﺩﻉﺍﻟﺒﻴﺎﻧﺎﺕ ﺇﻳﺘﻞ
ﺍﻟﺒﻴﺎﻧﺎﺕﺫﻛﻴﺔ
ﺍﻟﺘﻘﺎﺭﻳﺮ
ﺑﻴﺎﻧﺎﺕﺍﻟﺘﻌﺪﻳﻦ
ﻗﻮﺍﻋﺪﺑﻴﺎﻧﺎﺕ
ﺍﻟﺒﻴﺎﻧﺎﺕﺫﻛﻴﺔ
ﺇﺣﺼﺎﺋﻴﺎﺕ
ﺗﺤﻠﻴﻞ ﻣﺪﻳﺮﻣﺴﺘﻮﺩﻉ ﺍﻟﺒﻴﺎﻧﺎﺕ
2.3ﻣﻜﻌﺐ ﺍﻟﺒﻴﺎﻧﺎﺕ
ﻳﺘﻢﺩﻋﻢ ﺍﻟﻌﻤﻠﻴﺔ ﺍﻟﺘﺤﻠﻴﻠﻴﺔ ﻋﺒﺮ ﺍﻹﻧﺘﺮﻧﺖ ) (OLAPﺑﻮﺍﺳﻄﺔ ﻧﻤﻮﺫﺝ ﺑﻴﺎﻧﺎﺕ ﻣﺘﻌﺪﺩ ﺍﻷﺑﻌﺎﺩ ﻳﺴﻤﻰ ﻣﻜﻌﺐ ﺍﻟﺒﻴﺎﻧﺎﺕ ).(DC
DCﻋﺒﺎﺭﺓ ﻋﻦ ﺗﺠﺮﻳﺪ ﻟﻠﺒﻴﺎﻧﺎﺕ ﻳﻮﻓﺮ ﻋﺮﺿﺎً ﻣﺠﻤﻌﺎً ﻟﻠﺒﻴﺎﻧﺎﺕ ﻣﻦ ﻣﻨﻈﻮﺭ ﻣﺎ .ﻳﺘﻜﻮﻥ DCﻣﻦ ﺍﻷﺑﻌﺎﺩ ﻭﺍﻟﻤﻘﺎﻳﻴﺲ .ﺃﺑﻌﺎﺩ
11