Databases and Warehousing/Describe a data warehouse.

จาก วิกิตำรา
ไปยังการนำทาง ไปยังการค้นหา

Describe a data warehouse[แก้ไข]


ปัจจุบันองค์กรขนาดกลาง และขนาดใหญ่ จะใช้ Data warehousing เข้ามาเพื่อช่วยสนับสนุนธุรกิจ ส่งผลให้การดำเนินการต่างมีความรวดเร็ว ทั้งในส่วนของการวิเคราห์ะข้อมูล และการ query ข้อมูล

ส่วนใหญ่องค์กรประสบความสำเร็จ เพราะสามารถตอบสนองความต้องการได้อย่างรวดเร็ว รองรับการเปลี่ยนแปลงด้านธุรกิจ และ ทำให้ไม่พลาดในโอกาสทางธุรกิจในหลายๆด้าน โดยหลักการคือ การนำ data และ information มาใช้ให้เกิดประโยชน์สูงสุด ซึ่งเป็นการทำข้อมูลให้ง่ายต่อการเข้าถึง มีประสิทธิภาพ มีความยีดหยุ่น และถูกต้อง ซึ่งกระบวนการวิเคราห์ะนั้นก็สามารถช่วยในด้าน การสนับสนุนการตัิดสินใจได้ ใช้บุคคลากรที่เชี่ยวชาญไม่มากนัก ในการ query และ reporting แต่อาจจะไม่ยืดหยุ่นในหลายเหตุการณ์ ซึ่งอาจจะสามารถแก้ไขได้โดยนำเครื่องมือมาช่วยการทำงาน แต่ Tools นั้นก็จะตอบสนองได้ดีในกลุ่มผู้ใช้งานที่เป็นระดับ users ค่อนข้างชำนาญ หรือ เชี่ยวชาญในด้านฐานข้อมูล ดังนั้น เพื่อแก้ปัญหาดังกล่าว Web base tools ก็จะเป็นทางออก ที่สามารถแก้ไขปัญหาได้ แต่ก็จะมีข้อจำกัดบางอย่าง เช่น กรณีที่ มีข้อมูลมาจากหลายๆ source และมีความแตกต่างกัน ซึ่งจะทำให้ยากต่อการรวบรวมข้อมูลเพื่อนำมาวิเคราห์ะ Data warehousing นำมาสู่การแก้ไขปัญหาต่าง ๆ ข้อจำกัด และรองรับกระบวนการวิเคราะห์ข้อมูล เป็นการเก็บข้อมูลอยู่ในลักษณะหมวดหมู่ รองรับการทำ Data mining, Decession support.

สำหรับกระบวนการสร้างและใช้งาน ข้อมูลต่างๆ จะถูกจัดเก็บแยกตามหน่วยงานที่รับผิดชอบงานนั้นๆ เช่น ข้อมูลของด้านงานขาย ข้อมูลของคลังสินค้า ด้านทรัยากร เข้าสู่กระบวนการนำเข้า Data warehouse จะใช้ software เฉพาะด้านที่ชื่อ ETL (extraction, transformation, and load) จะเป็นข้อมูลที่จำเป็นเท่านั้นและจัดเป็นหมวดหมู่เพื่อให้ง่าย และ รวดเร็วต่อการใช้งาน มีความเป็นมาตรฐาน Data warehouse ได้จัดเตรียม metadata ไ้ว้ ซึ่งเป็นส่วนที่ประกอบด้วย software และข้อมูล รูปของข้อมูล ดัชนี เพื่อให้ง่ายต่อการค้นหาและรองรับเครื่องที่เป็นลักษณะ Web tool.


เราสามารถอธิบายได้คุณลักษณะของ Data warehouse ได้ดังต่อไปนี้[แก้ไข]

  1. Organization ข้อมูลจะถูกจัดเป็นรูปแบบ organized โดย แบ่งเป็นหมวดหมู่ เช่น กลุ่มลูกค้า ผู้ให้บริการ สินค้า ราคา สถานที่ และข้อมูลที่สำคัญเพื่อช่วยในการระบบสนับสนุนการตัดสินใจ
  2. Consistency ข้อมูลในงานด้านฐานข้อมูลที่แตกต่างกัน อาจจะใช้กระบวนการ encode ที่แตกต่างกัน เช่น ข้อมูลที่เกี่ยวกับเพศอาจจะแทนค่าด้วย 0 และ 1 ในระบบฐานข้อมูลหนึ่ง ในอีกระบบอาจใช้เป็น M และ L
  3. Time variant ข้อมูลที่เก็บเป็นเวลานานหลาย ๆ ปี สามารถนำมาใช้ได้โดยการดูจากแนวโน้ม โดยการพยากรณ์ และการเปรียบเทียบ
  4. Nonvolatile เมื่อนำข้อมูลเข้าสู่ warehouse ข้อมูลจะไม่ถูกเปลี่ยแปลงหรือ update
  5. Relational โดยทั่วไป Data warehouse จะเชื่อมโยงด้วยโครงสร้างความสัมพันธ
  6. Client/Server สำหรับ Data warehouse จะใช้สถาปัตยกรรมลักษณะ Client/Server เป็นหลักในการรองรับการ access ข้อมูลโดย user
  7. Web-based ปัจจุบัน Data warehouse ถูกออกแบบให้รองรับการทำงานในลักษณะ Web base application
  8. Integration ข้อมูลที่มีอยู่เดิม หรือที่มีอยู่แล้วสามารถนำมารวบรวมกันได้ และ Web services เ็ป็นเครื่องมือสำหรับรองรับการ Integration
  9. Real time แม้ว่า application ส่วนใหญ่ของ Data warehousing อาจยังไม่ทำงานแบบ real time แต่ในไม่ช้าก็จะสามารถรองรับการทำงาน real time มากขึ้น

สำหรับการเริ่มสร้าง และ ทำการดำเนิการ Data warehousing จะเริ่มค่อยพบปัญหา เนื่องจาก การทำ Data warehousing นั้นเป็นโครงการที่ใหญ่ และค่าใช้จ่ายที่ลงทุนนั้นสูง แต่สิ่งสำคัญนั้น คือ การทำความเข้าใจกับองค์ประกอบหลัก ที่สำคัญต่อการสร้างและใช้งาน เราพอสรุปปัจจัยที่มีผลต่อการนำ Data warehouse มาใช้งานได้ดังต่อไปนี้

  1. สิ่งแรกที่ต้องตอบคำถามคือ ผู้บริหารระดับ หรือ การจัดการ หรือ เครืองในการจัดการรองรับ Data warehousing แล้วหรือไม่
  2. ต่อมาในระดับผู้ปฎิบัติงานมีความรู้และเข้าใจเกี่ยวกับ Data warehousing มากน้อยเพียงใด
  3. ผู้ปฎิบัติงานมีความต้องการเข้าถึงข้อมูลแบ่งออกเป็นกี่ระดับ
  4. ตัองการเครื่องมือช่วยในการวิเคราะห์หรือไม่
  5. ผู้ปฎิบัติงานมีความเข้าใจและเห็นถึงประสิทธิภาพและข้อดีเกี่ยวกับ Data warehousing เข้ามาช่วยแก้ไขปัญหาในด้านธุรกิจอย่างไรบ้าง
  6. ผู้ปฎิบัติงานมีความเข้าใจในเทคโนโลยีที่ช่วยให้การทำงานของเขาให้ดีขึ้น
  7. ในหน่วยงานนั้นมีบุคลากรที่มีความรู้และเข้าใจเกี่ยวกับเทคโนโลยี data warehousing จำนวนมากน้อยขนาดใหน

สถาปัตยกรรมและเครื่องมือที่ใช้พัตนา Data warehouse (Architecture and Tools)[แก้ไข]

Data warehouse นั้นมีพื้นฐานสถาปัตยกรรมอยู่มากมาย แต่โดยทั้วไปจะมี่สองลักษณะ คือ สถาปัตยกรรม Two-Tier และ Three-Tier ซี่งในลักษณะแบบ Three-Tier Architecture ข้อมูลจาก Data warehouse จะทำงานพร้อมกันทั้งสองที่ และจัดเก็บในรูปแบบของ Multidimensional database ซึ่งส่งผลให้ง่ายต่อการวิเคราห์ อีกด้านหนึ่งก็คือจะทำการ Replicate ไปยัง Data mart

โดยทั่วไปมีสองเหตุผลหล้กในการสร้าง Data warehouse แยกมาจากการเก็บข้อมูลแบบเดิม สิ่งแรกคือ ประสิทธิำภาพในการทำ Query ได้ดีกว่า อับดับที่สอง คือ โดยปรกติมันเป็นการยากที่จะสร้างต้นแบบฐานข้อมูลให้สามารถรองรับได้ทั้งเพื่อการดำเนินงาน และเพื่อการวิเคราห์ได้ในขณะเดียวกัน


การนำ Warehouse เข้ามาใช้ภายในองค์กร[แก้ไข]

ในกระบวนการทำงานของ Data warehouse ไปยังผู้ที่ตัดสินใจ ในงานด้าน ๆ สามารถทำงานสำเร็จได้จากภายในองค์กร ซึ่งผู้ปฎิบัติงานสามารถ view, query, และ analyze ข้อมูลไปจนถึงการออกรายงานสามารถใช้เป็น Web browser ในการแสดงผล ซึ่งเหล่านี้เป็นกระบวนการที่ช่วยในเรื่องลดวิธิที่ยุ่งยาก และประหยัดเวลาในแต่ละขั้นตอนต่างๆ


Data warehouse เหมาะสมกับองค์กรในลักษณะใด[แก้ไข]

สำหรับ Data warehouse นั้นส่วนใหญ่จะเหมาะสมกับองค์กรสักษณะใดโดยจะพิจารณาจากสภาวะแวดล้อมดังต่อไปนี้ • มีปริมาณข้อมูลจำนวนมากที่ผู้ปฎิบัติงานจำเป็นต้องเข้าถึง • ในการทำงานเกี่ยวกับข้ัอมูลนั้นถูกจัดเก็บไว้ในระบบที่แตกต่างกัน • การเข้าถึงระบบสารสนเทศ และข้อมูลนั้นอาจถูกใช้อยู่โดยผู้ใช้หลายๆคน • มีข้อมูลจำนวนมากที่จะต้องนำมาวิเคราห์ะและแตกต่างกันด้วยเหตุการณ์หรือหลาย ๆ เงื่อนไข • ข้อมูลเดียวกันแต่ถูกจัดเก็บไว้คนละที่และถูกใช้โดยระบบที่แตกต่างกัน • ข้อมูลถูกจัดเก็บในรูปแบบที่มีความซับซ้อนยากต่อการเข้าถึง ต้องใช้ผู้เชี่ยวชาญในการนำออกมาใข้ • ต้องใช้บุคคลากรหลายคน เพื่อทำงานในแต่ละระบบ หรือส่วนงาน

Questions for Review[แก้ไข]

  1. /List the major sources of data.
  2. /List some of the major data problem.
  3. /What is the terabyte?(Write the number.)
  4. /Review the steps of the data life cycle and explain them.
  5. /List some of the categories of data available on the Internet.
  6. /Define data Quality.
  7. /Define document management.
  8. /Describe the hierarchy of a file management system.
  9. /What are the problems that arise from the file environment?
  10. /Discuss a relational database and how it differs from other databases.
  11. /What are the components of a database of a database management system (DBMS)?
  12. /What is the difference between the conceptual, logical and physical views of data?
  13. /How can you get data out of a database?
  14. /What are the benefits of using a DBMS?
  15. /What is the difference between entities and attributes?
  16. /Describe a data warehouse.
  17. /Describe a datamart.
  18. /Define a marketing transaction database.