วันจันทร์ที่ 23 กุมภาพันธ์ พ.ศ. 2558

Data Warehouse (1) : Data Warehouse คืออะไร?

Data Warehouse (1)

Data Warehouse คืออะไร?


Data Warehouse เป็นระบบคอมพิวเตอร์ในรูปแบบนึง ซึ่งมีวัตถุประสงค์เพื่อรวบรวมข้อมูลจากระบบต่างๆ ขององค์กร เพื่อนำมาใช้ประโยชน์ในการออกรายงาน (report) และวิเคราะห์ข้อมูล โดยปกติแล้วเราจะเห็นระบบ Data Warehouse ในองค์กรที่มีขนาดใหญ่ โดย Data Warehouse ก็จะเป็นศูนย์รวมข้อมูลจากระบบงานต่างๆ เช่น ร้านขายของ อาจจะมีระบบหลายๆ ระบบ เช่น ระบบ stock สินค้า ที่เก็บจำนวนสินค้าที่อยู่ในคลังสินค้า, ระบบ point of sale (หรือ POS) ที่ทำการบันทึกข้อมูลเวลาลูกค้าซื้อของจากร้านค้า, ระบบที่จัดการการขายของบนเวปไซต์ (e-commerce) เป็นต้น ซึ่งระบบเหล่านี้เป็นระบบในรูปแบบที่เป็น operational system คือ ออกแบบมาเพื่อทำงานใดงานหนึ่งโดยเฉพาะเจาะจง ไม่ได้ถูกออกแบบมาเพื่อวิเคราะห์ข้อมูล (ในภาพรวม) ขององค์กร

Data Warehouse ดียังไง? : ประโยชน์ของ Data Warehouse


1. เป็นแหล่งรวมข้อมูลของทั้งองค์กร - อยากได้ข้อมูลอะไรก็มาหาจากที่นี่


โดยปกติแล้วระบบ Data Warehouse ขององค์กรก็จะมีการรวบรวมข้อมูลจากระบบ operational system ต่างๆ ในองค์กรเพื่อนำมาสร้างเป็น report หรือ นำมาใช้สำหรับการวิเคราะห์ข้อมูล เช่น จากตัวอย่าง ถ้าร้านขายของดังกล่าวมีการนำระบบ Data Warehouse มาใช้ ก็จะสามารถวิเคราะห์ข้อมูลการซื้อสินค้าของลูกค้าได้อย่างครบถ้วนมากขึ้น เช่น จากเดิมถ้าวิเคราะห์แบบแยกระบบก็จะเห็นการซื้อสินค้าของลูกค้าผ่านทางหน้าร้านอย่างเดียว หรือจากทางเวปไซต์อย่างเดียว แต่ถ้าเรานำระบบ Data Warehouse มาใช้ ก็จะสามารถวิเคราะห์ข้อมูลการซื้อสินค้าของลูกค้าได้อย่างครบถ้วนไม่ว่าจะเป็นจากทางหน้าร้าน หรือผ่านทางเวปไซต์ก็ตาม

ในอนาคตถ้ามี user ต้องการข้อมูลอะไรก็ตามขององค์กร ก็สามารถเข้าถึงข้อมูลทั้งหมดผ่านทาง Data Warehouse ได้ ซึ่งนอกจากจะสะดวกแล้ว ยังมีประโยชน์อื่นๆ อีก เช่น มองข้อมูลได้ครบถ้วน รอบด้าน (จากตัวอย่างข้างต้น), ได้ข้อมูลที่ถูกต้องและชัดเจน (เช่น โดยปกติแต่ละแผนกอาจจะมีวิธีการคำนวนค่าต่างๆ ต่างกัน เช่น Sales Amount, Profit เป็นต้น แต่เมื่อเรานำข้อมูลจากระบบ หรือ แผนกต่างๆ มาไว้ที่ Data Warehouse แล้ว ข้อมูลทั้งหมดจะต้องถูกคำนวนด้วยสูตร หรือวิธีเดียวกัน เพื่อให้ข้อมูลที่ดึงจาก Data Warehouse มีความถูกต้องและชัดเจน)

2. เก็บข้อมูลย้อนหลัง - สามารถเก็บข้อมูลตามความจริงในช่วงเวลานั้นๆ


โดยปกติแล้ว Data Warehouse ก็จะถูกออกแบบสำหรับเก็บข้อมูลย้อนหลังเป็นช่วงเวลานานๆ เช่น 6 เดือน, 1 ปี, 5 ปี หรือนานกว่านั้นก็สามารถทำได้ เพื่อนำมาใช้ในการวิเคราะห์ แต่ลักษณะพิเศษอย่างนึงของ Data Warehouse ก็คือ มันถูกออกแบบมาเพื่อให้เก็บข้อมูลเพื่อใช้ในการวิเคราะห์ แม้ว่าจะเป็นข้อมูลในอดีตก็ตาม เช่นยกตัวอย่างคือ ถ้านาย A เป็นลูกค้าของร้านขายของเรามาอย่างยาวนาน ในอดีตนาย A เป็นนักศึกษามหาวิทยาลัย ซึ่งมีพฤติกรรมการซื้อของใช้ประเภทขนม และน้ำอัดลมเยอะ แต่หลังจากนั้นเมื่อนาย A ได้เริ่มทำงาน มีอาชีพเป็นพนักงานบริษัท นาย A ได้เปลี่ยนแปลงพฤติกรรมการซื้อของตัวเองเป็นซื้ออาหารเพื่อสุขภาพมากขึ้น แต่โดยปกติแล้วระบบ operational system ต่างๆ จะเก็บเฉพาะข้อมูลปัจจุบัน และไม่มีการเก็บข้อมูลในอดีตไว้ ทำให้เมื่อเรามาวิเคราะห์ข้อมูลของลูกค้าที่เป็นพนักงานบริษัท ณ เวลาปัจจุบัน อาจจะเข้าใจผิดคิดว่าลูกค้าลักษณะนี้มีพฤติกรรมที่ชอบซื้อขนม และน้ำอัดลม เป็นต้น

อย่างไรก็ตาม ถ้าเป็น Data Warehouse แล้ว ตัว Data Warehouse จะมีการออกแบบเพื่อเก็บข้อมูลที่มีการเปลี่ยนแปลงนี้ไว้ ทั้งข้อมูลในอดีตและปัจจุบัน ทำให้เราสามารถเข้าใจลูกค้าได้แม่นยำมากขึ้น เช่น ในกรณีนี้ก็จะเข้าใจได้ว่า ลูกค้าที่เป็นนักศึกษามหาวิทยาลัยนิยมซื้อสินค้าประเภทขนม และน้ำอัดลม ส่วนลูกค้าประเภทพนักงานบริษัทนิยมซื้ออาหารเพื่อสุขภาพ เป็นต้น


3. ความรวดเร็วในการ query (ดึงข้อมูล) - ระบบถูกออกแบบมาเพื่อรองรับการ query เป็นหลัก


ระบบ Data Warehouse นั้น จะถูกออกแบบด้วยวิธีการที่เรียกว่า Dimensional Modeling ซึ่งการออกแบบนี้จะต่างจากแนวคิดในการออกแบบของระบบ operational system เนื่องจาก Data Warehouse นั้นโดยวัตถุประสงค์ของการทำงาน จะถูกออกแบบมาเพื่อรองรับการทำงานในลักษณะ query เป็นส่วนใหญ่ ทำให้การ query ข้อมูลจาก Data Warehouse จะมีความเร็วมากกว่าการ query ข้อมูลจากระบบ operational system



ไม่มีความคิดเห็น:

แสดงความคิดเห็น