วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

AI613 Class #9 on 19 Jan,2011


Data Warehouse Process and Business Intelligence

Data Warehouse Process
กระบวนการทำงานเริ่มต้นจากการเก็บรวบรวมข้อมูลจากทั้งภายในและภายนอกองค์กร  (Operational and External Data) เพื่อนำมาสร้างเป็น Meta Data ซึ่งเป็นข้อมูลที่ใช้อธิบายข้อมูลที่อยู่ใน Data Warehouse พร้อมๆกับการทำ Data Staging ซึ่งเป็นการจัดระบบข้อมูล ซึ่งประกอบไปด้วยการทำ Extract, Clean, Transform and Load หรือ ECTL  และนำข้อมูลลงใน Data Cube ต่อมาสร้างเป็น Data Warehouse และนำเสนอข้อมูลใน Business View ซึ่งเป็นมุมมองของการใช้เชิงธุรกิจเพื่อนำไปใช้ในการตัดสินใจ โดยอาจเรียกใช้งานผ่าน Dash Board

Data Mart
เป็น Data Warehouse ที่มีขนาดเล็กลงที่เกิดจากการตัดแบ่งข้อมูลตามการใช้งานของ Users โดยแบ่งออกเป็น 2 ประเภท คือ
- Replicated (Dependent) Data Marts เป็นการข้อมูลจาก Enterprise มา replicate
- Stand-alone Data Marts เป็นข้อมูลที่ไม่ได้เกิดจาก Data Warehouse ขององค์กร เนื่องจากองค์กรยังไม่พร้อมในการทำ ซึ่งในอนาคตจะไม่สามารถนำ Data Marts หลายๆอันมารวมเป็น Data Warehouse ขององค์กรได้

Data Cube
เป็น Multidimensional Databases ที่เอาไว้สามารถมองภาพรวมของข้อมูลในหลายมิติได้ และยังนำมาทำ Slice and Dice คือ ตัดแบ่งเลือกข้อมูลที่ต้องการวิเคราะห์ได้ในแต่ละมิติ เพื่อนำไปใช้ได้ง่ายขึ้น นอกจากนี้ยังทำการ Rollups และ Drilldowns ได้อีกด้วย

Business Intelligence
เป็นเครื่องมือในการบริหารสารสนเทศของผู้บริหารระดับสูงในการวิเคราะห์ข้อมูล ซึ่งเป็นการรวมกันของ Architecture, Tools, Database, Applicationsและ Methodologies โดยแบ่งการทำงานออกเป็น
- Reporting and Analysis เป็นการออกรายงานให้กับ Users โดยอาจอยู่ในรูปของ Enterprise Reporting System ซึ่งเป็นรายงานทั้งในรูปแบบปกติ และสามารถปรับได้ตามความต้องการของ Users หรือ Dashboard ที่นิยมใช้ในระดับปฏิบัติการ และนิยมใช้ควบคู่กับ Balance Scorecard ในระดับของผู้บริหาร
- Analytics เป็นการใช้เครื่องมือในการวิเคราะห์ข้อมูล โดยอาจใช้ BPM ซึ่งวัดผลในเชิงกลยุทธ์ เทียบกับข้อมูลใน BI และมี KPI เป็นตัวชี้วัด หรือที่นิยม คือ Online Analytical Processing (OLAP) ที่เป็นการมองข้อมูลให้ลึกเข้าไปเพื่อเห็นประเด็น โดยอาจแสดงในรูปของกราฟ หรือ Multidimensional Data ก็ได้

Data Mining
เป็นการทำให้ข้อมูลนำไปใช้ประโยชน์ในการตัดสินใจได้ ผ่าน Mining Process โดยมี 5 ลักษณะ คือ
1. Clustering เป็นการจัดกลุ่มแบบไม่มีสมมติฐาน
2. Classification เป็นการจัดกลุ่มแบบมีสมมติฐานล่วงหน้า เช่น คุณสมบัติของลูกค้า
3. Association เป็นผลสืบเนื่อง เช่น มีกี่เปอร์เซ็นต์ของลูกค้าที่เปิดบัญชีออมทรัพย์แล้วทำบัตร ATM
4. Sequence Discovery ผลที่เกิดตามหลังมา
5. Prediction นำไป Forecast ต่อ

 Text Mining
เป็นการนำมาใช้กับข้อมูลที่มีลักษณะ Non-structured เช่น ข้อมูล Complain จากลูกค้า

- Data Integration

ปัญญา ยุทธรักษานุกูล  5202112651

ไม่มีความคิดเห็น:

แสดงความคิดเห็น