วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

AI613 Class #9 on 19 Jan,2011


Data Warehouse Process and Business Intelligence

Data Warehouse Process
กระบวนการทำงานเริ่มต้นจากการเก็บรวบรวมข้อมูลจากทั้งภายในและภายนอกองค์กร  (Operational and External Data) เพื่อนำมาสร้างเป็น Meta Data ซึ่งเป็นข้อมูลที่ใช้อธิบายข้อมูลที่อยู่ใน Data Warehouse พร้อมๆกับการทำ Data Staging ซึ่งเป็นการจัดระบบข้อมูล ซึ่งประกอบไปด้วยการทำ Extract, Clean, Transform and Load หรือ ECTL  และนำข้อมูลลงใน Data Cube ต่อมาสร้างเป็น Data Warehouse และนำเสนอข้อมูลใน Business View ซึ่งเป็นมุมมองของการใช้เชิงธุรกิจเพื่อนำไปใช้ในการตัดสินใจ โดยอาจเรียกใช้งานผ่าน Dash Board

Data Mart
เป็น Data Warehouse ที่มีขนาดเล็กลงที่เกิดจากการตัดแบ่งข้อมูลตามการใช้งานของ Users โดยแบ่งออกเป็น 2 ประเภท คือ
- Replicated (Dependent) Data Marts เป็นการข้อมูลจาก Enterprise มา replicate
- Stand-alone Data Marts เป็นข้อมูลที่ไม่ได้เกิดจาก Data Warehouse ขององค์กร เนื่องจากองค์กรยังไม่พร้อมในการทำ ซึ่งในอนาคตจะไม่สามารถนำ Data Marts หลายๆอันมารวมเป็น Data Warehouse ขององค์กรได้

Data Cube
เป็น Multidimensional Databases ที่เอาไว้สามารถมองภาพรวมของข้อมูลในหลายมิติได้ และยังนำมาทำ Slice and Dice คือ ตัดแบ่งเลือกข้อมูลที่ต้องการวิเคราะห์ได้ในแต่ละมิติ เพื่อนำไปใช้ได้ง่ายขึ้น นอกจากนี้ยังทำการ Rollups และ Drilldowns ได้อีกด้วย

Business Intelligence
เป็นเครื่องมือในการบริหารสารสนเทศของผู้บริหารระดับสูงในการวิเคราะห์ข้อมูล ซึ่งเป็นการรวมกันของ Architecture, Tools, Database, Applicationsและ Methodologies โดยแบ่งการทำงานออกเป็น
- Reporting and Analysis เป็นการออกรายงานให้กับ Users โดยอาจอยู่ในรูปของ Enterprise Reporting System ซึ่งเป็นรายงานทั้งในรูปแบบปกติ และสามารถปรับได้ตามความต้องการของ Users หรือ Dashboard ที่นิยมใช้ในระดับปฏิบัติการ และนิยมใช้ควบคู่กับ Balance Scorecard ในระดับของผู้บริหาร
- Analytics เป็นการใช้เครื่องมือในการวิเคราะห์ข้อมูล โดยอาจใช้ BPM ซึ่งวัดผลในเชิงกลยุทธ์ เทียบกับข้อมูลใน BI และมี KPI เป็นตัวชี้วัด หรือที่นิยม คือ Online Analytical Processing (OLAP) ที่เป็นการมองข้อมูลให้ลึกเข้าไปเพื่อเห็นประเด็น โดยอาจแสดงในรูปของกราฟ หรือ Multidimensional Data ก็ได้

Data Mining
เป็นการทำให้ข้อมูลนำไปใช้ประโยชน์ในการตัดสินใจได้ ผ่าน Mining Process โดยมี 5 ลักษณะ คือ
1. Clustering เป็นการจัดกลุ่มแบบไม่มีสมมติฐาน
2. Classification เป็นการจัดกลุ่มแบบมีสมมติฐานล่วงหน้า เช่น คุณสมบัติของลูกค้า
3. Association เป็นผลสืบเนื่อง เช่น มีกี่เปอร์เซ็นต์ของลูกค้าที่เปิดบัญชีออมทรัพย์แล้วทำบัตร ATM
4. Sequence Discovery ผลที่เกิดตามหลังมา
5. Prediction นำไป Forecast ต่อ

 Text Mining
เป็นการนำมาใช้กับข้อมูลที่มีลักษณะ Non-structured เช่น ข้อมูล Complain จากลูกค้า

- Data Integration

ปัญญา ยุทธรักษานุกูล  5202112651

วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

AI613 Class #8 on 12 Jan,2011


Data Management
ระบบ (System) มีกระบวนการทำงาน คือ Input ผ่าน Process ออกมาเป็น Output แต่ต้องมีการกำหนดวัตถุประสงค์ขึ้นมาก่อนว่าจะทำเพื่ออะไร ซึ่งการที่เราต้องการ Output ที่แตกต่างกันนั้น ส่งผลให้เราต้องใช้ Input และมี Process ที่แตกต่างกัน นอกจากนี้ยังมีองค์ประกอบอื่นคือสิ่งแวดล้อม ขอบเขต การควบคุมและผลย้อนกลับและระบบย่อย
ระบบสารสนเทศ (Information System) เป็นระบบที่ทำหน้าที่ในการรวบรวมข้อมูลเพื่อนำมาประมวลผล วิเคราะห์เพื่อสร้างสารสนเทศสำหรับวัตถุประสงค์เฉพาะด้าน และนำเสนอสารสนเทศให้กับผู้ที่ต้องการ ซึ่งต้องเป็นผู้ที่มีสิทธิได้รับสารสนเทศ รวมทั้งการจัดเก็บและบันทึกข้อมูลที่นำเข้ามาสู่ระบบไว้เพื่อการใช้งานในอนาคต หรืออาจกล่าวได้ว่าระบบสารสนเทศ คือระบบที่สร้างสารสนเทศแต่ก็มีรูปแบบที่แตกต่างกันโดย Output ที่ออกมาจะอยู่ในรูปแบบที่แตกต่างกัน เช่น รายงาน กราฟ ตัวอย่างเช่น www.amazon.com โดยแบ่งได้เป็น 3 ประเภท คือ
-         Transaction Processing System
-         Decision Support System
-         Executive Support System
และจากการที่ระบบสารสนเทศต้องมีการบันทึกจัดเก็บข้อมูลนั้น จึงต้องมีการจัดการข้อมูล หรือ Data Management ที่ดีนั่นเอง ซึ่งมีพื้นฐาน 3 ประการ คือ Security, Quality และ Integrity โดยสามารถทำได้โดย Data Profiling, Data Quality Management, Data Integration และ Data Augmentation
โดยกระบวนการของการจัดการข้อมูลนั้นจะเริ่มจากแหล่งข้อมูลทั้งจากแหล่ง Internal, External และข้อมูลที่พนักงานใช้ เก็บไว้ใน Database ซึ่งกระบวนการนี้ต้องอาศัย Transaction Processing System ที่ถูกต้องและครบถ้วน ส่วน Data Warehouse ได้ถูกสร้างขึ้นเพื่อวัตถุประสงค์ในการ Analytical Processing ซึ่งเป็นการนำเอา Attributes ที่ต้องการใช้จาก Database มาเก็บไว้ใน Data Warehouse ซึ่งควรมีลักษณะ ดังนี้
1. Organization
2. Consistency
3. Time variant
4. Non-volatile
5. Relational
6. Client/Server
ซึ่งลักษณะขององค์กรที่เหมาะที่จะมี Data warehouse นั้นควรมีข้อมูลเป็นจำนวนมากที่ Operational Data ถูกจัดเก็บอยู่ในคนละระบบ หรือมีเทคนิคในการจัดเก็บที่สูง เป็นต้น