บทที่ 5 : 5.2หลักการและความหมายฐานข้อมูล
5.2หลักการและความหมายฐานข้อมูล บทที่ ๕
ฐานข้อมูลในระบบสารสนเทศภูมิศาสตร์
๕.๒ หลักการและความหมายฐานข้อมูล
๕.๒.๑ นิยามข้อมูล
ในทางทฤษฎีได้มีการให้ความหมายของคำว่า ข้อมูล (Data) ข่าวสาร(News) ข้อมูลสารสนเทศ (Information) โดยนัยจะมีความหมายที่ต่างกัน
ข้อมูล (Data) หมายถึงข้อเท็จจริงต่างๆ ที่มีอยู่ในโลกนี้ใช้แทนด้วยตัวเลข ภาษา หรือสัญลักษณ์ที่ยังไม่มีการปรุงแต่งหรือประมวลผลใดๆ อาจจะแบ่งข้อมูลได้เป็น 3 ประเภท คือ
1. ข้อเท็จจริงที่เป็นจำนวน ปริมาณ ระยะทาง
2. ข้อเท็จจริงที่ไม่เป็นตัวเลข เช่น ชื่อ ที่อยู่ สถานภาพ ประวัติการศึกษา
3. ข่าวสารที่ยังไม่ได้ประเมิน เช่น รายงาน บันทึก คำสั่ง ระเบียบ กฎหมาย และเหตุการณ์หรือสถานการณ์ต่างๆ
แหล่งข้อมูลที่จะได้มานั้น หรือแหล่งต้นตอของข้อมูลเรียกว่า แหล่งปฐมภูมิ (Primary Source) เช่นการไปเก็บรวบรวมข้อมูลจำนวนประชากรวัยทำงานในจังหวัดลพบุรี ส่วนแหล่งข้อมูลที่ผู้อื่นรวบรวมไว้แล้วเรียกว่า แหล่งทุติยภูมิ (Secondary source) เช่น การไปเก็บข้อมูลจำนวนครัวเรือนในเขตเทศบาลจากอำเภอที่ได้รวบรวมไว้แล้วว่าทั้งหมู่บ้านหรือตำบลมีกี่ครัวเรือน เป็นต้น ลักษณะของข้อมูลที่เก็บมาทั้งจากแหล่งปฐมภูมิและทุติยภูมิ อาจเป็นได้ทั้งข้อมูลเชิงปริมาณและข้อมูลเชิงคุณภาพ
๕.๒.๒ นิยามข้อมูลสารสนเทศ
ข้อมูลสารสนเทศ (information) อาจจะเป็นอะไรก็ได้ที่เชื่อว่าเป็นระบบที่สำคัญต่อการให้ความสะดวกต่อองค์กร หรืออาจจะกล่าวได้ว่า มันเป็นสิ่งจำเป็นอย่างยิ่งต่อกระบวนการตัดสินใจที่เกี่ยวข้องกับการจัดการกับเรื่องต่างๆ ในองค์กร
ข้อมูลสารสนเทศ (Information) หมายถึง ข้อมูลที่ได้ถูกกระทำให้มีความสัมพันธ์หรือมีความหมายนำไปใช้ประโยชน์ได้ตามวัตถุประสงค์ของผู้ใช้งานหรือหน่วยงาน
รูปที่ 5.1 หลักการของข้อมูลสารสนเทศ
ข้อมูลสารสนเทศจึงเป็นการนำข้อมูลที่รวบรวมได้จากการสำรวจพื้นที่หรือการสัมภาษณ์ชุมชน แล้วนำข้อมูลที่ได้นำมาผ่านการเปลี่ยนแปลงโดยการนำข้อมูลตั้งแต่ 2 ตัวขึ้นไปที่มีความเกี่ยวข้องกันมาจัดกระทำหรือประมวลผล เพื่อให้มีความหมายหรือมีคุณค่าเพิ่มขึ้นตามวัตถุประสงค์การใช้ เช่น เมื่อมีความต้องการรู้ว่า จำนวนโรงพยาบาลหรือสถานพยาบาลในชนบท 1 แห่ง จะต้องรองรับจำนวนประชาชนในบริเวณที่ใกล้เคียงจำนวนเฉลี่ยกี่คน ฉะนั้นการจะมีข้อมูลสารสนเทศได้นั้น จะต้องมีข้อมูลดิบก่อน และข้อมูลกับข้อมูลสารสนเทศจะมีความเกี่ยวข้องกัน มีความสำคัญและใช้ประโยชน์ด้วยกัน
ฉะนั้นข้อมูลที่มีความเหมายเกี่ยวเนื่องเชื่อมโยงหรือตอบสนองกับเป้าหมายหรือวัตถุประสงค์อะไรบางอย่างก็สามารถเรียกได้ว่าข้อมูลสารสนเทศ (information) เช่น มีข้อมูล (Data) ว่าด้วยปริมาณรถยนต์ที่สี่แยกไฟแดงหนึ่งอยู่ 2,000 ข้อมูล อย่างนี้ก็เป็นเพียงข้อมูลธรรมดาๆ แต่ถ้าข้อมูลนี้เชื่อมโยงเกี่ยวข้องกับเวลาต่างๆ เช่น 9:00 มีปริมาณรถยนต์ผ่านแยกไฟแดงนาทีละ 12 คัน 9:01 นาทีละ 15 คัน… อย่างนี้ไปทั้งสิ้น 2,000 ชุด เราก็สามารถตั้งโจทย์ว่า ถ้าเป้าหมายเราต้องการแก้ไขปัญหาการจราจรที่สี่แยกนี้ ข้อมูลที่ว่าจะแปรสภาพไปเป็น information
เรามี Information ดังกล่าวอยู่ในมือ ลองมาพิจารณาดูแล้ว ก็จะเกิดความเข้าใจ ชุดข้อมูลนี้ เช่น รถมากช่วงเวลาใด มาจากด้านไหน มีสัดส่วนอย่างไร สิ่งที่เราได้ก็คือ ความเข้าใจในปัญหา เหตุที่เกิดปัญหา ซึ่งถ้าเรามี Information หลายๆ ประเด็น คือมีข้อมูลหลากหลาย และนำมาสัมพันธ์กัน ก็จะทำให้เรายิ่งเข้าใจปัญหามากขึ้น
เมื่อเราเข้าใจถึงปัญหาแล้วสามารถถ่ายทอดให้ตัวเองและผู้อื่นเข้าใจได้อย่างถ่องแท้แล้ว ปัญญาก็จะเกิด พอเกิดปัญญาแตกฉานในปัญหา รู้เหตุที่มาที่ไป ให้ใครต่อใครเข้าใจและรู้แจ้งเท่าทันปัญหานั้น แล้วนำปัญญาไปใช้ในการปฏิบัติต่อ ถ้าทำงานด้วยปัญญา งานก็สัมฤทธิผล มีประสิทธิผล ข้อมูลสารสนเทศก็เหมือนสินค้าคงคลัง คือต้องมีความหลากหลาย และประเภทที่เหมาะสม จัดเก็บและหามาใช้ได้ในสถานที่เหมาะสม ในเวลาและบ่อยครั้งที่ต้องการ สารสนเทศที่มากเกินไปจะทำให้เสียค่าใช้จ่ายมาก สารสนเทศน้อยเกินไปทำให้เกิดความเสียหายต้องมีการป้องกันผู้ที่ไม่มีสิทธิ์ใช้สารสนเทศนั้นได้ และในขณะเดียวกันต้องป้องกันการสูญเสียทางกายภาพ อันเนื่องมาจาก ไฟ น้ำท่วม ไฟฟ้าตกหรือดับ
โดยสรุปแล้วข้อมูลสารสนเทศ (information) มีประโยชน์คือ ทำให้เกิดความรู้, ทำให้เกิดความคิดและความเข้าใจ, ทำให้เห็นสภาพปัญหา/ สภาพการเปลี่ยนแปลงว่าก้าวหน้าหรือตกต่ำ, ทำให้ประเมินค่าได้, ทำให้เกิดความน่าสนใจและเกิดการตื่นตัว, ช่วยในการตัดสินใจได้และสามารถทำนายอนาคตได้, ทำให้เกิดความคิดสร้างสรรค์ และก่อให้เกิดการเปลี่ยนแปลงเจตคติ เมื่อได้รู้ได้เห็นจากสภาพความเป็นจริงจากข้อมูลสารสนเทศเหล่านั้น
ข้อมูลสารสนเทศควรมีลักษณะที่พึงปรารถนาอย่างน้อย 5 ลักษณะดังต่อไปนี้
1. สารสนเทศที่นำเสนอชัดเจน และควรนำเสนอด้วยวิธีที่คุ้นเคยกันอยู่เพื่อให้สามารถเข้าใจได้อย่างรวดเร็ว
2. สารสนเทศนั้นควรทำให้ความเข้าใจสถานการณ์ของงานนั้นได้ละเอียดขึ้น
3. สารสนเทศที่มีคำแนะนำหรือส่วนแนะนำการตัดสินใจควรมีสิ่งช่วยที่ชัดเจนอย่างใดอย่างหนื่งให้ผู้ใช้พิจารณาได้ว่าทำอย่างไร และทำไมจึงจะได้ผล (Results) และคำแนะนำ
4. ความต้องการต่างๆ ด้านสารสนเทศควรอยู่บนพื้นฐานของการระบุความต้องการสารสนเทศสำหรับสถานการณ์นั้นโดยเฉพาะ
5. สารสนเทศและเรื่องราวต่างๆ เกี่ยวกับการควบคุมทางการจัดการที่เสนอโดยกระบวนการสนับสนุนควรเป็นในลักษณะที่ให้ผู้ทำการตัดสินใจเป็นผู้แนะแนว (Guide) กระบวนการวินิจฉัย และการเลือกยิ่งกว่าให้ระบบสนับสนุนคอมพิวเตอร์ทำการแนะแนวกระบวนการดังกล่าว
ข้อมูล (stored Data) จึงเป็นข้อมูลที่เก็บรวบรวมไว้ในระบบคอมพิวเตอร์ และสามารถเรียกใช้งานได้เพื่อใช้ในการประมวลผลเพื่อให้ได้ผลลัพธ์ตอบวัตถุประสงค์ที่ตั้งไว้โดยใช้โปรแกรมประยุกต์ต่างๆ ข้อมูลที่ถูกเก็บรวบรวมไว้ในระบบคอมพิวเตอร์ อาจจะอยู่ในรูปของ
� แฟ้มข้อมูล หรือ ไฟล์ (File) ซึ่งเป็นที่รวบรวมข้อมูลประเภทเดียวกันไว้ด้วยกันเพื่อสะดวกในการจัดเก็บและค้นหาข้อมูล ให้ตรงตามวัตถุประสงค์การใช้งาน
� ฐานข้อมูล (Database) ซึ่งเป็นแนวความคิดที่นำข้อมูลของหน่วยงานทั้งหมดมารวบรวมไว้ที่เดียวกัน เพื่อช่วยลดความซ้ำซ้อนของข้อมูล และทำให้เกิดประสิทธิภาพในการใช้งานสูงสุด
ข้อมูลที่จัดเก็บอยู่นั้นอาจเป็นแฟ้มข้อมูลเพียงแฟ้มเดียว หรือหลายแฟ้ม หรืออยู่ในรูปของฐานข้อมูลซึ่งจะเป็นการรวบรวมแฟ้มข้อมูลตั้งแต่หนึ่งแฟ้มขึ้นไป ที่มีความสัมพันธ์เกี่ยวข้องกันเก็บไว้ในที่เดียวกันในหน่วยเก็บข้อมูลสำรองเช่น จานแม่เหล็กหรือดิสค์ เพื่อให้บุคคลากรจากหลายหน่วยงานสามารถใช้ข้อมูลในฐานข้อมูลนี้ร่วมกันได้
๕.๒.๓ นิยามแฟ้มข้อมูล
แฟ้มข้อมูล (File) เป็นการจัดเก็บและรวบรวมข้อมูลประเภทเดียวกันไว้ด้วยกันเพื่อให้เกิดความสะดวกในการจัดเก็บและเรียกค้น ตามวัตถุประสงค์การใช้งานของหน่วยงาน
การจัดเก็บข้อมูลของหน่วยงานไว้แต่ละหน่วยงานหรือแต่ละแผนก เช่น งานบุคคลก็จะมีแฟ้มเกี่ยวกับบุคลากรขององค์กร งานวิชาการก็จะมีแฟ้มเกี่ยวข้องกับวิชาการที่หน่วยงานเผยแพร่หรือวิจัย เป็นต้น และจะมีโปรแกรมที่เขียนขึ้นมาเพื่อเรียกค้นข้อมูลของหน่วยงานตนเองเพื่อการประมวลผล
หน่วยงานต่างๆ มีการจัดเก็บข้อมูลไว้ในรูปแบบแฟ้มข้อมูล จะมีผลที่เกิดขึ้นคือ ความซ้ำซ้อนของข้อมูล (Data Redundancy) เช่น ทะเบียนรายชื่อบุคลากรขององค์กรก็จะมีปรากฎอยู่เกือบทุกหน่วยงานซึ่งมีแฟ้มบุคลากรเป็นของตนเอง ทำให้เกิดความซ้ำซ้อน ส่งผลให้เกิดความสิ้นเปลืองเนื้อที่ในการจัดเก็บข้อมูลเหล่านี้ และยังส่งผลให้การแก้ไขหรือปรับปรุงข้อมูลบุคลากรเป็นไปโดยลำบาก ทำให้แต่ละหน่วยงานจึงอาจมีข้อมูลที่ขัดแย้งกันได้ในอนาคต จึงทำให้เกิดแนวความคิดในการนำแฟ้มข้อมูลของแต่ละหน่วยงานมารวมไว้ในที่เดียวกัน หรือเรียกว่าระบบการประมวลผลฐานข้อมูล (Database)
รูปที่ 5.2 ระบบการประมวลผลแฟ้มข้อมูล
ในการประมวลผลแฟ้มข้อมูลซึ่งในการทำงานจะทำที่เครื่องของผู้ที่ดูแลฐานข้อมูลนั้นจะมีข้อดีคือ
1.ทำให้การประมวลผลข้อมูลทำได้อย่างรวดเร็วไม่ต้องไปพึ่งพาฐานข้อมูลจากส่วนกลาง หรือไม่ต้องรอข้อมูลจากส่วนกลาง
2. ค่าลงทุนในการจัดซื้ออุปกรณ์ก็จะต่ำ และไม่จำเป็นต้องใช้คอมพิวเตอร์ที่มีสมรรถนะสูงก็สามารถประมวลผลข้อมูลได้ และในปัจจุบันเครื่องคอมพิวเตอร์มีสมรรถนะสูงขึ้นและราคาถูกลงซึ่งทำให้สามารถทำงานได้ง่าย
3. โปรแกรมประยุกต์แต่ละโปรแกรมสามารถควบคุมการใช้ข้อมูลในแฟ้มข้อมูลของตนเองได้ โดยไม่ต้องไปพึ่งพาโปรแกรมจากส่วนกลาง ทำให้การทำงานเร็วขึ้น
แต่ไม่ใช่ว่าในการประมวลผลแฟ้มข้อมูลจะมีข้อดีเสมอไป ข้อเสียที่เกิดขึ้นสำหรับระบบการประมวลผลแฟ้มข้อมูลคือ
1. มีความซ้ำซ้อนของข้อมูล (Redundancy) การเก็บรวบรวมข้อมูลประเภทเดียวกันไว้ในการทำงาน เช่นมีการรวบรวมข้อมูลที่ซ้ำซ้อนกัน จากรูปที่ 5.2 มีการเก็บรวบรวมข้อมูลอาคารเรียน และห้องเรียนซ้ำซ้อนกัน ทำให้เสียเนื้อที่ในอุปกรณ์สำรองข้อมูลไปเก็บข้อมูลที่สามารถใช้งานร่วมกันได้ไว้ในคอมพิวเตอร์ทั้ง 2 เครื่อง บางครั้งในการลงทุนเพื่อเก็บข้อมูลก็ทำให้ลงทุนในงบประมาณที่ซ้ำซ้อนได้เพื่อจัดเก็บข้อมูลประเภทเดียวกัน เนื่องจากไม่ทราบว่าอีกหน่วยงานหนึ่งนั้นมีฐานข้อมูลใดบ้าง
2. ความขัดแย้งของข้อมูล (Inconsistency) เมื่อมีการจัดเก็บข้อมูลแยกหน่วยงานกัน ในเรื่องเดียวกันนั้นย่อมมีโอกาสที่ฐานข้อมูลเกิดความขัดแย้งกันได้ เช่น การเปลี่ยนแปลงชื่ออาคารเรียน หรือการเปลี่ยนแปลงชื่อห้องหรือหมายเลขห้อง แม้กระทั่งการให้รหัส (Code) ของห้องเรียนหรืออาคารเรียน ไม่มีมาตราฐาน ทำให้ไม่สามารถนำข้อมูลมาใช้ร่วมกันได้ หรืออาจจะยุ่งยากหากจะเปลี่ยนแปลงระบบให้ใช้งานฐานข้อมูลร่วมกันได้
3. ความยุ่งยากในการประมวลผลข้อมูลในแฟ้มข้อมูลหลายแฟ้มข้อมูล ในการสร้างผลรายงานของรหัสของแผนที่อาคารเรียนหรือห้องเรียน ต้องมีการเขียนโปรแกรมประยุกต์เช่นโปรแกรมการใช้ที่ดิน ม.ธ. เพื่อทำการดึงฐานข้อมูลจากแฟ้มข้อมูลอาคารเรียน แฟ้มข้อมูลการใช้ที่ดิน แฟ้มข้อมูลห้องเรียน
4. ไม่มีผู้ควบคุมหรือรับผิดชอบระบบทั้งหมด เนื่องจากผู้ใช้เครื่องคอมพิวเตอร์เครื่องใดก็ต้องดูแลเครื่องรับผิดชอบเครื่องที่ตนเองใช้งาน จะไม่มีการใช้ข้อมูลหรือทรัพยากรร่วมกันแต่อย่างใด
5. ความขึ้นต่อกัน (Dependency) ระหว่างโปรแกรมประยุกต์และโครงสร้างของแฟ้มข้อมูล เนื่องจากการจัดเก็บข้อมูลในระบบการประมวลผลแฟ้มข้อมูลนั้นจะมีโครงสร้างของแฟ้มข้อมูลในรูปแบบของโปรแกรมประยุกต์ที่เครื่องคอมพิวเตอร์ชุดนั้นใช้งาน เช่น ถ้ามีการเขียนโปรแกรมประยุกต์ด้วยการสร้างฐานข้อมูลจาก Microsoft Access โครงสร้างหรือแฟ้มข้อมูลที่จะใช้ ตัวอย่างเช่นชื่อเขตข้อมูล (Field) ต่างๆ ขนาดของเขตข้อมูล หรือชนิดของเขตข้อมูลไม่ตรงกันกับอีกระบบหนึ่ง ทำให้เกิดปัญหาขึ้นได้ในอนาคตที่จะต้องลงทุนในการใช้ข้อมูลร่วมกันในอนาคต ซึ่งเหมือนกับต้องสร้างฐานข้อมูลอีกระบบหนึ่งใหม่หากจะมีการปรับเข้าสู่การประมวลผลฐานข้อมูล
๕.๒.๔ นิยามฐานข้อมูล
การประมวลผลรูปแบบใหม่ได้พัฒนาขึ้นมาเพื่อช่วยลดข้อเสียของการประมวลผลในระบบแฟ้มข้อมูล ซึ่งเรียกว่า การประมวลผลฐานข้อมูล
ฐานข้อมูล (Database) เป็นวิธีการที่จะเก็บข้อมูลที่มีความสัมพันธ์กันไว้ในที่เดียวกันและรวบรวมข้อมูลที่ไม่ซ้ำซ้อนและสามารถใช้ข้อมูลร่วมกันได้อย่างเป็นระบบ ให้สะดวกต่อการเรียกใช้ สามารถแก้ไขได้ง่าย สำหรับผู้ใช้จำนวนมาก และสามารถป้องกันไม่ให้ผู้ไม่มีสิทธิ์ใช้เข้าถึงข้อมูลได้
ในระบบการประมวลผลฐานข้อมูลนั้นมีองค์ประกอบที่เรียกว่า ระบบการจัดการฐานข้อมูล หรือ Database Management System (DBMS) เข้ามาช่วยในการลดข้อบกพร่องของการประมวลผลแฟ้มข้อมูล ช่วยลดความซ้ำซ้อนของข้อมูลและสามารถปรับปรุงฐานข้อมูลให้ทันสมัย ทันสถานการณ์ และมีความถูกต้อง ซึ่งวัตถุประสงค์ที่สำคัญในการจัดทำระบบสารสนเทศหรือฐานข้อมูลนั้น เพื่อสร้าง วิเคราะห์และทำให้ผู้ใช้ที่เหมาะสมได้รับข้อมูลและสารสนเทศที่หลากหลาย จุดเริ่มต้นก็คือการสร้างข้อมูลหรือการหา (Finding) ข้อมูลมาให้ได้ เมื่อได้ข้อมูลมาแล้ว มีขั้นตอนการดำเนินการตามมาดังนี้
1. การจัดเก็บ (Storing) จำเป็นต้องระบุวิธีการต่างๆ ในการจัดเก็บข้อมูล โดยอาศัยเกณฑ์ต่างๆ ที่จำเป็นสำหรับการวิเคราะห์ การเข้าถึง และผู้ที่มีศักยภาพเป็นผู้ใช้
2. การแปลงผัน (Converting) การวิเคราะห์ รูปแบบต่างๆ ที่ใช้งานได้
3. การส่ง (Converying) ปกติแล้วข้อมูลไม่ได้มีประโยชน์แค่ในที่จัดเก็บต้นแหล่งเท่านั้น แต่ต้องส่งถ่ายไปยังผู้ใช้ (คนหนึ่ง หรือหลายคน)
4. การทำซ้ำ (Reproducing) อาจจำเป็นต้องทำซ้ำหลายฉบับ (Copies) ในรูปแบบต่างๆ
5. การจำแนกประเภท (Classifying) การตัดสินใจกำหนดหัวเรื่อง (Headings) ที่ถูกต้องเพื่อจัดเก็บข้อมูลเป็นเรื่องที่สำคัญยิ่ง
6. การสังเคราะห์ (Synthesizing) ต้องใช้ข้อมูลจากหลายแหล่งเพื่อให้มีสารสนเทศพอเพียงสำหรับการตัดสินใจ
7. การจัดกระทำ (Manipulating) ข้อมูลอาจมีความหมายมากขึ้นโดยการจัดกระทำเชิงสถิติ
8. การค้นคืน (Retrieving) การที่ผู้ใช้ที่เหมาะสมสามารถเข้าถึงข้อมูลเมื่อต้องการ เป็นเรื่องสำคัญ
9. การพิจารณาทบทวน (Reviewing) ข้อมูลอะไรที่จำเป็นต้องมีไว้ และมีไว้เป็นเวลานานแค่ไหน? ระบบจัดเก็บและสมรรถภาพในการจัดกระทำสามารถรับมือกับข้อมูลเชิงประวัติศาสตร์จำนวนมากได้หรือไม่ หรือข้อมูลบางอย่างไม่จำเป็นควรทำลาย?
10. การทำลาย (Destroying) การพิจารณาทบทวนว่าข้อมูลใดจำเป็นหรือข้อมูลใดใช้อยู่เป็นประจำอาจบ่งบอกได้ว่าควรขจัดข้อมูลใดออกไป
๕.๒.๕ ระบบการประมวลผลฐานข้อมูล
ในระบบการประมวลผลฐานข้อมูลนี้แฟ้มข้อมูลต่างๆ ที่มีความเกี่ยวข้องกันหรือมีความสัมพันธ์กันจะถูกเก็บอยู่รวมกันในที่ที่เดียว ซึ่งจะช่วยลดความซ้ำซ้อนของข้อมูล ทำให้ข้อมูลมีความถูกต้องและทันสมัยอยู่ตลอด นอกจากนี้โปรแกรมประยุกต์ที่เขียนขึ้นก็จะไม่ขึ้นกับโครงสร้างของแฟ้มข้อมูลอีกด้วย ซึ่งระบบการจัดการฐานข้อมูลนี้จะทำหน้าที่ควบคุมดูแล และเรียกค้นฐานข้อมูลเพื่ออำนวยความสะดวกให้กับผู้ใช้งานให้สามารถใช้ฐานข้อมูลได้อย่างง่าย ระบบการจัดการฐานข้อมูล (DBMS) เป็นระบบการจัดเก็บบันทึกข้อมูลโดยใช้คอมพิวเตอร์ ซึ่งผู้ที่เลือกใช้ระบบมีจุดมุ่งหมายเพื่อทำการบันทึกและรักษาข้อมูล (information) ฐานข้อมูลมีทั้งการรูปแบบการใช้ร่วมกัน (integrated) หรือแบ่งข้อมูลให้ใช้ (shared) ฐานข้อมูลที่หลายๆ หน่วยงานนำมารวมกัน หรือกล่าวได้ว่าเป็นแฟ้มข้อมูลที่แตกต่างกัน คือ ไม่มีการซ้ำซ้อนของข้อมูลที่มีอยู่ในฐานข้อมูลทั้งหมด (การแบ่งข้อมูลใช้ร่วมกันในเวลาเดียวกัน คือ ผู้ใช้หลายๆคนสามารถเข้าสู่ฐานข้อมูลในเวลาเดียวกัน) แต่จะลดการซ้ำซ้อนของข้อมูลที่มีอยู่ทำให้ไม่เปลืองเนื้อที่ในการจัดเก็บ และนอกจากนี้ DBMS จะช่วยในการสร้าง เรียกค้น หรือสืบค้นฐานข้อมูล และปรับปรุงฐานข้อมูล โดยการทำงานนี้จะต้องผ่าน DBMS ทำให้การสร้างฐานข้อมูลหรือการปรับปรุงข้อมูลนั้นมีความสะดวกมากขึ้น โดยผู้ป้อนข้อมูลหรือสร้างฐานข้อมูลนั้นไม่ต้องสนใจรูปแบบการจัดเก็บข้อมูลทางกายภาพ ผู้ป้อนข้อมูลสามารถใช้ผ่าน DBMS ในการบริหารและจัดการฐานข้อมูลได้โดยตรง เช่น การเพิ่ม การลบ การเปลี่ยนแปลงข้อมูลเหล่านั้น
รูปที่ 5.3 ระบบการประมวลผลฐานข้อมูล
DBMS จะช่วยในการสร้าง เรียกใช้ข้อมูล และปรับปรุงฐานข้อมูล โดยจะทำหน้าที่เสมือนตัวกลาง ระหว่างผู้ใช้ และฐานข้อมูลให้สามารถติดต่อกันได้
ให้สังเกตข้อแตกต่างระหว่างระบบการประมวลผลแฟ้มข้อมูลในรูป 5.2 และระบบการประมวลผลฐานข้อมูลในรูป 5.3 จะเห็นว่าแฟ้มข้อมูลต่างๆ ในรูป 5.2 โปรแกรมประยุกต์ที่สร้างขึ้นในระบบการประมวลผลแฟ้มข้อมูล จะมีการอ่านหรือเขียนข้อมูลโดยตรง ในขณะที่โปรแกรมประยุกต์ที่สร้างในระบบการประมวลผลฐานข้อมูลนั้น จะต้องออกคำสั่งผ่าน DBMS ก่อน DBMS จึงจะทำหน้าที่อ่านข้อมูลที่ต้องการแล้วส่งต่อให้กับโปรแกรมประยุกต์อีกทีหนึ่ง
๕.๒.๕.๑ ข้อดีของการประมวลผลข้อมูลในฐานข้อมูล
1. ข้อมูลมีการเก็บอยู่รวมกันและสามารถใช้ข้อมูลร่วมกันได้ ในระบบฐานข้อมูล ข้อมูลทั้งหมดจะถูกเก็บอยู่ในที่เดียวกัน ที่เรียกว่า ฐานข้อมูล โปรแกรมประยุกต์สามารถออกคำสั่งผ่าน DBMS ให้ทำการอ่านข้อมูลจากหลายตารางได้ เช่น จากรูป 5.3
2. ลดความซ้ำซ้อนของข้อมูล ในการประมวลผลฐานข้อมูล ข้อมูลจะมีความซ้ำซ้อนกันน้อยที่สุด เนื่องจากข้อมูลจะถูกเก็บอยู่เพียงที่เดียวในฐานข้อมูล เช่น ข้อมูลขอบเขตการปกครองระดับจังหวัด ข้อมูลระดับอำเภอ ข้อมูลระดับตำบล ซึ่งจะเป็นการประหยัดเนื้อที่การใช้งานหน่วยเก็บข้อมูลสำรอง นอกจากนี้ถ้ามีการเปลี่ยนแปลงหรือปรับปรุงข้อมูลใด ก็จะทำกับข้อมูลเพียงที่เดียวเท่านั้น ดังนั้นจึงเป็นการลดความซ้ำซ้อนของข้อมูลลง ข้อมูลจะมีความถูกต้อง ไม่มีความขัดแย้งของข้อมูลเกิดขึ้น
3. สามารถหลีกเลี่ยงความขัดแย้งกันของข้อมูลที่อาจเกิดขึ้นได้ สืบเนื่องมาจากผลของข้อ 2 คือการลดความซ้ำซ้อนของข้อมูล จะทำให้สามารถลดความขัดแย้งของข้อมูลที่อาจเกิดขึ้นได้ด้วย ตัวอย่างเช่น ฐานข้อมูลระบบทะเบียนราษฎร์ระดับตำบล จังหวัดนครศรีธรรมราช ชื่อของประชาชน จะถูกเก็บอยู่ในตารางรายชื่อประชาชนในระดับหมู่บ้าน เพียงแห่งเดียว ดังนั้นถ้าจะมีการเปลี่ยนแปลงชื่อสกุลประชาชน เช่น การตาย หรือย้ายถิ่น ก็สามารถแก้ไขในตารางรายชื่อประชาชนระดับหมู่บ้านเพียงแห่งเดียว
4. การควบคุมความคงสภาพของข้อมูล ความคงสภาพ (Integrity) หมายถึงความถูกต้อง ความคล้องจอง ความสมเหตุสมผล หรือความเชื่อถือได้ของข้อมูล ซึ่งนอกจากลักษณะของข้อมูลที่ต้องมีความซ้ำซ้อนน้อยที่สุดแล้ว ความคงสภาพของข้อมูลก็มีความสำคัญไม่ยิ่งหย่อนไปกว่ากัน กล่าวคือ ข้อมูลภายในฐานข้อมูลนั้นควรจะต้องมีความถูกต้อง สมเหตุสมผล เช่น อายุของประชากรในระดับหมู่บ้าน ในฐานข้อมูลไม่ควรจะเกิน 200 ปี (ในความเป็นจริงไม่ถึง 150 ปี) ระบบฐานข้อมูลที่ดีต้องมีการป้องกันการบันทึกข้อมูลที่ไม่สมเหตุสมผลนื้ โดย DBMS เป็นตัวควบคุมไม่ให้มีการบันทึกข้อมูลที่ไม่ถูกต้องลงไปเก็บในฐานข้อมูล อีกตัวอย่างหนึ่งของความคงสภาพเช่น ประชาชนคนใดเสียชีวิต ในตารางรายชื่อจะต้องลบรายชื่อบุคคลนั้นออก และจำเป็นจะต้องลบข้อมูลของบุคคลนั้นออกจากตารางทะเบียนราษฎร์ระดับหมู่บ้าน เพื่อทำให้ฐานข้อมูลมีความคงสภาพของข้อมูลเกิดขึ้น
5. การจัดการข้อมูลในฐานข้อมูลจะทำได้ง่าย การจัดการกับข้อมูลไม่ว่าจะเป็นการเรียกใช้ข้อมูล การเพิ่มข้อมูล การแก้ไขข้อมูล หรือการลบข้อมูลของตารางใดภายในฐานข้อมูล จะสามารถทำได้ง่ายโดยการออกคำสั่งผ่านไปยัง DBMS ซึ่ง DBMS จะเป็นตัวจัดการข้อมูลภายในฐานข้อมูลให้เอง
6. ความเป็นอิสระระหว่างโปรแกรมประยุกต์และข้อมูล โปรแกรมประยุกต์ที่เขียนขึ้นจะไม่ขึ้นกับโครงสร้างของตารางข้อมูลที่เปลี่ยนแปลงไป เนื่องจากโครงสร้างของตารางต่างๆ และตัวข้อมูลในแต่ละตารางจะถูกเก็บอยู่ในฐานข้อมูลทั้งหมด โปรแกรมประยุกต์ไม่จำเป็นต้องเก็บโครงสร้างของตารางที่จะใช้ไว้ ซึ่งต่างกับระบบการประมวลผลแฟ้มข้อมูล ดังนั้นการเปลี่ยนแปลงโครงสร้างของตาราง เช่น การเปลี่ยนแปลงขนาดของเขตข้อมูลในตารางใดภายในฐานข้อมูล ก็ไม่จำเป็นต้องไปทำการแก้ไขโปรแกรมประยุกต์ที่มีการเรียกใช้เขตข้อมูลนั้น
7. การมีผู้ควบคุมระบบเพียงคนเดียว ผู้ควบคุมระบบฐานข้อมูลจะเรียกว่า DBA (Database Administrator) ซึ่งจะเป็นผู้ควบคุมและบริหารจัดการระบบฐานข้อมูลทั้งหมด โดยสามารถจัดการกับโครงสร้างฐานข้อมูลได้ เพื่อป้องกันผู้ที่ไม่มีส่วนเกี่ยวข้องกับการใช้งานฐานข้อมูลเข้าไปก่อความเสียหายให้กับระบบฐานข้อมูลได้
๕.๒.๕.๒ ข้อเสียของการประมวลผลข้อมูลในฐานข้อมูล
1. การใช้งานฐานข้อมูลจะเสียค่าใช้จ่ายค่อนข้างสูง เนื่องจาก DBMS มีราคาค่อนข้างแพง นอกจากนี้การใช้ฐานข้อมูล จะต้องใช้เครื่องคอมพิวเตอร์ที่มีประสิทธิภาพค่อนข้างสูง เช่นต้องมีความเร็วสูง และหน่วยเก็บข้อมูลสำรองความจุสูง เป็นต้น
2. การสูญเสียข้อมูลที่อาจเกิดขึ้นได้ เนื่องจากข้อมูลต่างๆ ในฐานข้อมูลจะถูกเก็บอยู่ในที่ที่เดียวกัน ถ้าดิสค์ที่เก็บฐานข้อมูลนั้นเกิดมีปัญหา อาจทำให้ต้องสูญเสียข้อมูลทั้งหมดในฐานข้อมูลได้ ในขณะที่ระบบแฟ้มข้อมูล จะสามารถเก็บแฟ้มข้อมูลต่างๆ แยกกันอยู่ในดิสค์หลายๆ ตัวได้ ถ้าดิสค์ตัวใดมีปัญหา ตัวอื่นก็ยังคงทำงานได้อยู่ ดังนั้นวิธีการป้องกันโดยต้องมีการสำรองข้อมูลทั้งหมดจากดิสค์ขึ้นเก็บไว้ในเทปแม่เหล็กทุกสิ้นเดือน หรือสัปดาห์ และเก็บไว้ในที่ที่ปลอดภัย
3. ความซับซ้อน ฐานข้อมูลจะมีการจัดเก็บซับซ้อนกว่าในรูปแบบแฟ้มข้อมูล ซึ่งระบบที่มีความซับซ้อนมากเท่าใด โอกาสที่จะเกิดความผิดพลาดของข้อมูลมีมากขึ้นเท่านั้น
ระบบการประมวลผลฐานข้อมูลเป็นระบบที่สามารถแก้ไขข้อบกพร่องของระบบการประมวลผลแบบแฟ้มข้อมูลได้ ดังนั้นในปัจจุบันนี้มีหลายหน่วยงานได้หันมาให้ความสนใจกับระบบฐานข้อมูลกันมาก บางหน่วยงานถึงกับมีการเปลี่ยนแปลงระบบการทำงานจากระบบเดิมคือระบบการประมวลผลแฟ้มข้อมูลมาเป็นระบบการประมวลผลฐานข้อมูล
๕.๒.๖ องค์ประกอบทางด้านข้อมูล
เป็นองค์ประกอบที่สำคัญอีกองค์ประกอบหนึ่งที่จำเป็นต้องมีในระบบฐานข้อมูล ตัวอย่างของข้อมูล เช่น รหัสของจังหวัดที่เก็บอยู่ในจังหวัด ซึ่งประกอบด้วยเขตข้อมูลรหัสจังหวัด อำเภอ ตำบล และระดับหมู่บ้าน เป็นต้น ข้อมูลที่เก็บอยู่ในฐานข้อมูลควรมีคุณสมบัติดังต่อไปนี้
1) มีความถูกต้อง ทันสมัย สมเหตุสมผล เช่น ถ้ามีการเก็บข้อมูลเพศของประชาชนในพื้นที่ ควรมีข้อมูลเพศชายเป็น 1 (Male) และข้อมูลเพศหญิงเป็น 0 (Female) เป็นต้น
2) มีความซ้ำซ้อนของข้อมูลน้อยที่สุด เนื่องจากข้อมูลในฐานข้อมูลสามารถประกอบด้วยตารางตั้งแต่หนึ่งตารางขึ้นไปที่มีความสัมพันธ์กัน ข้อมูลในแต่ละตารางจะต้องมีความซ้ำซ้อนของข้อมูลน้อยที่สุด หรือไม่มีเลย
3) มีการแบ่งกันใช้งานข้อมูล ข้อมูลภายในฐานข้อมูลควรมีลักษณะที่สามารถให้ผู้ใช้งานหลายคนใช้ข้อมูลนั้นร่วมกันได้ เป็นการแบ่งกันใช้ข้อมูล (Sharing) กล่าวคือผู้ใช้งานฐานข้อมูลแต่ละคน จะสามารถดึงข้อมูลชิ้นเดียวกันขึ้นมาดูได้พร้อมกัน แต่ถ้าจะทำการแก้ไขข้อมูล จะมีเพียงคนเดียวเท่านั้นที่จะสามารถทำได้ เป็นต้น
จากนิยามของฐานข้อมูลที่ว่า ฐานข้อมูลหมายถึงการเก็บรวบรวมข้อมูลที่มีความสัมพันธ์กันไว้ในที่ที่เดียวกัน จะมีโครงสร้างของข้อมูลพื้นฐานที่มีอยู่ในแฟ้มข้อมูลและระบบฐานข้อมูลดังนี้
ข้อมูลพื้นฐานที่เล็กที่สุดภายในแฟ้มข้อมูลคือ (Bit : Binary Digit) บิท ซึ่งเป็นหน่วยข้อมูลพื้นฐานที่เก็บอยู่ในหน่วยความจำภายในคอมพิวเตอร์ บิทนี้จะแทนด้วยตัวเลข 1 ตัว ได้แก่ 0 หรือ 1 อย่างใดอย่างหนึ่ง เรียกตัวเลข 1 หรือ 0 นี้ว่าเป็น 1 บิท
ข้อมูลซึ่งได้แก่ตัวอักษร (Character) แต่ละตัวเช่น A,B,C…,Z,0,1,….9 และสัญลักษณ์พิเศษอื่นๆ เช่น $,&,+,-,*,/ ฯลฯ เมื่อจะถูกนำไปเก็บไว้ในคอมพิวเตอร์ จะต้องถูกแปลงอยู่ในรูปของบิทหลายบิทที่มาประกอบกัน โดยตัวอักษร 1 ตัว จะแทนด้วย บิท 7 หรือ 8 บิท ฉะนั้นตัวอักษร 1 ตัวที่เห็นจะเรียกได้อีกอย่างว่า ไบท์ (Byte) ตัวอย่างเช่น ตัวอักษร A เมื่อเก็บอยู่ในคอมพิวเตอร์จะเก็บเป็น 1000001 เป็นต้น
ตัวอักษรแต่ละตัวจะถูกนำมาประกอบกันเป็นกลุ่มคำซึ่งมีความหมาย เช่น ชื่อ-สกุล เป็นต้น กลุ่มตัวเลขที่ประกอบกันเป็นรหัสประจำตัว จะเรียกข้อมูลกลุ่มของตัวอักษรที่รวมกันขึ้นมานี้ว่า เขตข้อมูลหรือฟิลด์ (Field) เช่น เขตข้อมูลรหัสอำเภอ เขตข้อมูลรหัสตำบล เป็นต้น
เมื่อนำเขตข้อมูลหลายเขตข้อมูลมารวมกันจะเรียกว่าเป็น ระเบียนหรือเรคอร์ด (Record) เช่นระเบียนนักศึกษา ประกอบด้วยเขตข้อมูลรหัสนักศึกษา ชื่อนักศึกษา รหัสคณะ และรหัสสาขา เป็นต้น
ระเบียนแต่ละระเบียนของข้อมูลชนิดเดียวกันจะสามารถนำมารวมกันเป็น แฟ้มข้อมูลหรือไฟล์ (File)
รูปที่ 5.4 โครงสร้างแฟ้มข้อมูลในฐานข้อมูล
ปัจจุบันนี้หลายหน่วยงานหันมาให้ความสนใจกับระบบฐานข้อมูลกันมาก บางหน่วยงานถึงกับมีการเปลี่ยนแปลงการทำงานจากระบบเดิมคือระบบการประมวลผลแฟ้มข้อมูลมาเป็นระบบการประมวลผลฐานข้อมูล
จากคำนิยามของฐานข้อมูลหลายคนอาจคิดว่าถ้านำแฟ้มข้อมูลหลายแฟ้มข้อมูลมารวมกันไว้ในที่ที่เดียวกันก็จะกลายมาเป็นฐานข้อมูลได้ ซึ่งข้อความนี้ยังไม่ถูกต้องนัก เนื่องจากฐานข้อมูลจะเป็นยิ่งกว่าการเก็บรวบรวมแฟ้มข้อมูลหลายแฟ้มเข้าด้วยกัน แต่ฐานข้อมูลยังต้องมีการเก็บคำอธิบายเกี่ยวกับโครงสร้างของฐานข้อมูลที่เรียกว่า พจนานุกรมข้อมูล (Data Dictionary) หรืออาจเรียกอีกอย่างว่า เมตะดาต้า (Meta-Datda)
๕.๓ พจนานุกรมข้อมูล (Data Dictionary)
DBMS หลายตัวจะมีการรวมพจนานุกรมข้อมูลเป็นส่วนหนึ่งของ DBMS ซึ่งพจนานุกรมข้อมูลนี้จะเป็นองค์ประกอบทางซอฟท์แวร์ ทำหน้าที่เก็บรายละเอียดเกี่ยวกับข้อมูลภายในฐานข้อมูล เช่น โครงสร้างของแต่ละตาราง ใครเป็นผู้สร้าง สร้างเมื่อใด และแต่ละตารางประกอบด้วยเขตข้อมูลใดบ้าง คุณลักษณะของแต่ละเขตข้อมูลเป็นอย่างไร และมีตารางใดที่มีความสัมพันธ์กันบ้าง มีเขตข้อมูลใดเป็นคีย์บ้าง เป็นต้น
ถ้าเปรียบเทียบฐานข้อมูลเหมือนกันห้องสมุดของมหาวิทยาลัยที่มีการเก็บหนังสือเล่มต่างๆ หนังสือเหล่านั้นจะเปรียบเสมือนกับข้อมูลที่เก็บอยู่ภายในฐานข้อมูล และในห้องสมุดจะต้องมีการทำบัญชีรายชื่อหนังสือต่างๆที่เก็บไว้ เพื่อใช้บอกรายละเอียดเกี่ยวกับหนังสือแต่ละเล่มว่าใครเป็นผู้แต่ง เก็บอยู่ที่ใดในห้องสมุด บัญชีรายชื่อหนังสือนี้ก็เปรียบได้กับพจนานุกรมข้อมูล ซึ่งมีหน้าที่อธิบายลักษณะของข้อมูลที่เก็บอยู่ในฐานข้อมูลรวมทั้งความสัมพันธ์ของข้อมูล เช่น ระหว่างระเบียนของแฟ้มข้อมูลหนึ่งและแฟ้มข้อมูลอื่นๆ ซึ่งพจนานุกรมข้อมูลนี้จะถูกเก็บและถูกเรียกใช้งานในระหว่างที่มีการประมวลผลฐานข้อมูล