๐Ÿ“Š Data Modelling
๐Ÿ“‹ Outline Pembelajaran

Outline Mata Kuliah - Data Modelling

Kode MK: SSD1019 | SKS: 3 (Praktikum) | Semester: 4 | Prodi: Sains Data
Dosen: Mohammad Reza Maulana, M.Kom | Universitas: UIN K.H. Abdurrahman Wahid Pekalongan


Modul 1: CONCEPTUAL MODELLING (Minggu 1โ€“4)

Sub-CPMK: 3.1, 4.1 - Memahami dan merancang model konseptual

Pertemuan 1: Pengantar Data Modelling & Perannya dalam SI dan Sains Data

Topik:

  • Konsep data, informasi, dan metadata - hierarki Data โ†’ Information โ†’ Knowledge โ†’ Wisdom
  • Peran data modelling dalam siklus pengembangan sistem (requirements, design, implementation, maintenance)
  • Perbedaan data modelling vs database design vs data analysis
  • Posisi data modelling dalam proyek sains data (feature engineering, data readiness)
  • Studi kasus: kegagalan sistem akibat model data yang buruk

Output: Pemahaman konteks dan motivasi mata kuliah
Referensi: Elmasri & Navathe Ch. 1โ€“2; Redman, Data Driven (Introduction)


Pertemuan 2: Kebutuhan Data & Business Rules

Topik:

  • Business process mapping - Input-Process-Output analysis
  • Stakeholder data: end user, analyst, data scientist, data engineer, management
  • Business rules dan constraint data - structural, procedural, derivation, validation
  • Teknik elisitasi: interview, workshop, document analysis, observation, prototyping
  • Studi kasus: sistem akademik dan e-commerce

Output: Dokumen kebutuhan data, daftar business rules, stakeholder matrix
Referensi: Hoberman Ch. 3โ€“4; IEEE Requirements Engineering Standards


Pertemuan 3: Konsep Entity, Attribute, dan Relationship

Topik:

  • Entity, entity set, instance - strong entity vs weak entity
  • Jenis attribute: simple, composite, multivalued, derived, stored
  • Relationship: binary, ternary, unary - degree dan relationship attribute
  • Identifier: natural key vs surrogate key, candidate key, composite key
  • Contoh pemodelan domain rumah sakit

Output: Daftar entity, attribute, dan relationship dari sebuah narasi bisnis
Referensi: Elmasri & Navathe Ch. 3; Connolly & Begg Ch. 11โ€“12


Pertemuan 4: Entity Relationship Diagram (ERD)

Topik:

  • Notasi Chen: rectangle (entity), ellipse (attribute), diamond (relationship)
  • Notasi Crow's Foot: simbol cardinality intuitif untuk industri
  • Cardinality (1:1, 1:N, M:N) dan participation (total vs partial)
  • Weak entity: double rectangle, partial key, identifying relationship
  • Generalisasi & Spesialisasi (ISA): supertype/subtype, disjoint/overlapping, total/partial
  • Best practices: naming convention, minimum crossing lines, konsistensi notasi

Output: ERD konseptual lengkap (e-commerce / sistem akademik)
Tools: Draw.io (rekomendasi utama); MySQL Workbench untuk forward engineering
Tugas: ERD dari domain pilihan mahasiswa
Referensi: Elmasri & Navathe Ch. 3; Hoberman Ch. 5โ€“7; Draw.io Documentation (https://www.diagrams.net/doc (opens in a new tab))


Modul 2: LOGICAL & PHYSICAL MODELLING (Minggu 5 - 9)

Sub-CPMK: 4.1, 6.1 - Merancang dan mengimplementasikan model logikal dan fisik

Pertemuan 5: Transformasi Conceptual Model ke Logical Model

Topik:

  • Algoritma mapping ERD ke model relasional (step-by-step)
  • Mapping strong entity โ†’ tabel; attribute โ†’ kolom; domain โ†’ tipe data
  • Penentuan primary key (natural vs surrogate) dan foreign key
  • Resolusi relationship: 1:N (FK di sisi "many"), M:N (junction table), 1:1, ternary
  • Mapping weak entity (composite PK: owner PK + partial key)
  • Strategi mapping generalisasi ISA: single table, per-subtype, per-class - trade-off

Output: Skema relasional (table definitions), daftar PK dan FK, data dictionary awal
Referensi: Elmasri & Navathe Ch. 9; Connolly & Begg Ch. 17


Pertemuan 6: Normalisasi Data (1NFโ€“3NF)

Topik:

  • Anomali data: insertion anomaly, update anomaly, deletion anomaly - contoh konkret
  • Functional dependency (FD), full FD, partial dependency, transitive dependency
  • Armstrong's Axioms dan closure of attributes
  • First Normal Form (1NF): atomic values, no multivalued attribute
  • Second Normal Form (2NF): eliminasi partial dependency
  • Third Normal Form (3NF): eliminasi transitive dependency
  • Studi kasus normalisasi end-to-end: 0NF โ†’ 1NF โ†’ 2NF โ†’ 3NF

Output: Skema ternormalisasi, dokumentasi langkah normalisasi, FD diagram
Tugas: Normalisasi spreadsheet denormalized
Referensi: Elmasri & Navathe Ch. 14 - 15; Date, Database Design and Relational Theory


Pertemuan 7: Normalisasi Lanjutan & Evaluasi Model Data

Topik:

  • Boyce-Codd Normal Form (BCNF): definisi, perbedaan dengan 3NF, dekomposisi
  • Trade-off normalisasi vs performa: manfaat (integritas, efisiensi) vs biaya (join kompleks)
  • Denormalisasi terkontrol: kapan dibenarkan, cara mendokumentasikan keputusan
  • Validasi logical data model: completeness check, correctness check, consistency check
  • Checklist validasi - peer review model data proyek

Output: Validated logical data model siap untuk tahap fisik
Referensi: Elmasri & Navathe Ch. 15; Kimball & Ross Ch. 19


Pertemuan 8: Ujian Tengah Semester (UTS)

Cakupan Materi: Pertemuan 1โ€“7
Format:

  • Pilihan Ganda 30% - konsep, definisi, terminologi
  • Studi Kasus 70% - identifikasi entity, gambar ERD, mapping ke logical model, normalisasi tabel

Kriteria Penilaian:

  • Conceptual Model (ERD): 40% - entity, attribute, cardinality, notasi
  • Logical Model: 35% - mapping, PK/FK, resolusi M:N
  • Normalization: 25% - anomali, FD, langkah normalisasi

Bobot: 30% dari nilai akhir semester


Pertemuan 9: Physical Data Model & Implementasi Skema Database

Topik:

  • Perbedaan logical model vs physical model (DBMS-independent vs DBMS-specific)
  • Pemilihan tipe data MySQL: numeric, string, date/time, boolean, JSON
  • Constraints lengkap: PRIMARY KEY, FOREIGN KEY (dengan ON DELETE/UPDATE options), UNIQUE, NOT NULL, CHECK, DEFAULT
  • Strategi indexing: primary index, secondary, composite, unique - kapan dan kapan tidak
  • Naming convention wajib: snake_case, plural tables, idx_, fk_ prefix
  • Tools data modelling: MySQL Workbench (forward/reverse engineering), Draw.io
  • Praktikum: generate DDL script dari logical model (CREATE TABLE, constraints, indexes)
  • Praktikum lanjutan: SQL DML (INSERT, UPDATE, DELETE, batch load) dan SQL Views
  • Stored Procedure: enkapsulasi logika bisnis, parameter IN/OUT, kapan digunakan
  • Trigger: BEFORE/AFTER, audit log, validasi data, masalah potensial
  • Transaction dan ACID: Atomicity, Consistency, Isolation, Durability; COMMIT, ROLLBACK, SAVEPOINT

Output: Physical data model diagram, SQL DDL script + DML script + Views + SP/Trigger definition
Tools: MySQL Workbench, Draw.io
Referensi: Elmasri & Navathe Ch. 17โ€“18; MySQL Official Documentation


Modul 3: KUALITAS DATA & ANALYTICAL MODELLING (Minggu 10โ€“13)

Sub-CPMK: 3.1, 4.1, 6.1 - Memahami kualitas data dan merancang model analitik

Pertemuan 10: Data Quality, Integrity, dan Governance

Topik:

  • Empat jenis integritas data: entity, referential, domain, user-defined
  • Referential integrity dan CASCADE options: CASCADE, SET NULL, RESTRICT - memilih berdasarkan business logic
  • Dimensi kualitas data: accuracy, completeness, consistency, timeliness, validity, uniqueness
  • Metadata (technical, business, operational) dan data dictionary - format standar
  • Data governance: ownership, stewardship, access policy, retention, privacy
  • Dampak kualitas data terhadap sains data (GIGO - studi kasus nyata)

Output: Data dictionary untuk proyek kelompok, laporan penilaian kualitas data
Referensi: Redman, Data Driven; Connolly & Begg Ch. 17


Pertemuan 11: Pengantar Data Warehouse & Analytical Modelling

Topik:

  • OLTP vs OLAP: tujuan, pola query, skema, pengguna, volume, frekuensi update
  • Data warehouse: definisi Inmon (subject-oriented, integrated, time-variant, non-volatile)
  • Data mart sebagai subset data warehouse - kapan menggunakan masing-masing
  • Proses ETL: Extract (sumber, incremental loading), Transform (cleaning, standardisasi, agregasi), Load (initial, incremental)
  • Multi-dimensional analysis: slice, dice, drill-down, roll-up, pivot
  • Pengantar dimensional modelling - preview fact & dimension table

Output: Dokumentasi kebutuhan analitik, identifikasi dimensi dan fakta dari narasi bisnis
Referensi: Kimball & Ross Ch. 1โ€“3; Elmasri & Navathe Ch. 29


Pertemuan 12: Dimensional Modelling: Star Schema

Topik:

  • Kimball Four-Step Process: pilih business process โ†’ tentukan grain โ†’ identifikasi dimensi โ†’ identifikasi fakta
  • Grain: definisi tepat, konsistensi grain, granularity rendah vs tinggi
  • Fact table: FK ke dimensi, tiga jenis measures (additive, semi-additive, non-additive)
  • Dimension table: wide/fat, denormalisasi disengaja, atribut kaya - surrogate key vs natural key
  • Dimensi waktu (date dimension): hierarki analitik temporal
  • Variasi dimensi: conformed, role-playing, junk, degenerate dimension
  • Studi kasus retail sales: Sales_Fact, Product_Dim, Store_Dim, Customer_Dim, Date_Dim
  • SQL DDL star schema + analytical queries (GROUP BY, multi-dimension JOIN)

Output: Star schema diagram, DDL script, 3+ analytical queries
Tugas: Rancang star schema untuk domain proyek kelompok
Referensi: Kimball & Ross Ch. 3โ€“4; Kimball Group Articles


Pertemuan 13: Dimensional Modelling: Snowflake Schema & SCD

Topik:

  • Snowflake schema: normalisasi dimensi, sub-dimension, trade-off dengan star schema
  • Perbandingan star vs snowflake: query performance, storage, maintenance, use case
  • Slowly Changing Dimension (SCD) - problem statement: bagaimana menangani perubahan dimensi?
  • SCD Type 1 (Overwrite): update langsung, tidak ada histori - use case: koreksi kesalahan
  • SCD Type 2 (Add New Row): histori penuh dengan start_date, end_date, current_flag
  • SCD Type 3 (Add Column): histori terbatas (current + previous value)
  • SCD Type 4 dan 6: hybrid approach
  • SQL implementasi SCD Type 2: INSERT awal, UPDATE saat perubahan, query historis
  • Best practices dimensional modelling: surrogate keys, date dimension, naming convention, partisi fakta

Output: Snowflake schema dari star schema P12, implementasi SCD Type 2 untuk dimensi pelanggan
Referensi: Kimball & Ross Ch. 5 - 7; Kimball Group: SCD Techniques


Modul 4: INTEGRASI & PROYEK AKHIR (Minggu 14โ€“16)

Sub-CPMK: 2.1, 4.1, 6.1 - Mengintegrasikan seluruh konsep dalam proyek nyata

Pertemuan 14: Integrasi Model Data dalam Proyek Sains Data

Topik:

  • Model data sebagai dasar feature engineering: normalized schema โ†’ clean features, relationships โ†’ join-based features, dimensions โ†’ categorical features, agregasi โ†’ time-based features
  • Pipeline analitik end-to-end: OLTP โ†’ ETL โ†’ Data Warehouse โ†’ Feature Engineering โ†’ ML Model โ†’ Deployment
  • Feature engineering dari star schema: fitur dimensi, fitur agregasi, fitur behavioral
  • Studi kasus: prediksi churn pelanggan e-commerce - step-by-step dari ERD hingga model ML
  • Hubungan kualitas model data dengan kualitas model ML (GIGO dalam konteks ML)
  • Review dan feedback proyek kelompok (progres per tahap)

Output: Query SQL feature engineering, pipeline diagram, proyek kelompok ter-review
Referensi: Kimball & Ross Ch. 18โ€“19; Redman, Data Driven


Pertemuan 15: Presentasi Proyek Akhir

Format Presentasi (per kelompok, 20 menit: 15 menit presentasi + 5 menit tanya-jawab):

  • (A) Conceptual Model - ERD lengkap dari domain yang dipilih
  • (B) Logical Model - skema relasional, normalisasi, keputusan mapping
  • (C) Physical Model - DDL script, naming convention, constraints
  • (D) Dimensional Model - star/snowflake schema, SCD strategy, analytical queries
  • (E) Refleksi desain - alasan keputusan dan trade-off yang diambil

Evaluasi:

  • Kelengkapan dan konsistensi antar tahap model
  • Ketepatan teknis (notasi, normalisasi, grain, SCD)
  • Kualitas presentasi dan kemampuan menjawab pertanyaan

Penilaian proyek kelompok masuk ke komponen UAS (35%) dari total nilai akhir.


Pertemuan 16: Ujian Akhir Semester (UAS)

Format: Studi kasus komprehensif data modelling (individual, tertulis)
Cakupan: Pertemuan 1โ€“14 dengan penekanan pada P9โ€“P14
Bentuk: Diberikan narasi bisnis baru โ†’ rancang model data end-to-end (ERD โ†’ LDM โ†’ Physical โ†’ Dimensional)
Bobot: 35% dari nilai akhir semester (mencakup juga penilaian proyek kelompok dari P15)


Sistem Penilaian

KomponenBobotKeterangan
Kehadiran10%Minimum 75% hadir untuk dapat mengikuti UAS
Tugas (termasuk kuis, praktikum, dan partisipasi)25%Tugas individu, latihan ERD, normalisasi, kuis, dan keaktifan diskusi
Ujian Tengah Semester (UTS) - Pertemuan 830%Studi kasus konseptual & logikal (P1 - P7)
Ujian Akhir Semester (UAS) - Pertemuan 1635%Studi kasus komprehensif data modelling (P1 - P14)
TOTAL100%

Kriteria Nilai: A (81โ€“100) ยท B+ (71โ€“80) ยท B (66โ€“70) ยท C+ (61โ€“65) ยท C (56โ€“60) ยท D+ (51โ€“55) ยท D (46โ€“50) ยท E (0โ€“45)


Progressive Project - Tahapan Proyek Kelompok

Proyek dikerjakan bertahap sepanjang semester pada domain bisnis yang dipilih kelompok:

TahapPertemuanDeliverable
Tahap 1P2Dokumen analisis kebutuhan data & business rules
Tahap 2P3โ€“P4ERD konseptual (min. 6 entity, cardinality lengkap)
Tahap 3P5Logical schema relasional (hasil mapping ERD)
Tahap 4P6Logical schema ternormalisasi (min. 3NF)
Tahap 5P7Logical schema ter-validasi & di-peer review
Tahap 6P9Physical schema + DDL + DML + Views executable
Tahap 7P12โ€“P13Dimensional model (star/snowflake schema + SCD strategy)
FinalP15Presentasi integrasi semua tahap (Tahap 1โ€“7)

Anggota Kelompok: 3โ€“4 mahasiswa per kelompok


Prasyarat Mata Kuliah

โ€“

(Mata kuliah ini tidak memiliki prasyarat formal; namun disarankan mahasiswa telah memahami konsep dasar database)


Tools & Software

KategoriToolKeterangan
ERD & Logical ModelDraw.io / Diagrams.netGratis, web-based, rekomendasi utama
ERD & Physical ModelMySQL WorkbenchForward/reverse engineering, DDL generation
DatabaseMySQL 8+Tool implementasi utama untuk physical model
SpreadsheetMicrosoft Excel / Google SheetsLatihan normalisasi, data dictionary

Catatan: Tools lain (PostgreSQL, dbdiagram.io, ERDPlus) bersifat opsional atau alternatif.


Referensi Utama

NoReferensiDigunakan di
No. 1Elmasri & Navathe. Fundamentals of Database Systems (7th ed., 2016). Pearson.P1โ€“P9
No. 2Kimball & Ross. The Data Warehouse Toolkit (3rd ed., 2013). Wiley.P11โ€“P14
No. 3Hoberman. Data Modeling Made Simple (3rd ed., 2020). Technics Publications.P2โ€“P7, P11

Referensi Pendukung: Connolly & Begg (P3โ€“P9) ยท Simsion & Witt (P2โ€“P5) ยท Redman (P1, P10, P14) ยท Date (P6โ€“P7)


Lihat RPS lengkap untuk detail CPMK, Sub-CPMK, dan ketentuan perkuliahan.
Lihat Daftar Referensi untuk panduan bahan belajar lebih lengkap.