Outline Mata Kuliah - Data Modelling
Kode MK: SSD1019 | SKS: 3 (Praktikum) | Semester: 4 | Prodi: Sains Data
Dosen: Mohammad Reza Maulana, M.Kom | Universitas: UIN K.H. Abdurrahman Wahid Pekalongan
Modul 1: CONCEPTUAL MODELLING (Minggu 1โ4)
Sub-CPMK: 3.1, 4.1 - Memahami dan merancang model konseptual
Pertemuan 1: Pengantar Data Modelling & Perannya dalam SI dan Sains Data
Topik:
- Konsep data, informasi, dan metadata - hierarki Data โ Information โ Knowledge โ Wisdom
- Peran data modelling dalam siklus pengembangan sistem (requirements, design, implementation, maintenance)
- Perbedaan data modelling vs database design vs data analysis
- Posisi data modelling dalam proyek sains data (feature engineering, data readiness)
- Studi kasus: kegagalan sistem akibat model data yang buruk
Output: Pemahaman konteks dan motivasi mata kuliah
Referensi: Elmasri & Navathe Ch. 1โ2; Redman, Data Driven (Introduction)
Pertemuan 2: Kebutuhan Data & Business Rules
Topik:
- Business process mapping - Input-Process-Output analysis
- Stakeholder data: end user, analyst, data scientist, data engineer, management
- Business rules dan constraint data - structural, procedural, derivation, validation
- Teknik elisitasi: interview, workshop, document analysis, observation, prototyping
- Studi kasus: sistem akademik dan e-commerce
Output: Dokumen kebutuhan data, daftar business rules, stakeholder matrix
Referensi: Hoberman Ch. 3โ4; IEEE Requirements Engineering Standards
Pertemuan 3: Konsep Entity, Attribute, dan Relationship
Topik:
- Entity, entity set, instance - strong entity vs weak entity
- Jenis attribute: simple, composite, multivalued, derived, stored
- Relationship: binary, ternary, unary - degree dan relationship attribute
- Identifier: natural key vs surrogate key, candidate key, composite key
- Contoh pemodelan domain rumah sakit
Output: Daftar entity, attribute, dan relationship dari sebuah narasi bisnis
Referensi: Elmasri & Navathe Ch. 3; Connolly & Begg Ch. 11โ12
Pertemuan 4: Entity Relationship Diagram (ERD)
Topik:
- Notasi Chen: rectangle (entity), ellipse (attribute), diamond (relationship)
- Notasi Crow's Foot: simbol cardinality intuitif untuk industri
- Cardinality (1:1, 1:N, M:N) dan participation (total vs partial)
- Weak entity: double rectangle, partial key, identifying relationship
- Generalisasi & Spesialisasi (ISA): supertype/subtype, disjoint/overlapping, total/partial
- Best practices: naming convention, minimum crossing lines, konsistensi notasi
Output: ERD konseptual lengkap (e-commerce / sistem akademik)
Tools: Draw.io (rekomendasi utama); MySQL Workbench untuk forward engineering
Tugas: ERD dari domain pilihan mahasiswa
Referensi: Elmasri & Navathe Ch. 3; Hoberman Ch. 5โ7; Draw.io Documentation (https://www.diagrams.net/doc (opens in a new tab))
Modul 2: LOGICAL & PHYSICAL MODELLING (Minggu 5 - 9)
Sub-CPMK: 4.1, 6.1 - Merancang dan mengimplementasikan model logikal dan fisik
Pertemuan 5: Transformasi Conceptual Model ke Logical Model
Topik:
- Algoritma mapping ERD ke model relasional (step-by-step)
- Mapping strong entity โ tabel; attribute โ kolom; domain โ tipe data
- Penentuan primary key (natural vs surrogate) dan foreign key
- Resolusi relationship: 1:N (FK di sisi "many"), M:N (junction table), 1:1, ternary
- Mapping weak entity (composite PK: owner PK + partial key)
- Strategi mapping generalisasi ISA: single table, per-subtype, per-class - trade-off
Output: Skema relasional (table definitions), daftar PK dan FK, data dictionary awal
Referensi: Elmasri & Navathe Ch. 9; Connolly & Begg Ch. 17
Pertemuan 6: Normalisasi Data (1NFโ3NF)
Topik:
- Anomali data: insertion anomaly, update anomaly, deletion anomaly - contoh konkret
- Functional dependency (FD), full FD, partial dependency, transitive dependency
- Armstrong's Axioms dan closure of attributes
- First Normal Form (1NF): atomic values, no multivalued attribute
- Second Normal Form (2NF): eliminasi partial dependency
- Third Normal Form (3NF): eliminasi transitive dependency
- Studi kasus normalisasi end-to-end: 0NF โ 1NF โ 2NF โ 3NF
Output: Skema ternormalisasi, dokumentasi langkah normalisasi, FD diagram
Tugas: Normalisasi spreadsheet denormalized
Referensi: Elmasri & Navathe Ch. 14 - 15; Date, Database Design and Relational Theory
Pertemuan 7: Normalisasi Lanjutan & Evaluasi Model Data
Topik:
- Boyce-Codd Normal Form (BCNF): definisi, perbedaan dengan 3NF, dekomposisi
- Trade-off normalisasi vs performa: manfaat (integritas, efisiensi) vs biaya (join kompleks)
- Denormalisasi terkontrol: kapan dibenarkan, cara mendokumentasikan keputusan
- Validasi logical data model: completeness check, correctness check, consistency check
- Checklist validasi - peer review model data proyek
Output: Validated logical data model siap untuk tahap fisik
Referensi: Elmasri & Navathe Ch. 15; Kimball & Ross Ch. 19
Pertemuan 8: Ujian Tengah Semester (UTS)
Cakupan Materi: Pertemuan 1โ7
Format:
- Pilihan Ganda 30% - konsep, definisi, terminologi
- Studi Kasus 70% - identifikasi entity, gambar ERD, mapping ke logical model, normalisasi tabel
Kriteria Penilaian:
- Conceptual Model (ERD): 40% - entity, attribute, cardinality, notasi
- Logical Model: 35% - mapping, PK/FK, resolusi M:N
- Normalization: 25% - anomali, FD, langkah normalisasi
Bobot: 30% dari nilai akhir semester
Pertemuan 9: Physical Data Model & Implementasi Skema Database
Topik:
- Perbedaan logical model vs physical model (DBMS-independent vs DBMS-specific)
- Pemilihan tipe data MySQL: numeric, string, date/time, boolean, JSON
- Constraints lengkap: PRIMARY KEY, FOREIGN KEY (dengan ON DELETE/UPDATE options), UNIQUE, NOT NULL, CHECK, DEFAULT
- Strategi indexing: primary index, secondary, composite, unique - kapan dan kapan tidak
- Naming convention wajib: snake_case, plural tables, idx_, fk_ prefix
- Tools data modelling: MySQL Workbench (forward/reverse engineering), Draw.io
- Praktikum: generate DDL script dari logical model (CREATE TABLE, constraints, indexes)
- Praktikum lanjutan: SQL DML (INSERT, UPDATE, DELETE, batch load) dan SQL Views
- Stored Procedure: enkapsulasi logika bisnis, parameter IN/OUT, kapan digunakan
- Trigger: BEFORE/AFTER, audit log, validasi data, masalah potensial
- Transaction dan ACID: Atomicity, Consistency, Isolation, Durability; COMMIT, ROLLBACK, SAVEPOINT
Output: Physical data model diagram, SQL DDL script + DML script + Views + SP/Trigger definition
Tools: MySQL Workbench, Draw.io
Referensi: Elmasri & Navathe Ch. 17โ18; MySQL Official Documentation
Modul 3: KUALITAS DATA & ANALYTICAL MODELLING (Minggu 10โ13)
Sub-CPMK: 3.1, 4.1, 6.1 - Memahami kualitas data dan merancang model analitik
Pertemuan 10: Data Quality, Integrity, dan Governance
Topik:
- Empat jenis integritas data: entity, referential, domain, user-defined
- Referential integrity dan CASCADE options: CASCADE, SET NULL, RESTRICT - memilih berdasarkan business logic
- Dimensi kualitas data: accuracy, completeness, consistency, timeliness, validity, uniqueness
- Metadata (technical, business, operational) dan data dictionary - format standar
- Data governance: ownership, stewardship, access policy, retention, privacy
- Dampak kualitas data terhadap sains data (GIGO - studi kasus nyata)
Output: Data dictionary untuk proyek kelompok, laporan penilaian kualitas data
Referensi: Redman, Data Driven; Connolly & Begg Ch. 17
Pertemuan 11: Pengantar Data Warehouse & Analytical Modelling
Topik:
- OLTP vs OLAP: tujuan, pola query, skema, pengguna, volume, frekuensi update
- Data warehouse: definisi Inmon (subject-oriented, integrated, time-variant, non-volatile)
- Data mart sebagai subset data warehouse - kapan menggunakan masing-masing
- Proses ETL: Extract (sumber, incremental loading), Transform (cleaning, standardisasi, agregasi), Load (initial, incremental)
- Multi-dimensional analysis: slice, dice, drill-down, roll-up, pivot
- Pengantar dimensional modelling - preview fact & dimension table
Output: Dokumentasi kebutuhan analitik, identifikasi dimensi dan fakta dari narasi bisnis
Referensi: Kimball & Ross Ch. 1โ3; Elmasri & Navathe Ch. 29
Pertemuan 12: Dimensional Modelling: Star Schema
Topik:
- Kimball Four-Step Process: pilih business process โ tentukan grain โ identifikasi dimensi โ identifikasi fakta
- Grain: definisi tepat, konsistensi grain, granularity rendah vs tinggi
- Fact table: FK ke dimensi, tiga jenis measures (additive, semi-additive, non-additive)
- Dimension table: wide/fat, denormalisasi disengaja, atribut kaya - surrogate key vs natural key
- Dimensi waktu (date dimension): hierarki analitik temporal
- Variasi dimensi: conformed, role-playing, junk, degenerate dimension
- Studi kasus retail sales: Sales_Fact, Product_Dim, Store_Dim, Customer_Dim, Date_Dim
- SQL DDL star schema + analytical queries (GROUP BY, multi-dimension JOIN)
Output: Star schema diagram, DDL script, 3+ analytical queries
Tugas: Rancang star schema untuk domain proyek kelompok
Referensi: Kimball & Ross Ch. 3โ4; Kimball Group Articles
Pertemuan 13: Dimensional Modelling: Snowflake Schema & SCD
Topik:
- Snowflake schema: normalisasi dimensi, sub-dimension, trade-off dengan star schema
- Perbandingan star vs snowflake: query performance, storage, maintenance, use case
- Slowly Changing Dimension (SCD) - problem statement: bagaimana menangani perubahan dimensi?
- SCD Type 1 (Overwrite): update langsung, tidak ada histori - use case: koreksi kesalahan
- SCD Type 2 (Add New Row): histori penuh dengan start_date, end_date, current_flag
- SCD Type 3 (Add Column): histori terbatas (current + previous value)
- SCD Type 4 dan 6: hybrid approach
- SQL implementasi SCD Type 2: INSERT awal, UPDATE saat perubahan, query historis
- Best practices dimensional modelling: surrogate keys, date dimension, naming convention, partisi fakta
Output: Snowflake schema dari star schema P12, implementasi SCD Type 2 untuk dimensi pelanggan
Referensi: Kimball & Ross Ch. 5 - 7; Kimball Group: SCD Techniques
Modul 4: INTEGRASI & PROYEK AKHIR (Minggu 14โ16)
Sub-CPMK: 2.1, 4.1, 6.1 - Mengintegrasikan seluruh konsep dalam proyek nyata
Pertemuan 14: Integrasi Model Data dalam Proyek Sains Data
Topik:
- Model data sebagai dasar feature engineering: normalized schema โ clean features, relationships โ join-based features, dimensions โ categorical features, agregasi โ time-based features
- Pipeline analitik end-to-end: OLTP โ ETL โ Data Warehouse โ Feature Engineering โ ML Model โ Deployment
- Feature engineering dari star schema: fitur dimensi, fitur agregasi, fitur behavioral
- Studi kasus: prediksi churn pelanggan e-commerce - step-by-step dari ERD hingga model ML
- Hubungan kualitas model data dengan kualitas model ML (GIGO dalam konteks ML)
- Review dan feedback proyek kelompok (progres per tahap)
Output: Query SQL feature engineering, pipeline diagram, proyek kelompok ter-review
Referensi: Kimball & Ross Ch. 18โ19; Redman, Data Driven
Pertemuan 15: Presentasi Proyek Akhir
Format Presentasi (per kelompok, 20 menit: 15 menit presentasi + 5 menit tanya-jawab):
- (A) Conceptual Model - ERD lengkap dari domain yang dipilih
- (B) Logical Model - skema relasional, normalisasi, keputusan mapping
- (C) Physical Model - DDL script, naming convention, constraints
- (D) Dimensional Model - star/snowflake schema, SCD strategy, analytical queries
- (E) Refleksi desain - alasan keputusan dan trade-off yang diambil
Evaluasi:
- Kelengkapan dan konsistensi antar tahap model
- Ketepatan teknis (notasi, normalisasi, grain, SCD)
- Kualitas presentasi dan kemampuan menjawab pertanyaan
Penilaian proyek kelompok masuk ke komponen UAS (35%) dari total nilai akhir.
Pertemuan 16: Ujian Akhir Semester (UAS)
Format: Studi kasus komprehensif data modelling (individual, tertulis)
Cakupan: Pertemuan 1โ14 dengan penekanan pada P9โP14
Bentuk: Diberikan narasi bisnis baru โ rancang model data end-to-end (ERD โ LDM โ Physical โ Dimensional)
Bobot: 35% dari nilai akhir semester (mencakup juga penilaian proyek kelompok dari P15)
Sistem Penilaian
| Komponen | Bobot | Keterangan |
|---|---|---|
| Kehadiran | 10% | Minimum 75% hadir untuk dapat mengikuti UAS |
| Tugas (termasuk kuis, praktikum, dan partisipasi) | 25% | Tugas individu, latihan ERD, normalisasi, kuis, dan keaktifan diskusi |
| Ujian Tengah Semester (UTS) - Pertemuan 8 | 30% | Studi kasus konseptual & logikal (P1 - P7) |
| Ujian Akhir Semester (UAS) - Pertemuan 16 | 35% | Studi kasus komprehensif data modelling (P1 - P14) |
| TOTAL | 100% |
Kriteria Nilai: A (81โ100) ยท B+ (71โ80) ยท B (66โ70) ยท C+ (61โ65) ยท C (56โ60) ยท D+ (51โ55) ยท D (46โ50) ยท E (0โ45)
Progressive Project - Tahapan Proyek Kelompok
Proyek dikerjakan bertahap sepanjang semester pada domain bisnis yang dipilih kelompok:
| Tahap | Pertemuan | Deliverable |
|---|---|---|
| Tahap 1 | P2 | Dokumen analisis kebutuhan data & business rules |
| Tahap 2 | P3โP4 | ERD konseptual (min. 6 entity, cardinality lengkap) |
| Tahap 3 | P5 | Logical schema relasional (hasil mapping ERD) |
| Tahap 4 | P6 | Logical schema ternormalisasi (min. 3NF) |
| Tahap 5 | P7 | Logical schema ter-validasi & di-peer review |
| Tahap 6 | P9 | Physical schema + DDL + DML + Views executable |
| Tahap 7 | P12โP13 | Dimensional model (star/snowflake schema + SCD strategy) |
| Final | P15 | Presentasi integrasi semua tahap (Tahap 1โ7) |
Anggota Kelompok: 3โ4 mahasiswa per kelompok
Prasyarat Mata Kuliah
โ
(Mata kuliah ini tidak memiliki prasyarat formal; namun disarankan mahasiswa telah memahami konsep dasar database)
Tools & Software
| Kategori | Tool | Keterangan |
|---|---|---|
| ERD & Logical Model | Draw.io / Diagrams.net | Gratis, web-based, rekomendasi utama |
| ERD & Physical Model | MySQL Workbench | Forward/reverse engineering, DDL generation |
| Database | MySQL 8+ | Tool implementasi utama untuk physical model |
| Spreadsheet | Microsoft Excel / Google Sheets | Latihan normalisasi, data dictionary |
Catatan: Tools lain (PostgreSQL, dbdiagram.io, ERDPlus) bersifat opsional atau alternatif.
Referensi Utama
| No | Referensi | Digunakan di |
|---|---|---|
| No. 1 | Elmasri & Navathe. Fundamentals of Database Systems (7th ed., 2016). Pearson. | P1โP9 |
| No. 2 | Kimball & Ross. The Data Warehouse Toolkit (3rd ed., 2013). Wiley. | P11โP14 |
| No. 3 | Hoberman. Data Modeling Made Simple (3rd ed., 2020). Technics Publications. | P2โP7, P11 |
Referensi Pendukung: Connolly & Begg (P3โP9) ยท Simsion & Witt (P2โP5) ยท Redman (P1, P10, P14) ยท Date (P6โP7)
Lihat RPS lengkap untuk detail CPMK, Sub-CPMK, dan ketentuan perkuliahan.
Lihat Daftar Referensi untuk panduan bahan belajar lebih lengkap.