Lab 19: Global Data Platform
Step 1: Platform Overview & Design Principles
┌─────────────────────────────────────────────────────────────────────────────┐
│ GLOBAL DATA PLATFORM │
│ │
│ ┌──────────────┐ ┌──────────────┐ ┌──────────────────────────────┐ │
│ │ Web / API │ │ Mobile │ │ Internal Services │ │
│ └──────┬───────┘ └──────┬───────┘ └───────────┬──────────────────┘ │
│ └─────────────────────────────────────────────┘ │
│ │ │
│ ┌─────────▼──────────┐ │
│ │ API Gateway / │ │
│ │ Load Balancer │ │
│ └────────┬───────────┘ │
│ │ │
│ ┌──────────────────┼──────────────────────┐ │
│ │ │ │ │
│ ┌──────▼──────┐ ┌───────▼──────┐ ┌──────────▼────────┐ │
│ │ Redis 7 │ │ PostgreSQL 15│ │ Elasticsearch 8 │ │
│ │ Cluster │ │ Primary + │ │ 3-node cluster │ │
│ │ (Cache) │ │ 2 Replicas │ │ (Search/Audit) │ │
│ └─────────────┘ └──────┬───────┘ └───────────────────┘ │
│ │ CDC │
│ ┌────────▼───────────┐ │
│ │ Apache Kafka 3 │ │
│ │ 3 brokers │ │
│ │ (Event Hub) │ │
│ └────────┬───────────┘ │
│ │ Consumers │
│ ┌──────────────────┼──────────────────────┐ │
│ │ │ │ │
│ ┌──────▼──────┐ ┌───────▼──────┐ ┌──────────▼────────┐ │
│ │ ClickHouse │ │ MongoDB │ │ Grafana / │ │
│ │ Cluster │ │ Atlas │ │ Dashboards │ │
│ │ (OLAP) │ │ (Profiles) │ │ │ │
│ └─────────────┘ └──────────────┘ └───────────────────┘ │
└─────────────────────────────────────────────────────────────────────────────┘
Data Flow:
Read path: API → Redis (cache hit) → PostgreSQL (cache miss)
Write path: API → PostgreSQL → Kafka CDC → ClickHouse/ES/MongoDB
Analytics: Kafka → ClickHouse → Grafana
Search: Kafka → Elasticsearch → API search endpointStep 2: OLTP Layer — PostgreSQL with PgBouncer
Step 3: Analytics Layer — ClickHouse
Step 4: Search Layer — Elasticsearch
Step 5: Cache Layer — Redis Cluster
Step 6: Event Streaming — Apache Kafka
Step 7: Data Flow Patterns
Step 8: Capstone — Platform Validation
Summary
Component
Technology
Primary Use
Throughput
Latency
Last updated
