Jesús Pérez a4b3c02371

2026-01-14 04:53:21 +00:00

11 KiB

Raw Blame History

ADR-008: Cedar Authorization Policy Engine Integration

Status: Accepted Date: 2025-10-08 Deciders: Architecture Team Tags: security, authorization, cedar, policy-engine

Context and Problem Statement

The Provisioning platform requires fine-grained authorization controls to manage access to infrastructure resources across multiple environments (development, staging, production). The authorization system must:

Support complex authorization rules (MFA, IP restrictions, time windows, approvals)
Be auditable and version-controlled
Allow hot-reload of policies without restart
Integrate with JWT tokens for identity
Scale to thousands of authorization decisions per second
Be maintainable by security team without code changes

Traditional code-based authorization (if/else statements) is difficult to audit, maintain, and scale.

Decision Drivers

Security: Critical for production infrastructure access
Auditability: Compliance requirements demand clear authorization policies
Flexibility: Policies change more frequently than code
Performance: Low-latency authorization decisions (<10 ms)
Maintainability: Security team should update policies without developers
Type Safety: Prevent policy errors before deployment

Considered Options

Option 1: Code-Based Authorization (Current State)

Implement authorization logic directly in Rust/Nushell code.

Pros:

Full control and flexibility
No external dependencies
Simple to understand for small use cases

Cons:

Hard to audit and maintain
Requires code deployment for policy changes
No type safety for policies
Difficult to test all combinations
Not declarative

Option 2: OPA (Open Policy Agent)

Use OPA with Rego policy language.

Pros:

Industry standard
Rich ecosystem
Rego is powerful

Cons:

Rego is complex to learn
Requires separate service deployment
Performance overhead (HTTP calls)
Policies not type-checked

Option 3: Cedar Policy Engine (Chosen)

Use AWS Cedar policy language integrated directly into orchestrator.

Pros:

Type-safe policy language
Fast (compiled, no network overhead)
Schema-based validation
Declarative and auditable
Hot-reload support
Rust library (no external service)
Deny-by-default security model

Cons:

Recently introduced (2023)
Smaller ecosystem than OPA
Learning curve for policy authors

Option 4: Casbin

Use Casbin authorization library.

Pros:

Multiple policy models (ACL, RBAC, ABAC)
Rust bindings available

Cons:

Less declarative than Cedar
Weaker type safety
More imperative style

Decision Outcome

Chosen Option: Option 3 - Cedar Policy Engine

Rationale

Type Safety: Cedar's schema validation prevents policy errors before deployment
Performance: Native Rust library, no network overhead, <1 ms authorization decisions
Auditability: Declarative policies in version control
Hot Reload: Update policies without orchestrator restart
AWS Standard: Used in production by AWS for AVP (Amazon Verified Permissions)
Deny-by-Default: Secure by design

Implementation Details

Architecture

┌─────────────────────────────────────────────────────────┐
│                  Orchestrator                           │
├─────────────────────────────────────────────────────────┤
│                                                         │
│  HTTP Request                                           │
│       ↓                                                 │
│  ┌──────────────────┐                                  │
│  │ JWT Validation   │ ← Token Validator                │
│  └────────┬─────────┘                                  │
│           ↓                                             │
│  ┌──────────────────┐                                  │
│  │ Cedar Engine     │ ← Policy Loader                  │
│  │                  │   (Hot Reload)                   │
│  │ • Check Policies │                                  │
│  │ • Evaluate Rules │                                  │
│  │ • Context Check  │                                  │
│  └────────┬─────────┘                                  │
│           ↓                                             │
│  Allow / Deny                                           │
│                                                         │
└─────────────────────────────────────────────────────────┘

Policy Organization

provisioning/config/cedar-policies/
├── schema.cedar          # Entity and action definitions
├── production.cedar      # Production environment policies
├── development.cedar     # Development environment policies
├── admin.cedar          # Administrative policies
└── README.md            # Documentation

Rust Implementation

provisioning/platform/orchestrator/src/security/
├── cedar.rs             # Cedar engine integration (450 lines)
├── policy_loader.rs     # Policy loading with hot reload (320 lines)
├── authorization.rs     # Middleware integration (380 lines)
├── mod.rs              # Module exports
└── tests.rs            # Comprehensive tests (450 lines)

Key Components

CedarEngine: Core authorization engine
- Load policies from strings
- Load schema for validation
- Authorize requests
- Policy statistics
PolicyLoader: File-based policy management
- Load policies from directory
- Hot reload on file changes (notify crate)
- Validate policy syntax
- Schema validation
Authorization Middleware: Axum integration
- Extract JWT claims
- Build authorization context (IP, MFA, time)
- Check authorization
- Return 403 Forbidden on deny
Policy Files: Declarative authorization rules
- Production: MFA, approvals, IP restrictions, business hours
- Development: Permissive for developers
- Admin: Platform admin, SRE, audit team policies

Context Variables

AuthorizationContext {
    mfa_verified: bool,          // MFA verification status
    ip_address: String,          // Client IP address
    time: String,                // ISO 8601 timestamp
    approval_id: Option<String>, // Approval ID (optional)
    reason: Option<String>,      // Reason for operation
    force: bool,                 // Force flag
    additional: HashMap,         // Additional context
}

Example Policy

// Production deployments require MFA verification
@id("prod-deploy-mfa")
@description("All production deployments must have MFA verification")
permit (
  principal,
  action == Provisioning::Action::"deploy",
  resource in Provisioning::Environment::"production"
) when {
  context.mfa_verified == true
};

Integration Points

JWT Tokens: Extract principal and context from validated JWT
Audit System: Log all authorization decisions
Control Center: UI for policy management and testing
CLI: Policy validation and testing commands

Security Best Practices

Deny by Default: Cedar defaults to deny all actions
Schema Validation: Type-check policies before loading
Version Control: All policies in git for auditability
Principle of Least Privilege: Grant minimum necessary permissions
Defense in Depth: Combine with JWT validation and rate limiting
Separation of Concerns: Security team owns policies, developers own code

Consequences

Positive

✅ Auditable: All policies in version control
✅ Type-Safe: Schema validation prevents errors
✅ Fast: <1 ms authorization decisions
✅ Maintainable: Security team can update policies independently
✅ Hot Reload: No downtime for policy updates
✅ Testable: Comprehensive test suite for policies
✅ Declarative: Clear intent, no hidden logic

Negative

❌ Learning Curve: Team must learn Cedar policy language
❌ New Technology: Cedar is relatively new (2023)
❌ Ecosystem: Smaller community than OPA
❌ Tooling: Limited IDE support compared to Rego

Neutral

🔶 Migration: Existing authorization logic needs migration to Cedar
🔶 Policy Complexity: Complex rules may be harder to express
🔶 Debugging: Policy debugging requires understanding Cedar evaluation

Compliance

Security Standards

SOC 2: Auditable access control policies
ISO 27001: Access control management
GDPR: Data access authorization and logging
NIST 800-53: AC-3 Access Enforcement

Audit Requirements

All authorization decisions include:

Principal (user/team)
Action performed
Resource accessed
Context (MFA, IP, time)
Decision (allow/deny)
Policies evaluated

Migration Path

Phase 1: Implementation (Completed)

✅ Cedar engine integration
✅ Policy loader with hot reload
✅ Authorization middleware
✅ Production, development, and admin policies
✅ Comprehensive tests

Phase 2: Rollout (Next)

🔲 Enable Cedar authorization in orchestrator
🔲 Migrate existing authorization logic to Cedar policies
🔲 Add authorization checks to all API endpoints
🔲 Integrate with audit logging

Phase 3: Enhancement (Future)

🔲 Control Center policy editor UI
🔲 Policy testing UI
🔲 Policy simulation and dry-run mode
🔲 Policy analytics and insights
🔲 Advanced context variables (location, device type)

Alternatives Considered

Alternative 1: Continue with Code-Based Authorization

Keep authorization logic in Rust/Nushell code.

Rejected Because:

Not auditable
Requires code changes for policy updates
Difficult to test all combinations
Not compliant with security standards

Alternative 2: Hybrid Approach

Use Cedar for high-level policies, code for fine-grained checks.

Rejected Because:

Complexity of two authorization systems
Unclear separation of concerns
Harder to audit

References

Cedar Documentation: https://docs.cedarpolicy.com/
Cedar GitHub: https://github.com/cedar-policy/cedar
AWS AVP: https://aws.amazon.com/verified-permissions/
Policy Files: /provisioning/config/cedar-policies/
Implementation: /provisioning/platform/orchestrator/src/security/

ADR-003: JWT Token-Based Authentication
ADR-004: Audit Logging System
ADR-005: KMS Key Management

Notes

Cedar policy language is inspired by decades of authorization research (XACML, AWS IAM) and production experience at AWS. It balances expressiveness with safety.

Approved By: Architecture Team Implementation Date: 2025-10-08 Review Date: 2026-01-08 (Quarterly)

11 KiB Raw Blame History

ADR-008: Cedar Authorization Policy Engine Integration

Context and Problem Statement

Decision Drivers

Considered Options

Option 1: Code-Based Authorization (Current State)

Option 2: OPA (Open Policy Agent)

Option 3: Cedar Policy Engine (Chosen)

Option 4: Casbin

Decision Outcome

Rationale

Implementation Details

Architecture

Policy Organization

Rust Implementation

Key Components

Context Variables

Example Policy

Integration Points

Security Best Practices

Consequences

Positive

Negative

Neutral

Compliance

Security Standards

Audit Requirements

Migration Path

Phase 1: Implementation (Completed)

Phase 2: Rollout (Next)

Phase 3: Enhancement (Future)

Alternatives Considered

Alternative 1: Continue with Code-Based Authorization

Alternative 2: Hybrid Approach

References

Related ADRs

Notes

11 KiB

Raw Blame History