diff --git a/cortex-cli/src/export_cmd.rs b/cortex-cli/src/export_cmd.rs
index b253d10c..a74349df 100644
--- a/cortex-cli/src/export_cmd.rs
+++ b/cortex-cli/src/export_cmd.rs
@@ -1,10 +1,15 @@
 //! Session export command for Cortex CLI.
 //!
 //! Exports a session to a portable JSON format that can be shared or imported.
+//!
+//! Features:
+//! - Export format version field for backward compatibility (Issue #3079)
+//! - Compression option for large exports (Issue #3080)
 
 use anyhow::{Context, Result, bail};
 use clap::Parser;
 use serde::{Deserialize, Serialize};
+use std::io::Write;
 use std::path::PathBuf;
 
 use cortex_engine::list_sessions;
@@ -12,6 +17,10 @@ use cortex_engine::rollout::get_rollout_path;
 use cortex_engine::rollout::reader::{RolloutItem, get_session_meta, read_rollout};
 use cortex_protocol::{ConversationId, EventMsg};
 
+/// Current export format version (Issue #3079).
+/// Increment this when making breaking changes to the export format.
+pub const EXPORT_FORMAT_VERSION: u32 = 2;
+
 /// Export format for sessions.
 #[derive(Debug, Clone, Copy, Default, PartialEq, Eq, clap::ValueEnum)]
 pub enum ExportFormat {
@@ -42,19 +51,51 @@ pub struct ExportCommand {
     /// Pretty-print the output (for json/yaml)
     #[arg(long, default_value_t = true)]
     pub pretty: bool,
+
+    /// Compress output using gzip (Issue #3080)
+    /// Automatically adds .gz extension to output file if not present.
+    #[arg(long, short = 'z')]
+    pub compress: bool,
+
+    /// Include format version metadata in export (Issue #3079)
+    /// This helps with backward compatibility checking during import.
+    #[arg(long, default_value_t = true)]
+    pub include_version: bool,
 }
 
 /// Portable session export format.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct SessionExport {
-    /// Export format version.
+    /// Export format version (Issue #3079).
+    /// Version history:
+    /// - v1: Initial format
+    /// - v2: Added format_version_info field with detailed version metadata
     pub version: u32,
+    /// Detailed format version information (Issue #3079).
+    #[serde(skip_serializing_if = "Option::is_none")]
+    pub format_version_info: Option<FormatVersionInfo>,
     /// Session metadata.
     pub session: SessionMetadata,
     /// Conversation messages.
     pub messages: Vec<ExportMessage>,
 }
 
+/// Detailed format version information for backward compatibility (Issue #3079).
+#[derive(Debug, Clone, Serialize, Deserialize)]
+pub struct FormatVersionInfo {
+    /// Format version number.
+    pub version: u32,
+    /// Minimum compatible version for import.
+    pub min_compatible_version: u32,
+    /// CLI version that created this export.
+    pub cli_version: String,
+    /// Export timestamp (ISO 8601).
+    pub exported_at: String,
+    /// Optional description of format changes.
+    #[serde(skip_serializing_if = "Option::is_none")]
+    pub version_notes: Option<String>,
+}
+
 /// Session metadata in export format.
 #[derive(Debug, Clone, Serialize, Deserialize)]
 pub struct SessionMetadata {
@@ -192,9 +233,23 @@ impl ExportCommand {
             },
         };
 
+        // Build format version info (Issue #3079)
+        let format_version_info = if self.include_version {
+            Some(FormatVersionInfo {
+                version: EXPORT_FORMAT_VERSION,
+                min_compatible_version: 1, // Can import v1 exports
+                cli_version: env!("CARGO_PKG_VERSION").to_string(),
+                exported_at: chrono::Utc::now().to_rfc3339(),
+                version_notes: Some("v2: Added detailed format version metadata".to_string()),
+            })
+        } else {
+            None
+        };
+
         // Build export
         let export = SessionExport {
-            version: 1,
+            version: EXPORT_FORMAT_VERSION,
+            format_version_info,
             session: session_meta,
             messages: messages.clone(),
         };
@@ -225,14 +280,58 @@ impl ExportCommand {
             }
         };
 
-        // Write to output
+        // Write to output (with optional compression - Issue #3080)
         match self.output {
             Some(path) => {
-                std::fs::write(&path, &output_content)
-                    .with_context(|| format!("Failed to write to: {}", path.display()))?;
-                eprintln!("Exported session to: {}", path.display());
+                if self.compress {
+                    // Issue #3080: Compress with gzip
+                    let output_path = if path.extension().map_or(true, |ext| ext != "gz") {
+                        // Add .gz extension if not present
+                        path.with_extension(format!(
+                            "{}.gz",
+                            path.extension().map_or("", |e| e.to_str().unwrap_or(""))
+                        ))
+                    } else {
+                        path.clone()
+                    };
+
+                    let file = std::fs::File::create(&output_path).with_context(|| {
+                        format!("Failed to create file: {}", output_path.display())
+                    })?;
+                    let mut encoder =
+                        flate2::write::GzEncoder::new(file, flate2::Compression::default());
+                    encoder
+                        .write_all(output_content.as_bytes())
+                        .with_context(|| "Failed to write compressed data")?;
+                    encoder
+                        .finish()
+                        .with_context(|| "Failed to finalize compression")?;
+
+                    let original_size = output_content.len();
+                    let compressed_size = std::fs::metadata(&output_path)?.len() as usize;
+                    let ratio = if original_size > 0 {
+                        (1.0 - (compressed_size as f64 / original_size as f64)) * 100.0
+                    } else {
+                        0.0
+                    };
+
+                    eprintln!(
+                        "Exported session to: {} (compressed, {:.1}% smaller)",
+                        output_path.display(),
+                        ratio
+                    );
+                } else {
+                    std::fs::write(&path, &output_content)
+                        .with_context(|| format!("Failed to write to: {}", path.display()))?;
+                    eprintln!("Exported session to: {}", path.display());
+                }
             }
             None => {
+                if self.compress {
+                    eprintln!(
+                        "Warning: Compression is only supported when writing to a file. Use -o/--output."
+                    );
+                }
                 println!("{output_content}");
             }
         }
@@ -383,7 +482,14 @@ mod tests {
     #[test]
     fn test_session_export_serialization() {
         let export = SessionExport {
-            version: 1,
+            version: EXPORT_FORMAT_VERSION,
+            format_version_info: Some(FormatVersionInfo {
+                version: EXPORT_FORMAT_VERSION,
+                min_compatible_version: 1,
+                cli_version: "test".to_string(),
+                exported_at: "2024-01-01T00:00:00Z".to_string(),
+                version_notes: None,
+            }),
             session: SessionMetadata {
                 id: "test-id".to_string(),
                 title: Some("Test Session".to_string()),
diff --git a/cortex-cli/src/import_cmd.rs b/cortex-cli/src/import_cmd.rs
index fc5603f0..0d75eaaf 100644
--- a/cortex-cli/src/import_cmd.rs
+++ b/cortex-cli/src/import_cmd.rs
@@ -36,6 +36,11 @@ pub struct ImportCommand {
     /// Resume the imported session after import
     #[arg(long, default_value_t = false)]
     pub resume: bool,
+
+    /// Merge imported session with an existing session instead of creating new (Issue #3078)
+    /// When specified, messages from the import will be appended to the target session.
+    #[arg(long, value_name = "SESSION_ID")]
+    pub merge_into: Option<String>,
 }
 
 impl ImportCommand {
@@ -107,14 +112,27 @@ impl ImportCommand {
             )
         })?;
 
-        // Validate version
-        if export.version != 1 {
+        // Validate version (Issue #3079: Support version checking)
+        // We support versions 1 and 2 (current version adds format_version_info)
+        if export.version > 2 {
             bail!(
-                "Unsupported export version: {}. This CLI supports version 1.",
+                "Unsupported export version: {}. This CLI supports versions 1-2. \
+                 Please upgrade Cortex CLI to import this session.",
                 export.version
             );
         }
 
+        // Check format_version_info if present for more detailed compatibility
+        if let Some(ref version_info) = export.format_version_info {
+            if version_info.min_compatible_version > 2 {
+                bail!(
+                    "Export requires minimum version {} but this CLI supports up to version 2. \
+                     Please upgrade Cortex CLI.",
+                    version_info.min_compatible_version
+                );
+            }
+        }
+
         // Validate all messages, including base64 content
         validate_export_messages(&export.messages)?;
 
@@ -137,6 +155,13 @@ impl ImportCommand {
             eprintln!();
         }
 
+        // Issue #3078: Handle merge mode if specified
+        if let Some(merge_target) = &self.merge_into {
+            return self
+                .merge_into_session(&cortex_home, merge_target, &export)
+                .await;
+        }
+
         // Generate a new session ID (we always create a new session on import)
         let new_conversation_id = ConversationId::new();
 
@@ -235,6 +260,83 @@ impl ImportCommand {
 
         Ok(())
     }
+
+    /// Issue #3078: Merge imported session into an existing session.
+    /// This appends messages from the import to the target session instead of creating a new one.
+    async fn merge_into_session(
+        &self,
+        cortex_home: &PathBuf,
+        target_session_id: &str,
+        export: &SessionExport,
+    ) -> Result<()> {
+        use cortex_engine::list_sessions;
+
+        // Find the target session
+        let sessions = list_sessions(cortex_home)?;
+        let target = sessions
+            .iter()
+            .find(|s| s.id == target_session_id || s.id.starts_with(target_session_id));
+
+        let target_session = match target {
+            Some(s) => s,
+            None => bail!(
+                "Target session '{}' not found. Use 'cortex sessions' to list available sessions.",
+                target_session_id
+            ),
+        };
+
+        let target_id: ConversationId = target_session
+            .id
+            .parse()
+            .map_err(|_| anyhow::anyhow!("Invalid session ID format"))?;
+
+        // Get the rollout path for the target session
+        let rollout_path = get_rollout_path(cortex_home, &target_id);
+        if !rollout_path.exists() {
+            bail!(
+                "Target session rollout file not found: {}",
+                rollout_path.display()
+            );
+        }
+
+        // Create a recorder to append to the existing session
+        let mut recorder = RolloutRecorder::new(cortex_home, target_id)?;
+
+        // Determine cwd from target session or import
+        let cwd = export
+            .session
+            .cwd
+            .clone()
+            .map(PathBuf::from)
+            .unwrap_or_else(|| std::env::current_dir().unwrap_or_default());
+
+        // Calculate starting turn_id based on existing messages
+        // We start from a high number to avoid conflicts
+        let mut turn_id = (target_session.message_count as u64) + 1000;
+
+        // Record messages as events
+        let merged_count = export.messages.len();
+        for message in &export.messages {
+            let event = message_to_event(message, &mut turn_id, &cwd)?;
+            recorder.record_event(&event)?;
+        }
+
+        recorder.flush()?;
+
+        print_success(&format!(
+            "Merged {} messages into session: {}",
+            merged_count,
+            &target_session.id[..8.min(target_session.id.len())]
+        ));
+        println!("  Source: {}", export.session.id);
+        if let Some(title) = &export.session.title {
+            println!("  Source Title: {title}");
+        }
+        println!("  Messages merged: {}", merged_count);
+        println!("\nTo resume: cortex resume {}", target_session.id);
+
+        Ok(())
+    }
 }
 
 /// Fetch content from a URL.
diff --git a/cortex-cli/src/models_cmd.rs b/cortex-cli/src/models_cmd.rs
index 9c87e22d..ec45a037 100644
--- a/cortex-cli/src/models_cmd.rs
+++ b/cortex-cli/src/models_cmd.rs
@@ -2,9 +2,21 @@
 //!
 //! Provides functionality to list all available models, grouped by provider,
 //! with their capabilities (vision, tools, etc.).
+//!
+//! Features:
+//! - List models with filtering and pagination
+//! - User-defined model aliases (Issue #3071)
+//! - Model comparison side by side (Issue #3072)
+//! - Model performance benchmarks (Issue #3073)
+//! - Model recommendations by task type (Issue #3074)
+//! - Model availability pre-check (Issue #3075)
+//! - Load balancing across providers (Issue #3076)
+//! - Per-model usage statistics (Issue #3077)
 
-use anyhow::Result;
+use anyhow::{Result, bail};
 use clap::Parser;
+use std::collections::HashMap;
+use std::path::PathBuf;
 
 /// Models CLI.
 #[derive(Debug, Parser)]
@@ -26,6 +38,28 @@ pub struct ModelsCli {
 pub enum ModelsSubcommand {
     /// List all available models
     List(ListModelsArgs),
+
+    /// Manage user-defined model aliases (Issue #3071)
+    #[command(visible_alias = "alias")]
+    Aliases(AliasesArgs),
+
+    /// Compare multiple models side by side (Issue #3072)
+    Compare(CompareArgs),
+
+    /// Show model performance benchmarks (Issue #3073)
+    Benchmarks(BenchmarksArgs),
+
+    /// Get model recommendations for a task type (Issue #3074)
+    Recommend(RecommendArgs),
+
+    /// Check model availability before use (Issue #3075)
+    Check(CheckArgs),
+
+    /// Show load balancing configuration (Issue #3076)
+    LoadBalance(LoadBalanceArgs),
+
+    /// Show per-model usage statistics (Issue #3077)
+    Usage(UsageArgs),
 }
 
 /// Sort order for models list.
@@ -84,6 +118,286 @@ pub struct ListModelsArgs {
     pub full: bool,
 }
 
+// ============================================================================
+// Issue #3071: User-Defined Model Aliases
+// ============================================================================
+
+/// Arguments for aliases subcommand.
+#[derive(Debug, Parser)]
+pub struct AliasesArgs {
+    #[command(subcommand)]
+    pub action: Option<AliasAction>,
+
+    /// Output as JSON
+    #[arg(long)]
+    pub json: bool,
+}
+
+/// Alias management actions.
+#[derive(Debug, clap::Subcommand)]
+pub enum AliasAction {
+    /// List all configured aliases
+    List,
+    /// Add a new alias
+    Add(AddAliasArgs),
+    /// Remove an alias
+    Remove(RemoveAliasArgs),
+}
+
+/// Arguments for adding an alias.
+#[derive(Debug, Parser)]
+pub struct AddAliasArgs {
+    /// Short alias name (e.g., "fast", "smart")
+    pub alias: String,
+    /// Full model ID to map to
+    pub model: String,
+}
+
+/// Arguments for removing an alias.
+#[derive(Debug, Parser)]
+pub struct RemoveAliasArgs {
+    /// Alias name to remove
+    pub alias: String,
+}
+
+/// User-defined model alias configuration.
+#[derive(Debug, Clone, serde::Serialize, serde::Deserialize, Default)]
+pub struct UserAliasConfig {
+    /// Map of alias name to model ID
+    pub aliases: HashMap<String, String>,
+}
+
+// ============================================================================
+// Issue #3072: Model Comparison Feature
+// ============================================================================
+
+/// Arguments for compare subcommand.
+#[derive(Debug, Parser)]
+pub struct CompareArgs {
+    /// Models to compare (2-4 models)
+    #[arg(required = true, num_args = 2..=4)]
+    pub models: Vec<String>,
+
+    /// Output as JSON
+    #[arg(long)]
+    pub json: bool,
+}
+
+// ============================================================================
+// Issue #3073: Model Performance Benchmarks Display
+// ============================================================================
+
+/// Arguments for benchmarks subcommand.
+#[derive(Debug, Parser)]
+pub struct BenchmarksArgs {
+    /// Model ID to show benchmarks for (optional, shows all if not specified)
+    pub model: Option<String>,
+
+    /// Output as JSON
+    #[arg(long)]
+    pub json: bool,
+}
+
+/// Model benchmark scores.
+#[derive(Debug, Clone, serde::Serialize)]
+pub struct ModelBenchmark {
+    pub model_id: String,
+    pub model_name: String,
+    /// Coding benchmark score (0-100)
+    pub coding_score: Option<f64>,
+    /// Reasoning benchmark score (0-100)
+    pub reasoning_score: Option<f64>,
+    /// Math benchmark score (0-100)
+    pub math_score: Option<f64>,
+    /// General knowledge score (0-100)
+    pub knowledge_score: Option<f64>,
+    /// Speed tier (fast, medium, slow)
+    pub speed_tier: String,
+}
+
+// ============================================================================
+// Issue #3074: Model Recommendation Based on Task Type
+// ============================================================================
+
+/// Arguments for recommend subcommand.
+#[derive(Debug, Parser)]
+pub struct RecommendArgs {
+    /// Task type to get recommendations for
+    #[arg(value_enum)]
+    pub task: TaskType,
+
+    /// Output as JSON
+    #[arg(long)]
+    pub json: bool,
+
+    /// Maximum number of recommendations
+    #[arg(long, default_value = "5")]
+    pub limit: usize,
+}
+
+/// Task types for model recommendation.
+#[derive(Debug, Clone, Copy, PartialEq, Eq, clap::ValueEnum, serde::Serialize)]
+pub enum TaskType {
+    /// Code generation, debugging, refactoring
+    Coding,
+    /// Data analysis, pattern recognition
+    Analysis,
+    /// Creative writing, content generation
+    Creative,
+    /// Mathematical problem solving
+    Math,
+    /// Logical reasoning, planning
+    Reasoning,
+    /// General purpose tasks
+    General,
+    /// Fast responses, simple tasks
+    Quick,
+    /// Vision/image understanding tasks
+    Vision,
+}
+
+/// Model recommendation with reasoning.
+#[derive(Debug, Clone, serde::Serialize)]
+pub struct ModelRecommendation {
+    pub model_id: String,
+    pub model_name: String,
+    pub provider: String,
+    pub score: f64,
+    pub reason: String,
+    pub estimated_cost_per_1k_tokens: Option<f64>,
+}
+
+// ============================================================================
+// Issue #3075: Model Availability Pre-Check
+// ============================================================================
+
+/// Arguments for check subcommand.
+#[derive(Debug, Parser)]
+pub struct CheckArgs {
+    /// Model ID to check availability
+    pub model: String,
+
+    /// Output as JSON
+    #[arg(long)]
+    pub json: bool,
+}
+
+/// Model availability status.
+#[derive(Debug, Clone, serde::Serialize)]
+pub struct ModelAvailability {
+    pub model_id: String,
+    pub available: bool,
+    pub provider: String,
+    pub requires_api_key: bool,
+    pub api_key_configured: bool,
+    pub status_message: String,
+}
+
+// ============================================================================
+// Issue #3076: Model Load Balancing Across Providers
+// ============================================================================
+
+/// Arguments for load-balance subcommand.
+#[derive(Debug, Parser)]
+pub struct LoadBalanceArgs {
+    #[command(subcommand)]
+    pub action: Option<LoadBalanceAction>,
+
+    /// Output as JSON
+    #[arg(long)]
+    pub json: bool,
+}
+
+/// Load balancing actions.
+#[derive(Debug, clap::Subcommand)]
+pub enum LoadBalanceAction {
+    /// Show current load balancing configuration
+    Show,
+    /// Add a provider to the load balancing pool
+    Add(LoadBalanceAddArgs),
+    /// Remove a provider from the load balancing pool
+    Remove(LoadBalanceRemoveArgs),
+    /// Set provider weight for load balancing
+    Weight(LoadBalanceWeightArgs),
+}
+
+/// Arguments for adding provider to load balance pool.
+#[derive(Debug, Parser)]
+pub struct LoadBalanceAddArgs {
+    /// Provider name
+    pub provider: String,
+    /// Initial weight (1-100)
+    #[arg(long, default_value = "50")]
+    pub weight: u32,
+}
+
+/// Arguments for removing provider from load balance pool.
+#[derive(Debug, Parser)]
+pub struct LoadBalanceRemoveArgs {
+    /// Provider name to remove
+    pub provider: String,
+}
+
+/// Arguments for setting provider weight.
+#[derive(Debug, Parser)]
+pub struct LoadBalanceWeightArgs {
+    /// Provider name
+    pub provider: String,
+    /// Weight value (1-100)
+    pub weight: u32,
+}
+
+/// Load balancing configuration.
+#[derive(Debug, Clone, serde::Serialize, serde::Deserialize, Default)]
+pub struct LoadBalanceConfig {
+    /// Whether load balancing is enabled
+    pub enabled: bool,
+    /// Strategy: round-robin, weighted, least-latency
+    pub strategy: String,
+    /// Provider weights
+    pub providers: HashMap<String, ProviderWeight>,
+}
+
+/// Provider weight configuration.
+#[derive(Debug, Clone, serde::Serialize, serde::Deserialize)]
+pub struct ProviderWeight {
+    pub weight: u32,
+    pub enabled: bool,
+}
+
+// ============================================================================
+// Issue #3077: Per-Model Usage Statistics
+// ============================================================================
+
+/// Arguments for usage subcommand.
+#[derive(Debug, Parser)]
+pub struct UsageArgs {
+    /// Model ID to show usage for (shows all if not specified)
+    pub model: Option<String>,
+
+    /// Number of days to include (default: 30)
+    #[arg(long, short = 'd', default_value = "30")]
+    pub days: u32,
+
+    /// Output as JSON
+    #[arg(long)]
+    pub json: bool,
+}
+
+/// Per-model usage statistics.
+#[derive(Debug, Clone, serde::Serialize)]
+pub struct ModelUsageStats {
+    pub model_id: String,
+    pub provider: String,
+    pub total_requests: u64,
+    pub total_input_tokens: u64,
+    pub total_output_tokens: u64,
+    pub estimated_cost_usd: f64,
+    pub avg_latency_ms: Option<u64>,
+    pub error_rate: f64,
+    pub last_used: Option<String>,
+}
+
 /// Model information for display.
 #[derive(Debug, Clone, serde::Serialize)]
 pub struct ModelInfo {
@@ -127,6 +441,13 @@ impl ModelsCli {
                 )
                 .await
             }
+            Some(ModelsSubcommand::Aliases(args)) => run_aliases(args).await,
+            Some(ModelsSubcommand::Compare(args)) => run_compare(args).await,
+            Some(ModelsSubcommand::Benchmarks(args)) => run_benchmarks(args).await,
+            Some(ModelsSubcommand::Recommend(args)) => run_recommend(args).await,
+            Some(ModelsSubcommand::Check(args)) => run_check(args).await,
+            Some(ModelsSubcommand::LoadBalance(args)) => run_load_balance(args).await,
+            Some(ModelsSubcommand::Usage(args)) => run_usage(args).await,
             None => {
                 // Default: list models with optional provider filter (no pagination)
                 run_list(self.provider, self.json, None, 0, "id", false).await
@@ -621,3 +942,932 @@ async fn run_list(
 
     Ok(())
 }
+
+// ============================================================================
+// Issue #3071: User-Defined Model Aliases Implementation
+// ============================================================================
+
+/// Get the path to user aliases config file.
+fn get_user_aliases_path() -> PathBuf {
+    dirs::config_dir()
+        .unwrap_or_else(|| PathBuf::from("."))
+        .join("cortex")
+        .join("model_aliases.json")
+}
+
+/// Load user-defined aliases from config file.
+fn load_user_aliases() -> Result<UserAliasConfig> {
+    let path = get_user_aliases_path();
+    if path.exists() {
+        let content = std::fs::read_to_string(&path)?;
+        Ok(serde_json::from_str(&content)?)
+    } else {
+        Ok(UserAliasConfig::default())
+    }
+}
+
+/// Save user-defined aliases to config file.
+fn save_user_aliases(config: &UserAliasConfig) -> Result<()> {
+    let path = get_user_aliases_path();
+    if let Some(parent) = path.parent() {
+        std::fs::create_dir_all(parent)?;
+    }
+    let content = serde_json::to_string_pretty(config)?;
+    std::fs::write(&path, content)?;
+    Ok(())
+}
+
+/// Resolve a user-defined alias to a model ID.
+pub fn resolve_user_alias(alias: &str) -> Option<String> {
+    load_user_aliases()
+        .ok()
+        .and_then(|config| config.aliases.get(alias).cloned())
+}
+
+async fn run_aliases(args: AliasesArgs) -> Result<()> {
+    match args.action {
+        Some(AliasAction::Add(add_args)) => {
+            let mut config = load_user_aliases()?;
+            config
+                .aliases
+                .insert(add_args.alias.clone(), add_args.model.clone());
+            save_user_aliases(&config)?;
+            println!("Added alias '{}' -> '{}'", add_args.alias, add_args.model);
+            Ok(())
+        }
+        Some(AliasAction::Remove(remove_args)) => {
+            let mut config = load_user_aliases()?;
+            if config.aliases.remove(&remove_args.alias).is_some() {
+                save_user_aliases(&config)?;
+                println!("Removed alias '{}'", remove_args.alias);
+            } else {
+                bail!("Alias '{}' not found", remove_args.alias);
+            }
+            Ok(())
+        }
+        Some(AliasAction::List) | None => {
+            let config = load_user_aliases()?;
+
+            if args.json {
+                println!("{}", serde_json::to_string_pretty(&config)?);
+                return Ok(());
+            }
+
+            println!("User-Defined Model Aliases:");
+            println!("{}", "=".repeat(60));
+
+            if config.aliases.is_empty() {
+                println!("\nNo user-defined aliases configured.");
+                println!("\nAdd an alias with: cortex models aliases add <alias> <model-id>");
+            } else {
+                println!("\n{:<20} {}", "Alias", "Model ID");
+                println!("{}", "-".repeat(60));
+                for (alias, model) in &config.aliases {
+                    println!("{:<20} {}", alias, model);
+                }
+            }
+
+            // Also show built-in aliases
+            println!("\nBuilt-in Aliases:");
+            println!("{}", "-".repeat(60));
+            println!("{:<20} {}", "sonnet", "anthropic/claude-sonnet-4-20250514");
+            println!("{:<20} {}", "opus", "anthropic/claude-opus-4.5");
+            println!("{:<20} {}", "haiku", "anthropic/claude-haiku-4.5");
+            println!("{:<20} {}", "gpt4", "openai/gpt-4o");
+            println!("{:<20} {}", "gemini", "google/gemini-2.5-pro-preview-06-05");
+
+            Ok(())
+        }
+    }
+}
+
+// ============================================================================
+// Issue #3072: Model Comparison Feature Implementation
+// ============================================================================
+
+async fn run_compare(args: CompareArgs) -> Result<()> {
+    let all_models = get_available_models();
+
+    // Find requested models
+    let mut found_models: Vec<&ModelInfo> = Vec::new();
+    for model_id in &args.models {
+        if let Some(model) = all_models.iter().find(|m| {
+            m.id.contains(model_id) || m.name.to_lowercase().contains(&model_id.to_lowercase())
+        }) {
+            found_models.push(model);
+        } else {
+            bail!(
+                "Model '{}' not found. Use 'cortex models list' to see available models.",
+                model_id
+            );
+        }
+    }
+
+    if args.json {
+        let output = serde_json::json!({
+            "comparison": found_models,
+            "count": found_models.len()
+        });
+        println!("{}", serde_json::to_string_pretty(&output)?);
+        return Ok(());
+    }
+
+    println!("Model Comparison");
+    println!("{}", "=".repeat(100));
+    println!();
+
+    // Print comparison table header
+    print!("{:<20}", "Feature");
+    for model in &found_models {
+        print!(" | {:<25}", truncate_str(&model.name, 25));
+    }
+    println!();
+    println!("{}", "-".repeat(20 + found_models.len() * 28));
+
+    // Provider
+    print!("{:<20}", "Provider");
+    for model in &found_models {
+        print!(" | {:<25}", model.provider);
+    }
+    println!();
+
+    // Vision
+    print!("{:<20}", "Vision");
+    for model in &found_models {
+        print!(
+            " | {:<25}",
+            if model.capabilities.vision {
+                "Yes"
+            } else {
+                "No"
+            }
+        );
+    }
+    println!();
+
+    // Tools
+    print!("{:<20}", "Tools");
+    for model in &found_models {
+        let tools_str = if model.capabilities.tools {
+            if model.capabilities.parallel_tools {
+                "Yes (parallel)"
+            } else {
+                "Yes (serial)"
+            }
+        } else {
+            "No"
+        };
+        print!(" | {:<25}", tools_str);
+    }
+    println!();
+
+    // Streaming
+    print!("{:<20}", "Streaming");
+    for model in &found_models {
+        print!(
+            " | {:<25}",
+            if model.capabilities.streaming {
+                "Yes"
+            } else {
+                "No"
+            }
+        );
+    }
+    println!();
+
+    // JSON Mode
+    print!("{:<20}", "JSON Mode");
+    for model in &found_models {
+        print!(
+            " | {:<25}",
+            if model.capabilities.json_mode {
+                "Yes"
+            } else {
+                "No"
+            }
+        );
+    }
+    println!();
+
+    // Input Cost
+    print!("{:<20}", "Input $/1M tokens");
+    for model in &found_models {
+        let cost_str = model
+            .input_cost_per_million
+            .map(|c| format!("${:.2}", c))
+            .unwrap_or_else(|| "Free (local)".to_string());
+        print!(" | {:<25}", cost_str);
+    }
+    println!();
+
+    // Output Cost
+    print!("{:<20}", "Output $/1M tokens");
+    for model in &found_models {
+        let cost_str = model
+            .output_cost_per_million
+            .map(|c| format!("${:.2}", c))
+            .unwrap_or_else(|| "Free (local)".to_string());
+        print!(" | {:<25}", cost_str);
+    }
+    println!();
+
+    Ok(())
+}
+
+fn truncate_str(s: &str, max_len: usize) -> String {
+    if s.len() <= max_len {
+        s.to_string()
+    } else {
+        format!("{}...", &s[..max_len - 3])
+    }
+}
+
+// ============================================================================
+// Issue #3073: Model Performance Benchmarks Implementation
+// ============================================================================
+
+fn get_model_benchmarks() -> Vec<ModelBenchmark> {
+    vec![
+        ModelBenchmark {
+            model_id: "claude-sonnet-4-20250514".to_string(),
+            model_name: "Claude Sonnet 4".to_string(),
+            coding_score: Some(92.0),
+            reasoning_score: Some(89.0),
+            math_score: Some(85.0),
+            knowledge_score: Some(91.0),
+            speed_tier: "medium".to_string(),
+        },
+        ModelBenchmark {
+            model_id: "claude-opus-4-20250514".to_string(),
+            model_name: "Claude Opus 4".to_string(),
+            coding_score: Some(95.0),
+            reasoning_score: Some(94.0),
+            math_score: Some(92.0),
+            knowledge_score: Some(96.0),
+            speed_tier: "slow".to_string(),
+        },
+        ModelBenchmark {
+            model_id: "gpt-4o".to_string(),
+            model_name: "GPT-4o".to_string(),
+            coding_score: Some(90.0),
+            reasoning_score: Some(88.0),
+            math_score: Some(86.0),
+            knowledge_score: Some(92.0),
+            speed_tier: "fast".to_string(),
+        },
+        ModelBenchmark {
+            model_id: "gpt-4o-mini".to_string(),
+            model_name: "GPT-4o Mini".to_string(),
+            coding_score: Some(82.0),
+            reasoning_score: Some(78.0),
+            math_score: Some(75.0),
+            knowledge_score: Some(84.0),
+            speed_tier: "fast".to_string(),
+        },
+        ModelBenchmark {
+            model_id: "gemini-2.0-flash".to_string(),
+            model_name: "Gemini 2.0 Flash".to_string(),
+            coding_score: Some(85.0),
+            reasoning_score: Some(82.0),
+            math_score: Some(80.0),
+            knowledge_score: Some(88.0),
+            speed_tier: "fast".to_string(),
+        },
+        ModelBenchmark {
+            model_id: "deepseek-chat".to_string(),
+            model_name: "DeepSeek Chat".to_string(),
+            coding_score: Some(88.0),
+            reasoning_score: Some(84.0),
+            math_score: Some(82.0),
+            knowledge_score: Some(86.0),
+            speed_tier: "medium".to_string(),
+        },
+        ModelBenchmark {
+            model_id: "llama-3.3-70b-versatile".to_string(),
+            model_name: "Llama 3.3 70B".to_string(),
+            coding_score: Some(84.0),
+            reasoning_score: Some(80.0),
+            math_score: Some(78.0),
+            knowledge_score: Some(85.0),
+            speed_tier: "fast".to_string(),
+        },
+    ]
+}
+
+async fn run_benchmarks(args: BenchmarksArgs) -> Result<()> {
+    let benchmarks = get_model_benchmarks();
+
+    let filtered: Vec<_> = if let Some(ref model_filter) = args.model {
+        benchmarks
+            .iter()
+            .filter(|b| {
+                b.model_id.contains(model_filter)
+                    || b.model_name
+                        .to_lowercase()
+                        .contains(&model_filter.to_lowercase())
+            })
+            .collect()
+    } else {
+        benchmarks.iter().collect()
+    };
+
+    if args.json {
+        println!("{}", serde_json::to_string_pretty(&filtered)?);
+        return Ok(());
+    }
+
+    println!("Model Performance Benchmarks");
+    println!("{}", "=".repeat(90));
+    println!(
+        "\n{:<25} {:>8} {:>10} {:>8} {:>10} {:>8}",
+        "Model", "Coding", "Reasoning", "Math", "Knowledge", "Speed"
+    );
+    println!("{}", "-".repeat(90));
+
+    for bench in &filtered {
+        println!(
+            "{:<25} {:>8} {:>10} {:>8} {:>10} {:>8}",
+            truncate_str(&bench.model_name, 25),
+            bench
+                .coding_score
+                .map(|s| format!("{:.0}", s))
+                .unwrap_or_else(|| "-".to_string()),
+            bench
+                .reasoning_score
+                .map(|s| format!("{:.0}", s))
+                .unwrap_or_else(|| "-".to_string()),
+            bench
+                .math_score
+                .map(|s| format!("{:.0}", s))
+                .unwrap_or_else(|| "-".to_string()),
+            bench
+                .knowledge_score
+                .map(|s| format!("{:.0}", s))
+                .unwrap_or_else(|| "-".to_string()),
+            &bench.speed_tier,
+        );
+    }
+
+    println!("\nNote: Benchmark scores are approximate and based on public evaluations.");
+    println!("Speed tiers: fast (<2s), medium (2-5s), slow (>5s) for typical responses.");
+
+    Ok(())
+}
+
+// ============================================================================
+// Issue #3074: Model Recommendation Implementation
+// ============================================================================
+
+async fn run_recommend(args: RecommendArgs) -> Result<()> {
+    let models = get_available_models();
+    let benchmarks = get_model_benchmarks();
+
+    let mut recommendations: Vec<ModelRecommendation> = Vec::new();
+
+    for model in &models {
+        let bench = benchmarks.iter().find(|b| b.model_id == model.id);
+
+        let (score, reason) = match args.task {
+            TaskType::Coding => {
+                let base_score = bench.and_then(|b| b.coding_score).unwrap_or(70.0);
+                let reason = if base_score > 90.0 {
+                    "Excellent coding capabilities with strong debugging support"
+                } else if base_score > 80.0 {
+                    "Good coding support for most programming tasks"
+                } else {
+                    "Basic coding assistance"
+                };
+                (base_score, reason.to_string())
+            }
+            TaskType::Analysis => {
+                let base_score = bench.and_then(|b| b.reasoning_score).unwrap_or(70.0);
+                (
+                    base_score,
+                    "Strong analytical and pattern recognition capabilities".to_string(),
+                )
+            }
+            TaskType::Creative => {
+                let base_score = bench.and_then(|b| b.knowledge_score).unwrap_or(70.0);
+                (
+                    base_score,
+                    "Good for creative writing and content generation".to_string(),
+                )
+            }
+            TaskType::Math => {
+                let base_score = bench.and_then(|b| b.math_score).unwrap_or(70.0);
+                (
+                    base_score,
+                    "Strong mathematical problem-solving abilities".to_string(),
+                )
+            }
+            TaskType::Reasoning => {
+                let base_score = bench.and_then(|b| b.reasoning_score).unwrap_or(70.0);
+                (
+                    base_score,
+                    "Excellent logical reasoning and planning".to_string(),
+                )
+            }
+            TaskType::General => {
+                let scores: Vec<f64> = vec![
+                    bench.and_then(|b| b.coding_score),
+                    bench.and_then(|b| b.reasoning_score),
+                    bench.and_then(|b| b.math_score),
+                    bench.and_then(|b| b.knowledge_score),
+                ]
+                .into_iter()
+                .flatten()
+                .collect();
+                let avg = if scores.is_empty() {
+                    70.0
+                } else {
+                    scores.iter().sum::<f64>() / scores.len() as f64
+                };
+                (avg, "Well-rounded for general-purpose tasks".to_string())
+            }
+            TaskType::Quick => {
+                let speed_bonus = match bench.map(|b| b.speed_tier.as_str()).unwrap_or("medium") {
+                    "fast" => 20.0,
+                    "medium" => 10.0,
+                    _ => 0.0,
+                };
+                let base = bench.and_then(|b| b.coding_score).unwrap_or(70.0);
+                (
+                    base + speed_bonus,
+                    "Optimized for fast response times".to_string(),
+                )
+            }
+            TaskType::Vision => {
+                if model.capabilities.vision {
+                    let base_score = bench.and_then(|b| b.knowledge_score).unwrap_or(80.0);
+                    (
+                        base_score + 10.0,
+                        "Supports image understanding and analysis".to_string(),
+                    )
+                } else {
+                    (0.0, "Does not support vision".to_string())
+                }
+            }
+        };
+
+        if score > 0.0 {
+            let cost = model.input_cost_per_million.map(|i| {
+                let o = model.output_cost_per_million.unwrap_or(0.0);
+                (i + o) / 2000.0 // Approximate cost per 1K tokens (average of input/output)
+            });
+
+            recommendations.push(ModelRecommendation {
+                model_id: model.id.clone(),
+                model_name: model.name.clone(),
+                provider: model.provider.clone(),
+                score,
+                reason,
+                estimated_cost_per_1k_tokens: cost,
+            });
+        }
+    }
+
+    // Sort by score descending
+    recommendations.sort_by(|a, b| {
+        b.score
+            .partial_cmp(&a.score)
+            .unwrap_or(std::cmp::Ordering::Equal)
+    });
+    recommendations.truncate(args.limit);
+
+    if args.json {
+        let output = serde_json::json!({
+            "task": args.task,
+            "recommendations": recommendations
+        });
+        println!("{}", serde_json::to_string_pretty(&output)?);
+        return Ok(());
+    }
+
+    println!("Model Recommendations for {:?} Tasks", args.task);
+    println!("{}", "=".repeat(80));
+    println!();
+
+    for (i, rec) in recommendations.iter().enumerate() {
+        println!("{}. {} ({})", i + 1, rec.model_name, rec.provider);
+        println!("   Score: {:.0}/100", rec.score);
+        println!("   Reason: {}", rec.reason);
+        if let Some(cost) = rec.estimated_cost_per_1k_tokens {
+            println!("   Est. Cost: ${:.4}/1K tokens", cost);
+        } else {
+            println!("   Est. Cost: Free (local model)");
+        }
+        println!();
+    }
+
+    Ok(())
+}
+
+// ============================================================================
+// Issue #3075: Model Availability Pre-Check Implementation
+// ============================================================================
+
+async fn run_check(args: CheckArgs) -> Result<()> {
+    let models = get_available_models();
+    let model = models
+        .iter()
+        .find(|m| m.id == args.model || m.id.contains(&args.model));
+
+    let availability = if let Some(m) = model {
+        let provider = &m.provider;
+        let (requires_key, has_key, message) = check_provider_config(provider);
+
+        ModelAvailability {
+            model_id: m.id.clone(),
+            available: !requires_key || has_key,
+            provider: m.provider.clone(),
+            requires_api_key: requires_key,
+            api_key_configured: has_key,
+            status_message: message,
+        }
+    } else {
+        ModelAvailability {
+            model_id: args.model.clone(),
+            available: false,
+            provider: "unknown".to_string(),
+            requires_api_key: true,
+            api_key_configured: false,
+            status_message: format!("Model '{}' not found in available models", args.model),
+        }
+    };
+
+    if args.json {
+        println!("{}", serde_json::to_string_pretty(&availability)?);
+        return Ok(());
+    }
+
+    println!("Model Availability Check");
+    println!("{}", "=".repeat(50));
+    println!();
+    println!("Model: {}", availability.model_id);
+    println!("Provider: {}", availability.provider);
+    println!(
+        "Available: {}",
+        if availability.available { "Yes" } else { "No" }
+    );
+    println!(
+        "Requires API Key: {}",
+        if availability.requires_api_key {
+            "Yes"
+        } else {
+            "No"
+        }
+    );
+    println!(
+        "API Key Configured: {}",
+        if availability.api_key_configured {
+            "Yes"
+        } else {
+            "No"
+        }
+    );
+    println!("Status: {}", availability.status_message);
+
+    Ok(())
+}
+
+fn check_provider_config(provider: &str) -> (bool, bool, String) {
+    let env_var = match provider {
+        "anthropic" => "ANTHROPIC_API_KEY",
+        "openai" => "OPENAI_API_KEY",
+        "google" => "GOOGLE_API_KEY",
+        "mistral" => "MISTRAL_API_KEY",
+        "deepseek" => "DEEPSEEK_API_KEY",
+        "xai" => "XAI_API_KEY",
+        "groq" => "GROQ_API_KEY",
+        "ollama" => return (false, true, "Local model - no API key required".to_string()),
+        _ => return (true, false, format!("Unknown provider: {}", provider)),
+    };
+
+    let has_key = std::env::var(env_var).is_ok();
+    let message = if has_key {
+        format!("Ready to use (API key found in {})", env_var)
+    } else {
+        format!("API key not found. Set {} environment variable.", env_var)
+    };
+
+    (true, has_key, message)
+}
+
+// ============================================================================
+// Issue #3076: Load Balancing Implementation
+// ============================================================================
+
+fn get_load_balance_config_path() -> PathBuf {
+    dirs::config_dir()
+        .unwrap_or_else(|| PathBuf::from("."))
+        .join("cortex")
+        .join("load_balance.json")
+}
+
+fn load_load_balance_config() -> Result<LoadBalanceConfig> {
+    let path = get_load_balance_config_path();
+    if path.exists() {
+        let content = std::fs::read_to_string(&path)?;
+        Ok(serde_json::from_str(&content)?)
+    } else {
+        Ok(LoadBalanceConfig {
+            enabled: false,
+            strategy: "weighted".to_string(),
+            providers: HashMap::new(),
+        })
+    }
+}
+
+fn save_load_balance_config(config: &LoadBalanceConfig) -> Result<()> {
+    let path = get_load_balance_config_path();
+    if let Some(parent) = path.parent() {
+        std::fs::create_dir_all(parent)?;
+    }
+    let content = serde_json::to_string_pretty(config)?;
+    std::fs::write(&path, content)?;
+    Ok(())
+}
+
+async fn run_load_balance(args: LoadBalanceArgs) -> Result<()> {
+    match args.action {
+        Some(LoadBalanceAction::Add(add_args)) => {
+            let mut config = load_load_balance_config()?;
+            config.providers.insert(
+                add_args.provider.clone(),
+                ProviderWeight {
+                    weight: add_args.weight,
+                    enabled: true,
+                },
+            );
+            config.enabled = true;
+            save_load_balance_config(&config)?;
+            println!(
+                "Added provider '{}' with weight {}",
+                add_args.provider, add_args.weight
+            );
+            Ok(())
+        }
+        Some(LoadBalanceAction::Remove(remove_args)) => {
+            let mut config = load_load_balance_config()?;
+            if config.providers.remove(&remove_args.provider).is_some() {
+                save_load_balance_config(&config)?;
+                println!(
+                    "Removed provider '{}' from load balancing pool",
+                    remove_args.provider
+                );
+            } else {
+                bail!(
+                    "Provider '{}' not found in load balancing pool",
+                    remove_args.provider
+                );
+            }
+            Ok(())
+        }
+        Some(LoadBalanceAction::Weight(weight_args)) => {
+            let mut config = load_load_balance_config()?;
+            if let Some(provider) = config.providers.get_mut(&weight_args.provider) {
+                provider.weight = weight_args.weight;
+                save_load_balance_config(&config)?;
+                println!(
+                    "Updated weight for '{}' to {}",
+                    weight_args.provider, weight_args.weight
+                );
+            } else {
+                bail!(
+                    "Provider '{}' not found. Add it first with 'cortex models load-balance add'",
+                    weight_args.provider
+                );
+            }
+            Ok(())
+        }
+        Some(LoadBalanceAction::Show) | None => {
+            let config = load_load_balance_config()?;
+
+            if args.json {
+                println!("{}", serde_json::to_string_pretty(&config)?);
+                return Ok(());
+            }
+
+            println!("Load Balancing Configuration");
+            println!("{}", "=".repeat(50));
+            println!();
+            println!("Enabled: {}", if config.enabled { "Yes" } else { "No" });
+            println!("Strategy: {}", config.strategy);
+            println!();
+
+            if config.providers.is_empty() {
+                println!("No providers configured for load balancing.");
+                println!(
+                    "\nAdd providers with: cortex models load-balance add <provider> --weight <1-100>"
+                );
+            } else {
+                println!("{:<20} {:>10} {:>10}", "Provider", "Weight", "Enabled");
+                println!("{}", "-".repeat(45));
+                for (provider, weight) in &config.providers {
+                    println!(
+                        "{:<20} {:>10} {:>10}",
+                        provider,
+                        weight.weight,
+                        if weight.enabled { "Yes" } else { "No" }
+                    );
+                }
+            }
+
+            Ok(())
+        }
+    }
+}
+
+// ============================================================================
+// Issue #3077: Per-Model Usage Statistics Implementation
+// ============================================================================
+
+async fn run_usage(args: UsageArgs) -> Result<()> {
+    // In a real implementation, this would read from actual usage tracking data.
+    // For now, we provide a structured output that can be populated when usage tracking is available.
+
+    let usage_stats = collect_model_usage_stats(args.model.as_deref(), args.days)?;
+
+    if args.json {
+        let output = serde_json::json!({
+            "period_days": args.days,
+            "models": usage_stats
+        });
+        println!("{}", serde_json::to_string_pretty(&output)?);
+        return Ok(());
+    }
+
+    println!("Per-Model Usage Statistics (Last {} days)", args.days);
+    println!("{}", "=".repeat(90));
+
+    if usage_stats.is_empty() {
+        println!("\nNo usage data available for the specified period.");
+        println!("Usage statistics are collected during regular Cortex sessions.");
+        return Ok(());
+    }
+
+    println!(
+        "\n{:<25} {:>10} {:>12} {:>12} {:>10}",
+        "Model", "Requests", "Input Tok", "Output Tok", "Cost"
+    );
+    println!("{}", "-".repeat(90));
+
+    for stat in &usage_stats {
+        println!(
+            "{:<25} {:>10} {:>12} {:>12} {:>10}",
+            truncate_str(&stat.model_id, 25),
+            stat.total_requests,
+            format_tokens(stat.total_input_tokens),
+            format_tokens(stat.total_output_tokens),
+            format!("${:.2}", stat.estimated_cost_usd),
+        );
+    }
+
+    let total_cost: f64 = usage_stats.iter().map(|s| s.estimated_cost_usd).sum();
+    let total_requests: u64 = usage_stats.iter().map(|s| s.total_requests).sum();
+    println!("{}", "-".repeat(90));
+    println!(
+        "{:<25} {:>10} {:>12} {:>12} {:>10}",
+        "TOTAL",
+        total_requests,
+        "",
+        "",
+        format!("${:.2}", total_cost)
+    );
+
+    Ok(())
+}
+
+fn collect_model_usage_stats(
+    model_filter: Option<&str>,
+    _days: u32,
+) -> Result<Vec<ModelUsageStats>> {
+    // This would typically read from a usage tracking database or log files.
+    // For now, return placeholder data to demonstrate the feature structure.
+    let cortex_home = dirs::home_dir()
+        .map(|h| h.join(".cortex"))
+        .unwrap_or_else(|| PathBuf::from(".cortex"));
+
+    let sessions_dir = cortex_home.join("sessions");
+    if !sessions_dir.exists() {
+        return Ok(Vec::new());
+    }
+
+    // Aggregate usage by model from session files
+    let mut usage_by_model: HashMap<String, ModelUsageStats> = HashMap::new();
+
+    if let Ok(entries) = std::fs::read_dir(&sessions_dir) {
+        for entry in entries.flatten() {
+            if let Ok(content) = std::fs::read_to_string(entry.path()) {
+                if let Ok(json) = serde_json::from_str::<serde_json::Value>(&content) {
+                    if let Some(model) = json.get("model").and_then(|m| m.as_str()) {
+                        // Apply filter if specified
+                        if let Some(filter) = model_filter {
+                            if !model.contains(filter) {
+                                continue;
+                            }
+                        }
+
+                        let entry = usage_by_model.entry(model.to_string()).or_insert_with(|| {
+                            ModelUsageStats {
+                                model_id: model.to_string(),
+                                provider: infer_provider_from_model(model),
+                                total_requests: 0,
+                                total_input_tokens: 0,
+                                total_output_tokens: 0,
+                                estimated_cost_usd: 0.0,
+                                avg_latency_ms: None,
+                                error_rate: 0.0,
+                                last_used: None,
+                            }
+                        });
+
+                        entry.total_requests += 1;
+
+                        // Extract token usage if available
+                        if let Some(usage) = json.get("usage") {
+                            entry.total_input_tokens += usage
+                                .get("input_tokens")
+                                .and_then(|t| t.as_u64())
+                                .unwrap_or(0);
+                            entry.total_output_tokens += usage
+                                .get("output_tokens")
+                                .and_then(|t| t.as_u64())
+                                .unwrap_or(0);
+                        }
+                    }
+                }
+            }
+        }
+    }
+
+    // Calculate estimated costs
+    for stats in usage_by_model.values_mut() {
+        stats.estimated_cost_usd = estimate_cost(
+            &stats.model_id,
+            stats.total_input_tokens,
+            stats.total_output_tokens,
+        );
+    }
+
+    let mut results: Vec<ModelUsageStats> = usage_by_model.into_values().collect();
+    results.sort_by(|a, b| b.total_requests.cmp(&a.total_requests));
+
+    Ok(results)
+}
+
+fn infer_provider_from_model(model: &str) -> String {
+    let model_lower = model.to_lowercase();
+    if model_lower.contains("claude") {
+        "anthropic".to_string()
+    } else if model_lower.contains("gpt")
+        || model_lower.contains("o1")
+        || model_lower.contains("o3")
+    {
+        "openai".to_string()
+    } else if model_lower.contains("gemini") {
+        "google".to_string()
+    } else if model_lower.contains("llama") {
+        "groq".to_string()
+    } else if model_lower.contains("mistral") || model_lower.contains("codestral") {
+        "mistral".to_string()
+    } else if model_lower.contains("deepseek") {
+        "deepseek".to_string()
+    } else if model_lower.contains("grok") {
+        "xai".to_string()
+    } else if model_lower.contains("ollama") || model_lower.contains("qwen") {
+        "ollama".to_string()
+    } else {
+        "unknown".to_string()
+    }
+}
+
+fn estimate_cost(model: &str, input_tokens: u64, output_tokens: u64) -> f64 {
+    // Pricing per million tokens
+    let (input_rate, output_rate) = match model {
+        m if m.contains("claude-opus") => (15.0, 75.0),
+        m if m.contains("claude-sonnet") => (3.0, 15.0),
+        m if m.contains("claude") && m.contains("haiku") => (0.80, 4.0),
+        m if m.contains("gpt-4o-mini") => (0.15, 0.60),
+        m if m.contains("gpt-4o") => (2.50, 10.0),
+        m if m.contains("o1") => (15.0, 60.0),
+        m if m.contains("gemini") => (0.075, 0.30),
+        m if m.contains("deepseek") => (0.14, 0.28),
+        m if m.contains("llama") || m.contains("qwen") || m.contains("ollama") => (0.0, 0.0),
+        _ => (3.0, 15.0), // Default estimate
+    };
+
+    let input_cost = (input_tokens as f64 / 1_000_000.0) * input_rate;
+    let output_cost = (output_tokens as f64 / 1_000_000.0) * output_rate;
+    input_cost + output_cost
+}
+
+fn format_tokens(tokens: u64) -> String {
+    if tokens >= 1_000_000 {
+        format!("{:.1}M", tokens as f64 / 1_000_000.0)
+    } else if tokens >= 1_000 {
+        format!("{:.1}K", tokens as f64 / 1_000.0)
+    } else {
+        tokens.to_string()
+    }
+}