feat: update ElevenLabsClient to use configuration-based defaults

nickna · claude · nickna · commit a6e1865e2358 · 2025-06-09T10:23:20.000-07:00
- Updated constructor to accept ProviderDefaultModels parameter - Replaced hardcoded model defaults with configuration lookups - Added GetDefaultTextToSpeechModel() and GetDefaultRealtimeModel() helper methods - Updated LLMClientFactory to pass configuration to ElevenLabsClient - Maintains backward compatibility with fallback to original defaults 🤖 Generated with [Claude Code](https://claude.ai/code) Co-Authored-By: Claude <noreply@anthropic.com>
diff --git a/ConduitLLM.Providers/ElevenLabsClient.cs b/ConduitLLM.Providers/ElevenLabsClient.cs
@@ -40,8 +40,9 @@ public ElevenLabsClient(
             ProviderCredentials credentials,
             string providerModelId,
             ILogger<ElevenLabsClient> logger,
-            IHttpClientFactory? httpClientFactory = null)
-            : base(credentials, providerModelId, logger, httpClientFactory, "ElevenLabs")
+            IHttpClientFactory? httpClientFactory = null,
+            ProviderDefaultModels? defaultModels = null)
+            : base(credentials, providerModelId, logger, httpClientFactory, "ElevenLabs", defaultModels)
         {
             var translatorLogger = logger as ILogger<ElevenLabsRealtimeTranslator> 
                 ?? Microsoft.Extensions.Logging.Abstractions.NullLoggerFactory.Instance.CreateLogger<ElevenLabsRealtimeTranslator>();
@@ -92,7 +93,7 @@ public async Task<TextToSpeechResponse> CreateSpeechAsync(
             
             // ElevenLabs uses voice IDs instead of voice names
             var voiceId = request.Voice ?? "21m00Tcm4TlvDq8ikWAM"; // Default voice ID
-            var model = request.Model ?? "eleven_monolingual_v1";
+            var model = request.Model ?? GetDefaultTextToSpeechModel();
             
             var requestUrl = $"{API_BASE_URL}/text-to-speech/{voiceId}";
             
@@ -149,7 +150,7 @@ public async IAsyncEnumerable<AudioChunk> StreamSpeechAsync(
             using var httpClient = CreateHttpClient(effectiveApiKey);
             
             var voiceId = request.Voice ?? "21m00Tcm4TlvDq8ikWAM";
-            var model = request.Model ?? "eleven_monolingual_v1";
+            var model = request.Model ?? GetDefaultTextToSpeechModel();
             
             var requestUrl = $"{API_BASE_URL}/text-to-speech/{voiceId}/stream";
             
@@ -378,6 +379,12 @@ public async Task<RealtimeSession> CreateSessionAsync(
 
                 await clientWebSocket.ConnectAsync(wsUri, cancellationToken);
 
+                // Ensure model is set to default if not provided
+                if (string.IsNullOrEmpty(config.Model))
+                {
+                    config.Model = GetDefaultRealtimeModel();
+                }
+
                 var session = new ElevenLabsRealtimeSession(
                     clientWebSocket,
                     _translator,
@@ -506,6 +513,52 @@ private class ElevenLabsVoiceLabels
             public string? Language { get; set; }
             public string? Gender { get; set; }
         }
+
+        #region Configuration Helpers
+
+        /// <summary>
+        /// Gets the default text-to-speech model from configuration or falls back to eleven_monolingual_v1.
+        /// </summary>
+        private string GetDefaultTextToSpeechModel()
+        {
+            // Check provider-specific override first
+            var providerOverride = DefaultModels?.Audio?.ProviderOverrides
+                ?.GetValueOrDefault(ProviderName.ToLowerInvariant())?.TextToSpeechModel;
+            
+            if (!string.IsNullOrWhiteSpace(providerOverride))
+                return providerOverride;
+            
+            // Check global default
+            var globalDefault = DefaultModels?.Audio?.DefaultTextToSpeechModel;
+            if (!string.IsNullOrWhiteSpace(globalDefault))
+                return globalDefault;
+            
+            // Fallback to hardcoded default for backward compatibility
+            return "eleven_monolingual_v1";
+        }
+
+        /// <summary>
+        /// Gets the default realtime model from configuration or falls back to eleven_conversational_v1.
+        /// </summary>
+        private string GetDefaultRealtimeModel()
+        {
+            // Check provider-specific override first
+            var providerOverride = DefaultModels?.Realtime?.ProviderOverrides
+                ?.GetValueOrDefault(ProviderName.ToLowerInvariant());
+            
+            if (!string.IsNullOrWhiteSpace(providerOverride))
+                return providerOverride;
+            
+            // Check global default
+            var globalDefault = DefaultModels?.Realtime?.DefaultRealtimeModel;
+            if (!string.IsNullOrWhiteSpace(globalDefault))
+                return globalDefault;
+            
+            // Fallback to hardcoded default for backward compatibility
+            return "eleven_conversational_v1";
+        }
+
+        #endregion
     }
 
     /// <summary>
@@ -545,7 +598,7 @@ public async Task ConfigureAsync(RealtimeSessionConfig config, CancellationToken
                 {
                     ["voice_id"] = config.Voice ?? "21m00Tcm4TlvDq8ikWAM",
                     ["language"] = config.Language ?? "en",
-                    ["model_id"] = config.Model ?? "eleven_conversational_v1",
+                    ["model_id"] = config.Model ?? "eleven_conversational_v1", // Model should be set in CreateSessionAsync
                     ["voice_settings"] = new Dictionary<string, object>
                     {
                         ["stability"] = 0.5,
diff --git a/ConduitLLM.Providers/LLMClientFactory.cs b/ConduitLLM.Providers/LLMClientFactory.cs
@@ -177,7 +177,7 @@ private ILLMClient CreateClientForProvider(string providerName, ProviderCredenti
             case "elevenlabs":
             case "eleven-labs":
                 var elevenLabsLogger = _loggerFactory.CreateLogger<ElevenLabsClient>();
-                return new ElevenLabsClient(credentials, modelId, elevenLabsLogger, _httpClientFactory);
+                return new ElevenLabsClient(credentials, modelId, elevenLabsLogger, _httpClientFactory, defaultModels);
             
             default:
                 throw new UnsupportedProviderException($"Provider '{normalizedProviderName}' is not currently supported by ConduitLLM.");
diff --git a/docs/HARDCODED-MODELS-PROGRESS.md b/docs/HARDCODED-MODELS-PROGRESS.md
@@ -28,19 +28,21 @@
    - Replaced `"gpt-4o-realtime-preview"` → `GetDefaultRealtimeModel()`
    - Added configuration helper methods with fallbacks
 
+2. **ElevenLabsClient** ✅ COMPLETE
+   - Updated constructor to accept ProviderDefaultModels
+   - Replaced `"eleven_monolingual_v1"` → `GetDefaultTextToSpeechModel()`
+   - Replaced `"eleven_conversational_v1"` → `GetDefaultRealtimeModel()`
+   - Added configuration helper methods with fallbacks
+   - Updated LLMClientFactory to pass configuration
+
 ## Remaining Work
 
 ### Phase 2: Provider Updates (Continued)
 
-1. **Update all provider constructors** (17 providers)
+1. **Update remaining provider constructors** (15 providers remaining)
    - Each needs to accept ProviderDefaultModels parameter
    - Pass it to base class constructor
-   - Currently only OpenAIClient is updated
-
-2. **ElevenLabsClient** 
-   - Replace `"eleven_monolingual_v1"` defaults
-   - Replace `"eleven_conversational_v1"` defaults
-   - Update constructor
+   - OpenAIClient and ElevenLabsClient are complete
 
 3. **VertexAIClient**
    - Move hardcoded model aliasing to configuration