Spaces:

angelsg213
/

TESTING22

Sleeping

App Files Files Community

angelsg213 commited on 8 days ago

Commit

8c68c9b

verified ·

1 Parent(s): 0974561

Update app.py

Browse files

Files changed (1) hide show

app.py +45 -26

app.py CHANGED Viewed

@@ -32,9 +32,9 @@ def extraer_texto_pdf(pdf_file):
 # ============= GENERAR AUDIO CON EMOCIÓN MEJORADO =============
 # ============= GENERAR AUDIO CON EMOCIÓN Y ANÁLISIS DE SENTIMIENTO =============
 def generar_audio_respuesta(texto, client):
-    """Convierte la respuesta de texto a audio usando TTS con análisis emocional"""
-    # Limitar y optimizar texto para TTS
     texto_limpio = texto.replace("*", "").replace("#", "").replace("`", "").replace("€", " euros").strip()
     oraciones = re.split(r'[.!?]+', texto_limpio)
     oraciones = [o.strip() for o in oraciones if o.strip() and len(o.strip()) > 10]
@@ -42,60 +42,79 @@ def generar_audio_respuesta(texto, client):
     if len(texto_audio) > 400:
         texto_audio = texto_audio[:397] + "..."
-    print(f"🎤 Generando audio emocional para: '{texto_audio[:80]}...'")
-    # PASO 1: Analizar emoción del texto (modelo para español)
     try:
-        print("🧠 Analizando emoción del texto...")
         emotion_response = client.text_classification(
             text=texto_audio,
-            model="dariolopez/roberta-base-bne-finetuned-EmotionAnalysisSpanish"  # Mejor para español
         )
-        emocion_detectada = emotion_response[0]['label'] if emotion_response else "neutral"
-        confianza = emotion_response[0]['score'] if emotion_response else 0.5
-        print(f"😊 Emoción detectada: {emocion_detectada} (confianza: {confianza:.2%})")
     except Exception as e:
-        print(f"⚠️ Error en análisis emocional: {str(e)[:100]}")
         emocion_detectada = "neutral"
         confianza = 0.5
-    # PASO 2: Modelos TTS optimizados para español
     modelos_tts = [
-        "facebook/mms-tts-spa",  # Español específico
-        "suno/bark",             # Versión completa, soporta multi-idioma
-        "facebook/mms-tts-por"   # Portugués como fallback (cercano al español)
     ]
     for modelo in modelos_tts:
         try:
-            print(f"🔊 Probando TTS: {modelo}")
             audio_data = client.text_to_speech(
                 text=texto_audio,
                 model=modelo
             )
-            # Guardar archivo con mejor manejo
             timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
             audio_path = f"audio_emocional_{emocion_detectada}_{timestamp}.wav"
             with open(audio_path, "wb") as f:
                 if isinstance(audio_data, bytes):
                     f.write(audio_data)
                 else:
-                    f.write(audio_data.read() if hasattr(audio_data, 'read') else audio_data.content)
-            size = os.path.getsize(audio_path)
-            if size > 1000:
-                print(f"✅ Audio generado: {audio_path} ({size} bytes)")
-                return audio_path, emocion_detectada, confianza
-            else:
-                os.remove(audio_path)
-                print(f"⚠️ Archivo vacío, probando siguiente modelo...")
         except Exception as e:
-            print(f"❌ Error con {modelo}: {str(e)[:100]}")
             continue
-    print("⚠️ Fallo en todos los modelos. Verifica token, conexión o prueba con texto más corto.")
     return None, emocion_detectada, confianza
 # ============= ASISTENTE IA CONVERSACIONAL =============

 # ============= GENERAR AUDIO CON EMOCIÓN MEJORADO =============
 # ============= GENERAR AUDIO CON EMOCIÓN Y ANÁLISIS DE SENTIMIENTO =============
 def generar_audio_respuesta(texto, client):
+    """TTS emocional FUNCIONAL para español - Actualizado diciembre 2025"""
+    # Limpiar y preparar texto (mismo que antes)
     texto_limpio = texto.replace("*", "").replace("#", "").replace("`", "").replace("€", " euros").strip()
     oraciones = re.split(r'[.!?]+', texto_limpio)
     oraciones = [o.strip() for o in oraciones if o.strip() and len(o.strip()) > 10]
     if len(texto_audio) > 400:
         texto_audio = texto_audio[:397] + "..."
+    print(f"🎤 Generando audio para: '{texto_audio[:80]}...'")
+    # PASO 1: Análisis emocional (modelo español que SÍ funciona)
     try:
+        print("🧠 Analizando emoción...")
         emotion_response = client.text_classification(
             text=texto_audio,
+            model="dariolopez/roberta-base-bne-finetuned-EmotionAnalysisSpanish"  # Español nativo
         )
+        if emotion_response and len(emotion_response) > 0:
+            emocion_detectada = emotion_response[0]['label']
+            confianza = emotion_response[0]['score']
+            print(f"😊 Emoción: {emocion_detectada} (confianza: {confianza:.2%})")
+        else:
+            emocion_detectada = "neutral"
+            confianza = 0.5
     except Exception as e:
+        print(f"⚠️ Error emocional: {str(e)[:100]}. Usando neutral.")
         emocion_detectada = "neutral"
         confianza = 0.5
+    # PASO 2: Modelos TTS que SÍ funcionan en 2025 (español prioritario)
     modelos_tts = [
+        "facebook/mms-tts-spa",      # Español oficial de Meta - Siempre funciona
+        "myshell-ai/MeloTTS-Spanish", # Alta calidad, multi-idioma
+        "coqui/XTTS-v2"              # Fallback versátil (soporta español)
     ]
     for modelo in modelos_tts:
         try:
+            print(f"🔊 Probando: {modelo}")
+            # Generar audio
             audio_data = client.text_to_speech(
                 text=texto_audio,
                 model=modelo
             )
+            # Guardar archivo (mejorado para streams/bytes)
             timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
             audio_path = f"audio_emocional_{emocion_detectada}_{timestamp}.wav"
             with open(audio_path, "wb") as f:
                 if isinstance(audio_data, bytes):
                     f.write(audio_data)
+                elif hasattr(audio_data, 'read'):
+                    f.write(audio_data.read())
+                elif hasattr(audio_data, 'content'):
+                    f.write(audio_data.content)
                 else:
+                    # Para iteradores/chunks
+                    for chunk in audio_data:
+                        if chunk:
+                            f.write(chunk if isinstance(chunk, bytes) else bytes(chunk))
+            # Verificar
+            if os.path.exists(audio_path):
+                size = os.path.getsize(audio_path)
+                print(f"📁 Creado: {audio_path} ({size} bytes)")
+                if size > 2000:  # Umbral más bajo para MMS
+                    print(f"✅ ¡AUDIO GENERADO EXITOSAMENTE!")
+                    return audio_path, emocion_detectada, confianza
+                else:
+                    print(f"⚠️ Archivo pequeño ({size} bytes), borrando...")
+                    os.remove(audio_path)
         except Exception as e:
+            error_msg = str(e)
+            print(f"❌ Error con {modelo}: {error_msg[:100]}")
             continue
+    print("⚠️ No se generó audio. Verifica límites de API o conexión.")
     return None, emocion_detectada, confianza
 # ============= ASISTENTE IA CONVERSACIONAL =============