Spaces:

pollen-robotics
/

reachy_mini_conversation_app

Running

App Files Files Community

Alina Lozovskaya commited on Oct 8

Commit

e660849

1 Parent(s): 4067dbe

Separate headless and gradio [wip]

Browse files

Files changed (3) hide show

src/reachy_mini_conversation_demo/audio/gstreamer.py +1 -2
src/reachy_mini_conversation_demo/console.py +101 -0
src/reachy_mini_conversation_demo/main.py +11 -7

src/reachy_mini_conversation_demo/audio/gstreamer.py CHANGED Viewed

@@ -7,7 +7,7 @@ import gi
 gi.require_version("Gst", "1.0")
 gi.require_version("GstApp", "1.0")
-from gi.repository import Gst, GLib  # noqa: E402
 class GstPlayer:
@@ -159,7 +159,6 @@ class GstRecorder:
         self._thread_bus_calls.start()
     def get_sample(self):
-        """Return next audio sample as bytes, or None if no sample available."""
         sample = self.appsink.pull_sample()
         data = None
         if isinstance(sample, Gst.Sample):

 gi.require_version("Gst", "1.0")
 gi.require_version("GstApp", "1.0")
+from gi.repository import Gst, GLib, GstApp  # noqa: E402
 class GstPlayer:
         self._thread_bus_calls.start()
     def get_sample(self):
         sample = self.appsink.pull_sample()
         data = None
         if isinstance(sample, Gst.Sample):

src/reachy_mini_conversation_demo/console.py ADDED Viewed

	@@ -0,0 +1,101 @@

+import asyncio
+import base64
+import logging
+import numpy as np
+from fastrtc import AdditionalOutputs
+from gi.repository import Gst
+from reachy_mini_conversation_demo.audio.head_wobbler import SAMPLE_RATE
+from reachy_mini_conversation_demo.openai_realtime import OpenaiRealtimeHandler
+from reachy_mini_conversation_demo.audio.gstreamer import GstPlayer, GstRecorder
+logger = logging.getLogger(__name__)
+class LocalStream:
+    def __init__(self, handler: OpenaiRealtimeHandler):
+        self.handler = handler
+        self._stop_event = asyncio.Event()
+        self.recorder = GstRecorder(sample_rate=SAMPLE_RATE)
+        self.player = GstPlayer(sample_rate=SAMPLE_RATE)
+        self.handler._clear_queue = self.clear_queue  # type: ignore[assignment]
+    #     player_bus = self.player.pipeline.get_bus()
+    #     player_bus.add_signal_watch()
+    #     player_bus.connect("message", self.on_player_message)
+    # def on_player_message(self, bus, message):
+    #     # logger.info(f"Player message: {message.type}")
+    #     if message.type == Gst.MessageType.STATE_CHANGED:
+    #         old_state, new_state, pending_state = message.parse_state_changed()
+    #         if new_state != old_state and new_state == Gst.State.PLAYING:
+    #             print("Player is now playing")
+    #             self.recorder.pipeline.set_state(Gst.State.PAUSED)
+    #         if new_state != old_state and new_state == Gst.State.PAUSED:
+    #             print("Player is now paused")
+    #             self.recorder.pipeline.set_state(Gst.State.PLAYING)
+    #     if message.type == Gst.MessageType.EOS:
+    #         self.recorder.pipeline.set_state(Gst.State.PLAYING)
+    #         print("Player reached end of stream, restarting recorder")
+    def clear_queue(self):
+        self.player.pipeline.set_state(Gst.State.PAUSED)
+        self.player.appsrc.send_event(Gst.Event.new_flush_start())
+        self.player.appsrc.send_event(Gst.Event.new_flush_stop(reset_time=True))
+        self.player.pipeline.set_state(Gst.State.PLAYING)
+        logger.info("Cleared player queue")
+    def start(self):
+        self._stop_event.clear()
+        self.recorder.record()
+        self.player.play()
+        async def runner():
+            tasks = [
+                asyncio.create_task(self.handler.start_up(), name="openai-handler"),
+                asyncio.create_task(self.record_loop(), name="stream-record-loop"),
+                asyncio.create_task(self.play_loop(), name="stream-play-loop"),
+            ]
+            await asyncio.gather(*tasks)
+        asyncio.run(runner())
+    def stop(self):
+        self._stop_event.set()
+        self.recorder.stop()
+        self.player.stop()
+    async def record_loop(self) -> None:
+        logger.info("Starting receive loop")
+        while not self._stop_event.is_set():
+            data = self.recorder.get_sample()
+            if data is not None:
+                frame = np.frombuffer(data, dtype=np.int16).squeeze()
+                await self.handler.receive((0, frame))
+            await asyncio.sleep(0)  # Prevent busy waiting
+    async def play_loop(self) -> None:
+        while not self._stop_event.is_set():
+            data = await self.handler.emit()
+            if isinstance(data, AdditionalOutputs):
+                for msg in data.args:
+                    content = msg.get("content", "")
+                    logger.info(
+                        "role=%s content=%s",
+                        msg.get("role"),
+                        content if len(content) < 500 else content[:500] + "…",
+                    )
+            elif isinstance(data, tuple):
+                _, frame = data
+                self.player.push_sample(frame.tobytes())
+            else:
+                pass
+            await asyncio.sleep(0)  # Prevent busy waiting

src/reachy_mini_conversation_demo/main.py CHANGED Viewed

@@ -3,8 +3,8 @@
 import os
 import gradio as gr
-from fastapi import FastAPI
-from fastrtc import Stream
 from reachy_mini import ReachyMini
 from reachy_mini_conversation_demo.moves import MovementManager
@@ -14,6 +14,7 @@ from reachy_mini_conversation_demo.utils import (
     setup_logger,
     handle_vision_stuff,
 )
 from reachy_mini_conversation_demo.openai_realtime import OpenaiRealtimeHandler
 from reachy_mini_conversation_demo.audio.head_wobbler import HeadWobbler
@@ -66,7 +67,9 @@ def main():
     logger.debug(f"Chatbot avatar images: {chatbot.avatar_images}")
     handler = OpenaiRealtimeHandler(deps)
-    stream = Stream(
         handler=handler,
         mode="send-receive",
         modality="audio",
@@ -76,8 +79,8 @@ def main():
         ui_args={"title": "Talk with Reachy Mini"},
     )
-    app = FastAPI()
-    app = gr.mount_gradio_app(app, stream.ui, path="/")
     # Each async service → its own thread/loop
     movement_manager.start()
@@ -86,10 +89,11 @@ def main():
         camera_worker.start()
     try:
-        stream.ui.launch()
     except KeyboardInterrupt:
         logger.info("Exiting...")
     finally:
         movement_manager.stop()
         head_wobbler.stop()

 import os
 import gradio as gr
+import fastrtc
 from reachy_mini import ReachyMini
 from reachy_mini_conversation_demo.moves import MovementManager
     setup_logger,
     handle_vision_stuff,
 )
+from reachy_mini_conversation_demo.console import LocalStream
 from reachy_mini_conversation_demo.openai_realtime import OpenaiRealtimeHandler
 from reachy_mini_conversation_demo.audio.head_wobbler import HeadWobbler
     logger.debug(f"Chatbot avatar images: {chatbot.avatar_images}")
     handler = OpenaiRealtimeHandler(deps)
+    local_stream = LocalStream(handler)
+    stream = fastrtc.Stream(
         handler=handler,
         mode="send-receive",
         modality="audio",
         ui_args={"title": "Talk with Reachy Mini"},
     )
+    # app = fastrtc.FastAPI()
+    # app = gr.mount_gradio_app(app, stream.ui, path="/")
     # Each async service → its own thread/loop
     movement_manager.start()
         camera_worker.start()
     try:
+        local_stream.start()
+        # stream.ui.launch()
     except KeyboardInterrupt:
         logger.info("Exiting...")
+        local_stream.stop()
     finally:
         movement_manager.stop()
         head_wobbler.stop()