Merge pull request #3 from run-llama/clelia/add-observability

AstraBert · web-flow · commit 3d54bb422a03 · 2025-06-29T12:11:29.000+02:00
Adding observability dashboard
diff --git a/.env.example b/.env.example
@@ -1,3 +1,6 @@
 OPENAI_API_KEY="sk-***"
 LLAMACLOUD_API_KEY="llx-***"
 ELEVENLABS_API_KEY="sk_***"
+pgql_db="postgres"
+pgql_user="localhost"
+pgql_psw="admin"
diff --git a/.github/workflows/release.yaml b/.github/workflows/release.yaml
@@ -0,0 +1,21 @@
+name: GitHub Release
+
+on:
+  push:
+    tags:
+      - "v[0-9].[0-9]+.[0-9]+*"
+
+jobs:
+  release:
+    runs-on: ubuntu-latest
+    permissions:
+      contents: write
+
+    steps:
+      - name: Checkout
+        uses: actions/checkout@v4
+
+      - name: Create GitHub Release
+        uses: ncipollo/release-action@v1
+        with:
+          generateReleaseNotes: true
diff --git a/README.md b/README.md
@@ -40,6 +40,12 @@ uv run tools/create_llama_cloud_index.py
 
 And you're ready to set up the app!
 
+Launch Postgres and Jaeger:
+
+```bash
+docker compose up -d
+```
+
 Run the **MCP** server:
 
 ```bash
diff --git a/compose.yaml b/compose.yaml
@@ -0,0 +1,31 @@
+name: instrumentation
+
+services:
+  jaeger:
+    image: jaegertracing/all-in-one:latest
+    ports:
+      - 16686:16686
+      - 4317:4317
+      - 4318:4318
+      - 9411:9411
+    environment:
+      - COLLECTOR_ZIPKIN_HOST_PORT=:9411
+
+  postgres:
+    image: postgres
+    ports:
+      - 5432:5432
+    environment:
+      POSTGRES_DB: $pgql_db
+      POSTGRES_USER: $pgql_user
+      POSTGRES_PASSWORD: $pgql_psw
+    volumes:
+      - pgdata:/var/lib/postgresql/data
+
+  adminer:
+    image: adminer
+    ports:
+      - "8080:8080"
+
+volumes:
+  pgdata:
diff --git a/pyproject.toml b/pyproject.toml
@@ -1,7 +1,7 @@
 [project]
 name = "notebooklm-clone"
-version = "0.1.0"
-description = "Add your description here"
+version = "0.2.0"
+description = "An OSS and LlamaCloud-backed alternative to NotebookLM"
 readme = "README.md"
 requires-python = ">=3.13"
 dependencies = [
@@ -15,10 +15,14 @@ dependencies = [
   "llama-index-embeddings-openai>=0.3.1",
   "llama-index-indices-managed-llama-cloud>=0.6.11",
   "llama-index-llms-openai>=0.4.7",
+  "llama-index-observability-otel>=0.1.1",
   "llama-index-tools-mcp>=0.2.5",
   "llama-index-workflows>=1.0.1",
   "mypy>=1.16.1",
+  "opentelemetry-exporter-otlp-proto-http>=1.34.1",
+  "plotly>=6.2.0",
   "pre-commit>=4.2.0",
+  "psycopg2-binary>=2.9.10",
   "pydub>=0.25.1",
   "pytest>=8.4.1",
   "pytest-asyncio>=1.0.0",
diff --git a/src/notebooklm_clone/Home.py b/src/notebooklm_clone/Home.py
@@ -3,12 +3,36 @@
 import os
 import asyncio
 import tempfile as temp
+from dotenv import load_dotenv
+import time
 import streamlit.components.v1 as components
 
 from pathlib import Path
 from audio import PODCAST_GEN
 from typing import Tuple
 from workflow import NotebookLMWorkflow, FileInputEvent, NotebookOutputEvent
+from instrumentation import OtelTracesSqlEngine
+from llama_index.observability.otel import LlamaIndexOpenTelemetry
+from opentelemetry.exporter.otlp.proto.http.trace_exporter import (
+    OTLPSpanExporter,
+)
+
+load_dotenv()
+
+# define a custom span exporter
+span_exporter = OTLPSpanExporter("http://0.0.0.0:4318/v1/traces")
+
+# initialize the instrumentation object
+instrumentor = LlamaIndexOpenTelemetry(
+    service_name_or_resource="agent.traces",
+    span_exporter=span_exporter,
+    debug=True,
+)
+sql_engine = OtelTracesSqlEngine(
+    engine_url=f"postgresql+psycopg2://{os.getenv('pgql_user')}:{os.getenv('pgql_psw')}@localhost:5432/{os.getenv('pgql_db')}",
+    table_name="agent_traces",
+    service_name="agent.traces",
+)
 
 WF = NotebookLMWorkflow(timeout=600)
 
@@ -24,6 +48,7 @@ async def run_workflow(file: io.BytesIO) -> Tuple[str, str, str, str, str]:
     content = file.getvalue()
     with open(fl.name, "wb") as f:
         f.write(content)
+    st_time = int(time.time() * 1000000)
     ev = FileInputEvent(file=fl.name)
     result: NotebookOutputEvent = await WF.run(start_event=ev)
     q_and_a = ""
@@ -34,7 +59,9 @@ async def run_workflow(file: io.BytesIO) -> Tuple[str, str, str, str, str]:
     mind_map = result.mind_map
     if Path(mind_map).is_file():
         mind_map = read_html_file(mind_map)
-        os.remove(mind_map)
+        os.remove(result.mind_map)
+    end_time = int(time.time() * 1000000)
+    sql_engine.to_sql_database(start_time=st_time, end_time=end_time)
     return result.md_content, result.summary, q_and_a, bullet_points, mind_map
 
 
@@ -138,3 +165,6 @@ def sync_create_podcast(file_content: str):
 
 else:
     st.info("Please upload a PDF file to get started.")
+
+if __name__ == "__main__":
+    instrumentor.start_registering()
diff --git a/src/notebooklm_clone/instrumentation.py b/src/notebooklm_clone/instrumentation.py
@@ -0,0 +1,168 @@
+import requests
+import time
+import csv
+import pandas as pd
+import tempfile as temp
+import os
+
+from sqlalchemy import Engine, create_engine, Connection, Result
+from typing import Optional, Dict, Any, List, Literal, Union, cast
+
+
+class OtelTracesSqlEngine:
+    def __init__(
+        self,
+        engine: Optional[Engine] = None,
+        engine_url: Optional[str] = None,
+        table_name: Optional[str] = None,
+        service_name: Optional[str] = None,
+    ):
+        self.service_name: str = service_name or "service"
+        self.table_name: str = table_name or "otel_traces"
+        self._connection: Optional[Connection] = None
+        if engine:
+            self._engine: Engine = engine
+        elif engine_url:
+            self._engine = create_engine(url=engine_url)
+        else:
+            raise ValueError("One of engine or engine_setup_kwargs must be set")
+
+    def _connect(self) -> None:
+        self._connection = self._engine.connect()
+
+    def _export(
+        self,
+        start_time: Optional[int] = None,
+        end_time: Optional[int] = None,
+        limit: Optional[int] = None,
+    ) -> Dict[str, Any]:
+        url = "http://localhost:16686/api/traces"
+        params = {
+            "service": self.service_name,
+            "start": start_time
+            or int(time.time() * 1000000) - (24 * 60 * 60 * 1000000),
+            "end": end_time or int(time.time() * 1000000),
+            "limit": limit or 1000,
+        }
+        response = requests.get(url, params=params)
+        print(response.json())
+        return response.json()
+
+    def _to_pandas(self, data: Dict[str, Any]) -> pd.DataFrame:
+        rows: List[Dict[str, Any]] = []
+        # Loop over each trace
+        for trace in data.get("data", []):
+            trace_id = trace.get("traceID")
+            service_map = {
+                pid: proc.get("serviceName")
+                for pid, proc in trace.get("processes", {}).items()
+            }
+
+            for span in trace.get("spans", []):
+                span_id = span.get("spanID")
+                operation = span.get("operationName")
+                start = span.get("startTime")
+                duration = span.get("duration")
+                process_id = span.get("processID")
+                service = service_map.get(process_id, "")
+                status = next(
+                    (
+                        tag.get("value")
+                        for tag in span.get("tags", [])
+                        if tag.get("key") == "otel.status_code"
+                    ),
+                    "",
+                )
+                parent_span_id = None
+                if span.get("references"):
+                    parent_span_id = span["references"][0].get("spanID")
+
+                rows.append(
+                    {
+                        "trace_id": trace_id,
+                        "span_id": span_id,
+                        "parent_span_id": parent_span_id,
+                        "operation_name": operation,
+                        "start_time": start,
+                        "duration": duration,
+                        "status_code": status,
+                        "service_name": service,
+                    }
+                )
+
+        # Define the CSV header
+        fieldnames = [
+            "trace_id",
+            "span_id",
+            "parent_span_id",
+            "operation_name",
+            "start_time",
+            "duration",
+            "status_code",
+            "service_name",
+        ]
+
+        fl = temp.NamedTemporaryFile(suffix=".csv", delete=False, delete_on_close=False)
+        # Write to CSV
+        with open(fl.name, "w", newline="") as csvfile:
+            writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
+            writer.writeheader()
+            writer.writerows(rows)
+
+        df = pd.read_csv(fl)
+        os.remove(fl.name)
+        return df
+
+    def _to_sql(
+        self,
+        dataframe: pd.DataFrame,
+        if_exists_policy: Optional[Literal["fail", "replace", "append"]] = None,
+    ) -> None:
+        if not self._connection:
+            self._connect()
+        dataframe.to_sql(
+            name=self.table_name,
+            con=self._connection,
+            if_exists=if_exists_policy or "append",
+        )
+
+    def to_sql_database(
+        self,
+        start_time: Optional[int] = None,
+        end_time: Optional[int] = None,
+        limit: Optional[int] = None,
+        if_exists_policy: Optional[Literal["fail", "replace", "append"]] = None,
+    ) -> None:
+        data = self._export(start_time=start_time, end_time=end_time, limit=limit)
+        df = self._to_pandas(data=data)
+        self._to_sql(dataframe=df, if_exists_policy=if_exists_policy)
+
+    def execute(
+        self,
+        statement: Any,
+        parameters: Optional[Any] = None,
+        execution_options: Optional[Any] = None,
+        return_pandas: bool = False,
+    ) -> Union[Result, pd.DataFrame]:
+        if not self._connection:
+            self._connect()
+        if not return_pandas:
+            self._connection = cast(Connection, self._connection)
+            return self._connection.execute(
+                statement=statement,
+                parameters=parameters,
+                execution_options=execution_options,
+            )
+        return pd.read_sql(sql=statement, con=self._connection)
+
+    def to_pandas(
+        self,
+    ) -> pd.DataFrame:
+        if not self._connection:
+            self._connect()
+        return pd.read_sql_table(table_name=self.table_name, con=self._connection)
+
+    def disconnect(self) -> None:
+        if not self._connection:
+            raise ValueError("Engine was never connected!")
+        self._engine.dispose(close=True)
diff --git a/src/notebooklm_clone/pages/2_Observability_Dashboard.py b/src/notebooklm_clone/pages/2_Observability_Dashboard.py
diff --git a/tests/test_sql_engine.py b/tests/test_sql_engine.py
diff --git a/uv.lock b/uv.lock