kagenti · pdettori · Feb 12, 2026 · Jan 30, 2026 · Jan 31, 2026 · Feb 3, 2026
diff --git a/a2a/weather_service/Dockerfile b/a2a/weather_service/Dockerfile
@@ -1,6 +1,9 @@
-FROM ghcr.io/astral-sh/uv:python3.12-bookworm-slim
+FROM python:3.12-slim-bookworm
 ARG RELEASE_VERSION="main"
 
+# Install uv
+RUN pip install --no-cache-dir uv
+
 WORKDIR /app
 COPY . .
 RUN uv sync --no-cache --locked --link-mode copy

diff --git a/a2a/weather_service/pyproject.toml b/a2a/weather_service/pyproject.toml
@@ -14,11 +14,16 @@ dependencies = [
     "langchain-community>=0.3.9",
     "langchain-ollama>=0.2.1",
     "langchain-openai>=0.3.7",
-    "openinference-instrumentation-langchain>=0.1.36",
     "pydantic-settings>=2.8.1",
     "langchain-mcp-adapters>=0.1.0",
     "python-keycloak>=5.5.1",
     "opentelemetry-exporter-otlp",
+    # OpenTelemetry GenAI semantic convention instrumentation
+    # Emits spans with gen_ai.* attributes for MLflow compatibility
+    "opentelemetry-instrumentation-openai>=0.34b0",
+    # OpenInference for LangChain instrumentation and AGENT span semantics
+    "openinference-semantic-conventions>=0.1.12",
+    "openinference-instrumentation-langchain>=0.1.27",
 ]
 
 [project.scripts]

diff --git a/a2a/weather_service/src/weather_service/__init__.py b/a2a/weather_service/src/weather_service/__init__.py
@@ -1,16 +1,6 @@
-from opentelemetry.sdk.resources import Resource
-from opentelemetry import trace
-from opentelemetry.sdk.trace import TracerProvider
-from opentelemetry.sdk.trace.export import BatchSpanProcessor
-from opentelemetry.exporter.otlp.proto.http.trace_exporter import OTLPSpanExporter
+"""Weather Service - OpenTelemetry Observability Setup"""
 
-def setup_tracer():
-    resource = Resource.create(attributes={
-        "service.name": "a2a-server",
-    })
-    provider = TracerProvider(resource=resource)
-    processor = BatchSpanProcessor(OTLPSpanExporter())
-    provider.add_span_processor(processor)
-    trace.set_tracer_provider(provider)
+from weather_service.observability import setup_observability
 
-setup_tracer()
+# Initialize observability before importing agent
+setup_observability()
diff --git a/a2a/weather_service/src/weather_service/agent.py b/a2a/weather_service/src/weather_service/agent.py
@@ -11,16 +11,16 @@
 from a2a.server.tasks import InMemoryTaskStore, TaskUpdater
 from a2a.types import AgentCapabilities, AgentCard, AgentSkill, TaskState, TextPart
 from a2a.utils import new_agent_text_message, new_task
-from openinference.instrumentation.langchain import LangChainInstrumentor
 from langchain_core.messages import HumanMessage
 
+from starlette.middleware.base import BaseHTTPMiddleware
+
 from weather_service.graph import get_graph, get_mcpclient
+from weather_service.observability import create_tracing_middleware, set_span_output, get_root_span
 
 logging.basicConfig(level=logging.DEBUG)
 logger = logging.getLogger(__name__)
 
-LangChainInstrumentor().instrument()
-
 
 def get_agent_card(host: str, port: int):
     """Returns the Agent Card for the AG2 Agent."""
@@ -104,46 +104,55 @@ async def execute(self, context: RequestContext, event_queue: EventQueue):
         task_updater = TaskUpdater(event_queue, task.id, task.context_id)
         event_emitter = A2AEvent(task_updater)
 
+        # Get user input for the agent
+        user_input = context.get_user_input()
+
         # Parse Messages
-        messages = [HumanMessage(content=context.get_user_input())]
+        messages = [HumanMessage(content=user_input)]
         input = {"messages": messages}
         logger.info(f'Processing messages: {input}')
 
-        task_updater = TaskUpdater(event_queue, task.id, task.context_id)
+        # Note: Root span with MLflow attributes is created by tracing middleware
+        # Here we just run the agent logic - spans from LangChain are auto-captured
+        output = None
+
+        # Test MCP connection first
+        logger.info(f'Attempting to connect to MCP server at: {os.getenv("MCP_URL", "http://localhost:8000/sse")}')
+
+        mcpclient = get_mcpclient()
 
+        # Try to get tools to verify connection
         try:
-            output = None
-            # Test MCP connection first
-            logger.info(f'Attempting to connect to MCP server at: {os.getenv("MCP_URL", "http://localhost:8000/sse")}')
-
-            mcpclient = get_mcpclient()
-
-            # Try to get tools to verify connection
-            try:
-                tools = await mcpclient.get_tools()
-                logger.info(f'Successfully connected to MCP server. Available tools: {[tool.name for tool in tools]}')
-            except Exception as tool_error:
-                logger.error(f'Failed to connect to MCP server: {tool_error}')
-                await event_emitter.emit_event(f"Error: Cannot connect to MCP weather service at {os.getenv('MCP_URL', 'http://localhost:8000/sse')}. Please ensure the weather MCP server is running. Error: {tool_error}", failed=True)
-                return
-
-            graph = await get_graph(mcpclient)
-            async for event in graph.astream(input, stream_mode="updates"):
-                await event_emitter.emit_event(
-                    "\n".join(
-                        f"🚶‍♂️{key}: {str(value)[:256] + '...' if len(str(value)) > 256 else str(value)}"
-                        for key, value in event.items()
-                    )
-                    + "\n"
+            tools = await mcpclient.get_tools()
+            logger.info(f'Successfully connected to MCP server. Available tools: {[tool.name for tool in tools]}')
+        except Exception as tool_error:
+            logger.error(f'Failed to connect to MCP server: {tool_error}')
+            await event_emitter.emit_event(f"Error: Cannot connect to MCP weather service at {os.getenv('MCP_URL', 'http://localhost:8000/sse')}. Please ensure the weather MCP server is running. Error: {tool_error}", failed=True)
+            return
+
+        graph = await get_graph(mcpclient)
+        async for event in graph.astream(input, stream_mode="updates"):
+            await event_emitter.emit_event(
+                "\n".join(
+                    f"🚶‍♂️{key}: {str(value)[:256] + '...' if len(str(value)) > 256 else str(value)}"
+                    for key, value in event.items()
                 )
-                output = event
-                logger.info(f'event: {event}')
-            output =  output.get("assistant", {}).get("final_answer")
-            await event_emitter.emit_event(str(output), final=True)
-        except Exception as e:
-            logger.error(f'Graph execution error: {e}')
-            await event_emitter.emit_event(f"Error: Failed to process weather request. {str(e)}", failed=True)
-            raise Exception(str(e))
+                + "\n"
+            )
+            output = event
+            logger.info(f'event: {event}')
+        output = output.get("assistant", {}).get("final_answer")
+
+        # Set span output BEFORE emitting final event (for streaming response capture)
+        # This populates mlflow.spanOutputs, output.value, gen_ai.completion
+        # Use get_root_span() to get the middleware-created root span, not the
+        # current A2A span (trace.get_current_span() would return wrong span)
+        if output:
+            root_span = get_root_span()
+            if root_span and root_span.is_recording():
+                set_span_output(root_span, str(output))
+
+        await event_emitter.emit_event(str(output), final=True)
 
     async def cancel(self, context: RequestContext, event_queue: EventQueue) -> None:
         """
@@ -166,7 +175,7 @@ def run():
         agent_card=agent_card,
         http_handler=request_handler,
     )
-    
+
     # Build the Starlette app
     app = server.build()
 
@@ -178,8 +187,10 @@ def run():
         name='agent_card_new',
     ))
 
-    # Add middleware to log all incoming requests with headers
-
+    # Add tracing middleware - creates root span with MLflow/GenAI attributes
+    app.add_middleware(BaseHTTPMiddleware, dispatch=create_tracing_middleware())
+
+    # Add logging middleware
     @app.middleware("http")
     async def log_authorization_header(request, call_next):
         auth_header = request.headers.get("authorization", "No Authorization header")