diff --git a/google/cloud/dataproc_spark_connect/proto/__init__.py b/google/cloud/dataproc_spark_connect/proto/__init__.py
new file mode 100644
index 0000000..e69de29
diff --git a/google/cloud/dataproc_spark_connect/proto/sparkmonitor.proto b/google/cloud/dataproc_spark_connect/proto/sparkmonitor.proto
new file mode 100644
index 0000000..8e3d920
--- /dev/null
+++ b/google/cloud/dataproc_spark_connect/proto/sparkmonitor.proto
@@ -0,0 +1,115 @@
+syntax = "proto3";
+
+package spark.connect;
+
+option java_multiple_files = true;
+option java_package = "org.apache.spark.connect.proto";
+
+// SparkMonitor progress data delivered via the upstream extension slot on ExecutePlanResponse
+// (google.protobuf.Any extension = 999).
+// type_url: "type.googleapis.com/spark.connect.SparkMonitorProgress"
+message SparkMonitorProgress {
+  optional ApplicationInfo    application_info = 1;
+  repeated JobEvent           job_events       = 2;
+  repeated DetailedStageEvent stage_events     = 3;
+  repeated TaskEvent          task_events      = 4;
+  repeated ExecutorEvent      executor_events  = 5;
+  optional bool               stream_complete  = 6;
+
+  // Application lifecycle info (start_time present = start event, end_time present = end event)
+  message ApplicationInfo {
+    optional int64 start_time = 1;
+    optional int64 end_time = 2;
+    optional string app_id = 3;
+    optional string app_attempt_id = 4;
+    optional string app_name = 5;
+    optional string spark_user = 6;
+  }
+
+  // Job events (JOB_START=0, JOB_END=1)
+  message JobEvent {
+    enum JobEventType {
+      JOB_START = 0;
+      JOB_END = 1;
+    }
+    JobEventType event_type = 1;
+    int64 job_id = 2;
+    string status = 3;
+    optional int64 submission_time = 4;
+    optional int64 completion_time = 5;
+    optional string job_group = 6;
+    optional string name = 7;
+    repeated int32 stage_ids = 8;
+    map<string, JobStageInfo> stage_infos = 9;
+    optional int32 num_tasks = 10;
+    optional int32 total_cores = 11;
+    optional string app_id = 12;
+    optional int32 num_executors = 13;
+  }
+
+  message JobStageInfo {
+    int32 attempt_id = 1;
+    string name = 2;
+    int32 num_tasks = 3;
+    int64 completion_time = 4;
+    int64 submission_time = 5;
+  }
+
+  // Detailed stage events (STAGE_SUBMITTED=0, STAGE_ACTIVE=1, STAGE_COMPLETED=2)
+  message DetailedStageEvent {
+    enum StageEventType {
+      STAGE_SUBMITTED = 0;
+      STAGE_ACTIVE = 1;
+      STAGE_COMPLETED = 2;
+    }
+    StageEventType event_type = 1;
+    int64 stage_id = 2;
+    int32 stage_attempt_id = 3;
+    string name = 4;
+    int32 num_tasks = 5;
+    repeated int32 parent_ids = 6;
+    optional int64 submission_time = 7;
+    optional int64 completion_time = 8;
+    repeated int64 job_ids = 9;
+    optional int32 num_active_tasks = 10;
+    optional int32 num_failed_tasks = 11;
+    optional int32 num_completed_tasks = 12;
+    optional string status = 13;
+  }
+
+  // Task events (TASK_START=0, TASK_END=1)
+  message TaskEvent {
+    enum TaskEventType {
+      TASK_START = 0;
+      TASK_END = 1;
+    }
+    TaskEventType event_type = 1;
+    int64 task_id = 2;
+    int64 stage_id = 3;
+    int32 stage_attempt_id = 4;
+    int32 index = 5;
+    int32 attempt_number = 6;
+    string executor_id = 7;
+    string host = 8;
+    string status = 9;
+    bool speculative = 10;
+    optional int64 launch_time = 11;
+    optional int64 finish_time = 12;
+    optional string task_type = 13;
+    optional string error_message = 14;
+  }
+
+  // Executor events (EXECUTOR_ADDED=0, EXECUTOR_REMOVED=1)
+  message ExecutorEvent {
+    enum ExecutorEventType {
+      EXECUTOR_ADDED = 0;
+      EXECUTOR_REMOVED = 1;
+    }
+    ExecutorEventType event_type = 1;
+    string executor_id = 2;
+    int64 time = 3;
+    optional string host = 4;
+    optional int32 num_cores = 5;
+    optional int32 total_cores = 6;
+  }
+}
\ No newline at end of file
diff --git a/google/cloud/dataproc_spark_connect/proto/sparkmonitor_pb2.py b/google/cloud/dataproc_spark_connect/proto/sparkmonitor_pb2.py
new file mode 100644
index 0000000..c884088
--- /dev/null
+++ b/google/cloud/dataproc_spark_connect/proto/sparkmonitor_pb2.py
@@ -0,0 +1,64 @@
+# -*- coding: utf-8 -*-
+# Generated by the protocol buffer compiler.  DO NOT EDIT!
+# source: google/cloud/dataproc_spark_connect/proto/sparkmonitor.proto
+"""Generated protocol buffer code."""
+from google.protobuf.internal import builder as _builder
+from google.protobuf import descriptor as _descriptor
+from google.protobuf import descriptor_pool as _descriptor_pool
+from google.protobuf import symbol_database as _symbol_database
+# @@protoc_insertion_point(imports)
+
+_sym_db = _symbol_database.Default()
+
+
+DESCRIPTOR = _descriptor_pool.Default().AddSerializedFile(
+    b'\n<google/cloud/dataproc_spark_connect/proto/sparkmonitor.proto\x12\rspark.connect"\xee\x16\n\x14SparkMonitorProgress\x12R\n\x10\x61pplication_info\x18\x01 \x01(\x0b\x32\x33.spark.connect.SparkMonitorProgress.ApplicationInfoH\x00\x88\x01\x01\x12@\n\njob_events\x18\x02 \x03(\x0b\x32,.spark.connect.SparkMonitorProgress.JobEvent\x12L\n\x0cstage_events\x18\x03 \x03(\x0b\x32\x36.spark.connect.SparkMonitorProgress.DetailedStageEvent\x12\x42\n\x0btask_events\x18\x04 \x03(\x0b\x32-.spark.connect.SparkMonitorProgress.TaskEvent\x12J\n\x0f\x65xecutor_events\x18\x05 \x03(\x0b\x32\x31.spark.connect.SparkMonitorProgress.ExecutorEvent\x12\x1c\n\x0fstream_complete\x18\x06 \x01(\x08H\x01\x88\x01\x01\x1a\xf9\x01\n\x0f\x41pplicationInfo\x12\x17\n\nstart_time\x18\x01 \x01(\x03H\x00\x88\x01\x01\x12\x15\n\x08\x65nd_time\x18\x02 \x01(\x03H\x01\x88\x01\x01\x12\x13\n\x06\x61pp_id\x18\x03 \x01(\tH\x02\x88\x01\x01\x12\x1b\n\x0e\x61pp_attempt_id\x18\x04 \x01(\tH\x03\x88\x01\x01\x12\x15\n\x08\x61pp_name\x18\x05 \x01(\tH\x04\x88\x01\x01\x12\x17\n\nspark_user\x18\x06 \x01(\tH\x05\x88\x01\x01\x42\r\n\x0b_start_timeB\x0b\n\t_end_timeB\t\n\x07_app_idB\x11\n\x0f_app_attempt_idB\x0b\n\t_app_nameB\r\n\x0b_spark_user\x1a\xb4\x05\n\x08JobEvent\x12M\n\nevent_type\x18\x01 \x01(\x0e\x32\x39.spark.connect.SparkMonitorProgress.JobEvent.JobEventType\x12\x0e\n\x06job_id\x18\x02 \x01(\x03\x12\x0e\n\x06status\x18\x03 \x01(\t\x12\x1c\n\x0fsubmission_time\x18\x04 \x01(\x03H\x00\x88\x01\x01\x12\x1c\n\x0f\x63ompletion_time\x18\x05 \x01(\x03H\x01\x88\x01\x01\x12\x16\n\tjob_group\x18\x06 \x01(\tH\x02\x88\x01\x01\x12\x11\n\x04name\x18\x07 \x01(\tH\x03\x88\x01\x01\x12\x11\n\tstage_ids\x18\x08 \x03(\x05\x12Q\n\x0bstage_infos\x18\t \x03(\x0b\x32<.spark.connect.SparkMonitorProgress.JobEvent.StageInfosEntry\x12\x16\n\tnum_tasks\x18\n \x01(\x05H\x04\x88\x01\x01\x12\x18\n\x0btotal_cores\x18\x0b \x01(\x05H\x05\x88\x01\x01\x12\x13\n\x06\x61pp_id\x18\x0c \x01(\tH\x06\x88\x01\x01\x12\x1a\n\rnum_executors\x18\r \x01(\x05H\x07\x88\x01\x01\x1a\x63\n\x0fStageInfosEntry\x12\x0b\n\x03key\x18\x01 \x01(\t\x12?\n\x05value\x18\x02 \x01(\x0b\x32\x30.spark.connect.SparkMonitorProgress.JobStageInfo:\x02\x38\x01"*\n\x0cJobEventType\x12\r\n\tJOB_START\x10\x00\x12\x0b\n\x07JOB_END\x10\x01\x42\x12\n\x10_submission_timeB\x12\n\x10_completion_timeB\x0c\n\n_job_groupB\x07\n\x05_nameB\x0c\n\n_num_tasksB\x0e\n\x0c_total_coresB\t\n\x07_app_idB\x10\n\x0e_num_executors\x1au\n\x0cJobStageInfo\x12\x12\n\nattempt_id\x18\x01 \x01(\x05\x12\x0c\n\x04name\x18\x02 \x01(\t\x12\x11\n\tnum_tasks\x18\x03 \x01(\x05\x12\x17\n\x0f\x63ompletion_time\x18\x04 \x01(\x03\x12\x17\n\x0fsubmission_time\x18\x05 \x01(\x03\x1a\xd5\x04\n\x12\x44\x65tailedStageEvent\x12Y\n\nevent_type\x18\x01 \x01(\x0e\x32\x45.spark.connect.SparkMonitorProgress.DetailedStageEvent.StageEventType\x12\x10\n\x08stage_id\x18\x02 \x01(\x03\x12\x18\n\x10stage_attempt_id\x18\x03 \x01(\x05\x12\x0c\n\x04name\x18\x04 \x01(\t\x12\x11\n\tnum_tasks\x18\x05 \x01(\x05\x12\x12\n\nparent_ids\x18\x06 \x03(\x05\x12\x1c\n\x0fsubmission_time\x18\x07 \x01(\x03H\x00\x88\x01\x01\x12\x1c\n\x0f\x63ompletion_time\x18\x08 \x01(\x03H\x01\x88\x01\x01\x12\x0f\n\x07job_ids\x18\t \x03(\x03\x12\x1d\n\x10num_active_tasks\x18\n \x01(\x05H\x02\x88\x01\x01\x12\x1d\n\x10num_failed_tasks\x18\x0b \x01(\x05H\x03\x88\x01\x01\x12 \n\x13num_completed_tasks\x18\x0c \x01(\x05H\x04\x88\x01\x01\x12\x13\n\x06status\x18\r \x01(\tH\x05\x88\x01\x01"L\n\x0eStageEventType\x12\x13\n\x0fSTAGE_SUBMITTED\x10\x00\x12\x10\n\x0cSTAGE_ACTIVE\x10\x01\x12\x13\n\x0fSTAGE_COMPLETED\x10\x02\x42\x12\n\x10_submission_timeB\x12\n\x10_completion_timeB\x13\n\x11_num_active_tasksB\x13\n\x11_num_failed_tasksB\x16\n\x14_num_completed_tasksB\t\n\x07_status\x1a\xdf\x03\n\tTaskEvent\x12O\n\nevent_type\x18\x01 \x01(\x0e\x32;.spark.connect.SparkMonitorProgress.TaskEvent.TaskEventType\x12\x0f\n\x07task_id\x18\x02 \x01(\x03\x12\x10\n\x08stage_id\x18\x03 \x01(\x03\x12\x18\n\x10stage_attempt_id\x18\x04 \x01(\x05\x12\r\n\x05index\x18\x05 \x01(\x05\x12\x16\n\x0e\x61ttempt_number\x18\x06 \x01(\x05\x12\x13\n\x0b\x65xecutor_id\x18\x07 \x01(\t\x12\x0c\n\x04host\x18\x08 \x01(\t\x12\x0e\n\x06status\x18\t \x01(\t\x12\x13\n\x0bspeculative\x18\n \x01(\x08\x12\x18\n\x0blaunch_time\x18\x0b \x01(\x03H\x00\x88\x01\x01\x12\x18\n\x0b\x66inish_time\x18\x0c \x01(\x03H\x01\x88\x01\x01\x12\x16\n\ttask_type\x18\r \x01(\tH\x02\x88\x01\x01\x12\x1a\n\rerror_message\x18\x0e \x01(\tH\x03\x88\x01\x01"-\n\rTaskEventType\x12\x0e\n\nTASK_START\x10\x00\x12\x0c\n\x08TASK_END\x10\x01\x42\x0e\n\x0c_launch_timeB\x0e\n\x0c_finish_timeB\x0c\n\n_task_typeB\x10\n\x0e_error_message\x1a\xb6\x02\n\rExecutorEvent\x12W\n\nevent_type\x18\x01 \x01(\x0e\x32\x43.spark.connect.SparkMonitorProgress.ExecutorEvent.ExecutorEventType\x12\x13\n\x0b\x65xecutor_id\x18\x02 \x01(\t\x12\x0c\n\x04time\x18\x03 \x01(\x03\x12\x11\n\x04host\x18\x04 \x01(\tH\x00\x88\x01\x01\x12\x16\n\tnum_cores\x18\x05 \x01(\x05H\x01\x88\x01\x01\x12\x18\n\x0btotal_cores\x18\x06 \x01(\x05H\x02\x88\x01\x01"=\n\x11\x45xecutorEventType\x12\x12\n\x0e\x45XECUTOR_ADDED\x10\x00\x12\x14\n\x10\x45XECUTOR_REMOVED\x10\x01\x42\x07\n\x05_hostB\x0c\n\n_num_coresB\x0e\n\x0c_total_coresB\x13\n\x11_application_infoB\x12\n\x10_stream_completeB"\n\x1eorg.apache.spark.connect.protoP\x01\x62\x06proto3'
+)
+
+_builder.BuildMessageAndEnumDescriptors(DESCRIPTOR, globals())
+_builder.BuildTopDescriptorsAndMessages(
+    DESCRIPTOR,
+    "google.cloud.dataproc_spark_connect.proto.sparkmonitor_pb2",
+    globals(),
+)
+if _descriptor._USE_C_DESCRIPTORS == False:
+
+    DESCRIPTOR._options = None
+    DESCRIPTOR._serialized_options = (
+        b"\n\036org.apache.spark.connect.protoP\001"
+    )
+    _SPARKMONITORPROGRESS_JOBEVENT_STAGEINFOSENTRY._options = None
+    _SPARKMONITORPROGRESS_JOBEVENT_STAGEINFOSENTRY._serialized_options = (
+        b"8\001"
+    )
+    _SPARKMONITORPROGRESS._serialized_start = 80
+    _SPARKMONITORPROGRESS._serialized_end = 3006
+    _SPARKMONITORPROGRESS_APPLICATIONINFO._serialized_start = 507
+    _SPARKMONITORPROGRESS_APPLICATIONINFO._serialized_end = 756
+    _SPARKMONITORPROGRESS_JOBEVENT._serialized_start = 759
+    _SPARKMONITORPROGRESS_JOBEVENT._serialized_end = 1451
+    _SPARKMONITORPROGRESS_JOBEVENT_STAGEINFOSENTRY._serialized_start = 1186
+    _SPARKMONITORPROGRESS_JOBEVENT_STAGEINFOSENTRY._serialized_end = 1285
+    _SPARKMONITORPROGRESS_JOBEVENT_JOBEVENTTYPE._serialized_start = 1287
+    _SPARKMONITORPROGRESS_JOBEVENT_JOBEVENTTYPE._serialized_end = 1329
+    _SPARKMONITORPROGRESS_JOBSTAGEINFO._serialized_start = 1453
+    _SPARKMONITORPROGRESS_JOBSTAGEINFO._serialized_end = 1570
+    _SPARKMONITORPROGRESS_DETAILEDSTAGEEVENT._serialized_start = 1573
+    _SPARKMONITORPROGRESS_DETAILEDSTAGEEVENT._serialized_end = 2170
+    _SPARKMONITORPROGRESS_DETAILEDSTAGEEVENT_STAGEEVENTTYPE._serialized_start = (
+        1977
+    )
+    _SPARKMONITORPROGRESS_DETAILEDSTAGEEVENT_STAGEEVENTTYPE._serialized_end = (
+        2053
+    )
+    _SPARKMONITORPROGRESS_TASKEVENT._serialized_start = 2173
+    _SPARKMONITORPROGRESS_TASKEVENT._serialized_end = 2652
+    _SPARKMONITORPROGRESS_TASKEVENT_TASKEVENTTYPE._serialized_start = 2543
+    _SPARKMONITORPROGRESS_TASKEVENT_TASKEVENTTYPE._serialized_end = 2588
+    _SPARKMONITORPROGRESS_EXECUTOREVENT._serialized_start = 2655
+    _SPARKMONITORPROGRESS_EXECUTOREVENT._serialized_end = 2965
+    _SPARKMONITORPROGRESS_EXECUTOREVENT_EXECUTOREVENTTYPE._serialized_start = (
+        2865
+    )
+    _SPARKMONITORPROGRESS_EXECUTOREVENT_EXECUTOREVENTTYPE._serialized_end = 2926
+# @@protoc_insertion_point(module_scope)
diff --git a/google/cloud/dataproc_spark_connect/session.py b/google/cloud/dataproc_spark_connect/session.py
index 7ad24fe..359d574 100644
--- a/google/cloud/dataproc_spark_connect/session.py
+++ b/google/cloud/dataproc_spark_connect/session.py
@@ -24,6 +24,7 @@
 import threading
 import time
 import uuid
+import queue
 import tqdm
 from packaging import version
 from types import MethodType
@@ -42,6 +43,7 @@
 from google.auth.exceptions import DefaultCredentialsError
 from google.cloud.dataproc_spark_connect.client import DataprocChannelBuilder
 from google.cloud.dataproc_spark_connect.exceptions import DataprocSparkConnectException
+from google.cloud.dataproc_spark_connect.proto import sparkmonitor_pb2
 from google.cloud.dataproc_spark_connect.pypi_artifacts import PyPiArtifacts
 from google.cloud.dataproc_v1 import (
     AuthenticationConfig,
@@ -54,6 +56,7 @@
 )
 from google.cloud.dataproc_v1.types import sessions
 from google.cloud.dataproc_spark_connect import environment
+from google.protobuf import json_format
 from pyspark.sql.connect.session import SparkSession
 from pyspark.sql.utils import to_str
 
@@ -61,6 +64,11 @@
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 
+# type_url used by the upstream ExecutePlanResponse.extension (field 999) slot for SparkMonitor
+_SPARK_MONITOR_TYPE_URL = (
+    "type.googleapis.com/spark.connect.SparkMonitorProgress"
+)
+
 # System labels that should not be overridden by user
 SYSTEM_LABELS = {
     "dataproc-session-client",
@@ -955,6 +963,19 @@ def __init__(
 
         super().__init__(connection, user_id)
 
+        # Unique ID for the currently executing cell
+        # This is set by the pre_run_cell hook before each cell executes
+        self._current_cell_run_id: Optional[str] = None
+
+        # Track if we're in an IPython environment
+        self._ipython_available = False
+
+        # Setup cell tracking FIRST (sets up the run_id mechanism)
+        self._setup_cell_execution_tracking()
+
+        # Setup SparkMonitor interception
+        self._setup_sparkmonitor_interception()
+
         execute_plan_request_base_method = (
             self.client._execute_plan_request_with_metadata
         )
@@ -1008,6 +1029,376 @@ def clearProgressHandlers_wrapper_method(_, *args, **kwargs):
             clearProgressHandlers_wrapper_method, self
         )
 
+    def _setup_cell_execution_tracking(self):
+        """
+        Hook into IPython's cell execution events to generate unique IDs
+        for each cell execution. This allows VS Code to associate SparkMonitor
+        messages with the correct cell.
+        """
+        try:
+            from IPython import get_ipython
+            from IPython.display import display
+
+            ip = get_ipython()
+
+            if ip is not None:
+                self._ipython_available = True
+
+                # Set run_id for the current cell (the one creating the session)
+                self._current_cell_run_id = str(uuid.uuid4())
+
+                # Bootstrap the session-creation cell: the pre_run_cell hook did not exist
+                # when this cell started executing, so it never fired for it. This one-time
+                # call manually injects the initial SparkMonitor payload for the current cell,
+                # ensuring the widget occupies the top output slot (index 0) before any
+                # subsequent print statements from session creation execute.
+                display_data = {
+                    "application/vnd.sparkmonitor+json": {
+                        "msgtype": "fromscala",
+                        "msg": '{"msgtype": "sparkMonitorInit"}',
+                    }
+                }
+                display(
+                    display_data, raw=True, display_id=self._current_cell_run_id
+                )
+
+                def pre_run_cell_hook(*args, **kwargs):
+                    """
+                    Called by IPython BEFORE each cell executes.
+                    Generates a new unique ID for this cell execution.
+                    """
+                    self._current_cell_run_id = str(uuid.uuid4())
+
+                    # Inject an initial empty payload right when the cell starts.
+                    # This guarantees the SparkMonitor widget occupies the top spot (index 0)
+                    # in the VS Code outputs before any user code `print` statements execute.
+                    display_data = {
+                        "application/vnd.sparkmonitor+json": {
+                            "msgtype": "fromscala",
+                            "msg": '{"msgtype": "sparkMonitorInit"}',
+                        }
+                    }
+                    display(
+                        display_data,
+                        raw=True,
+                        display_id=self._current_cell_run_id,
+                    )
+
+                ip.events.register("pre_run_cell", pre_run_cell_hook)
+            else:
+                logger.debug(
+                    "Not in IPython environment - cell tracking disabled"
+                )
+
+        except Exception as e:
+            logger.warning(f"Could not setup cell tracking: {e}")
+
+    def _setup_sparkmonitor_interception(self):
+        """Intercept gRPC ExecutePlan responses to extract SparkMonitorProgress messages
+        delivered via the upstream extension slot (google.protobuf.Any, field 999).
+        """
+        original_execute_plan = self.client._stub.ExecutePlan
+
+        def sparkmonitor_intercepting_execute_plan(request, **kwargs):
+            """Wrapper that intercepts raw ExecutePlanResponse objects with background consumption"""
+            # Query-scoped counters (not shared across queries)
+            msg_type_counts = {}
+            responses_with_sparkmonitor = [0]
+
+            response_queue = queue.Queue()
+            background_error = [None]  # Mutable container for thread errors
+            stream_exhausted = threading.Event()
+
+            def background_consumer():
+                """Background thread that consumes all messages from gRPC stream"""
+                try:
+                    count = 0
+                    for raw_response in original_execute_plan(
+                        request, **kwargs
+                    ):
+                        count += 1
+                        # SparkMonitor extension responses must NOT be forwarded to PySpark —
+                        # PySpark raises UNKNOWN_RESPONSE for Any payloads it doesn't recognise.
+                        is_sparkmonitor = (
+                            raw_response.HasField("extension")
+                            and raw_response.extension.type_url
+                            == _SPARK_MONITOR_TYPE_URL
+                        )
+                        if is_sparkmonitor:
+                            self._extract_and_send_sparkmonitor(
+                                raw_response,
+                                count,
+                                msg_type_counts,
+                                responses_with_sparkmonitor,
+                            )
+                        else:
+                            response_queue.put(raw_response)
+
+                    stream_exhausted.set()
+                except Exception as e:
+                    background_error[0] = e
+                    stream_exhausted.set()
+                finally:
+                    response_queue.put(None)
+
+            # Start background consumer thread
+            consumer_thread = threading.Thread(
+                target=background_consumer, daemon=True
+            )
+            consumer_thread.start()
+
+            # Yield responses from queue to main consumer (PySpark)
+            while True:
+                try:
+                    raw_response = response_queue.get(timeout=0.1)
+                    if raw_response is None:
+                        # End of stream marker
+                        break
+                    yield raw_response
+                except queue.Empty:
+                    # Check if stream is exhausted and queue is empty
+                    if stream_exhausted.is_set() and response_queue.empty():
+                        break
+                    continue
+
+            if background_error[0]:
+                raise background_error[0]
+
+        self.client._stub.ExecutePlan = sparkmonitor_intercepting_execute_plan
+
+    def _extract_and_send_sparkmonitor(
+        self,
+        raw_response,
+        response_num: int,
+        msg_type_counts: dict,
+        responses_with_sparkmonitor: list,
+    ):
+        """Extract SparkMonitor data from a raw gRPC response and send it to VS Code.
+
+        SparkMonitor data is delivered via the upstream extension slot (field 999) on
+        ExecutePlanResponse as a google.protobuf.Any whose type_url is
+        _SPARK_MONITOR_TYPE_URL. We unpack the raw bytes into our SparkMonitorProgress
+        proto to get full typed access.
+
+        Args:
+            raw_response: The gRPC ExecutePlanResponse
+            response_num: Response number in this query
+            msg_type_counts: Query-scoped message type counter dict
+            responses_with_sparkmonitor: Query-scoped counter for responses with SparkMonitor data
+        """
+        try:
+            if not raw_response.HasField("extension"):
+                return
+
+            if raw_response.extension.type_url != _SPARK_MONITOR_TYPE_URL:
+                return
+
+            sm = sparkmonitor_pb2.SparkMonitorProgress()
+            sm.ParseFromString(raw_response.extension.value)
+
+            # Guard against a valid SparkMonitorProgress that carries no payload
+            is_sparkmonitor = (
+                sm.HasField("application_info")
+                or len(sm.job_events) > 0
+                or len(sm.stage_events) > 0
+                or len(sm.task_events) > 0
+                or len(sm.executor_events) > 0
+                or sm.HasField("stream_complete")
+            )
+            if not is_sparkmonitor:
+                return
+
+            responses_with_sparkmonitor[0] += 1
+
+            msg_type = self._derive_sparkmonitor_msgtype(sm)
+            msg_type_counts[msg_type] = msg_type_counts.get(msg_type, 0) + 1
+
+            # Skip stream completion signal (don't forward to VS Code)
+            if sm.HasField("stream_complete") and sm.stream_complete:
+                return
+
+            # Convert to Scala-compatible JSON and send to VS Code
+            json_msg = self._proto_to_scala_json_format(sm)
+            self._send_to_vscode(json_msg)
+
+        except Exception as e:
+            logger.debug(f"Error extracting SparkMonitor: {e}")
+
+    def _derive_sparkmonitor_msgtype(
+        self, sm: sparkmonitor_pb2.SparkMonitorProgress
+    ) -> str:
+        """Derive a msgtype string from the new enum-based SparkMonitor proto structure."""
+        if sm.HasField("stream_complete"):
+            return "sparkMonitorStreamComplete"
+        if sm.HasField("application_info"):
+            return (
+                "sparkApplicationStart"
+                if sm.application_info.HasField("start_time")
+                else "sparkApplicationEnd"
+            )
+        if sm.job_events:
+            return (
+                "sparkJobStart"
+                if sm.job_events[0].event_type == 0
+                else "sparkJobEnd"
+            )
+        if sm.stage_events:
+            return [
+                "sparkStageSubmitted",
+                "sparkStageActive",
+                "sparkStageCompleted",
+            ][sm.stage_events[0].event_type]
+        if sm.task_events:
+            return (
+                "sparkTaskStart"
+                if sm.task_events[0].event_type == 0
+                else "sparkTaskEnd"
+            )
+        if sm.executor_events:
+            return (
+                "sparkExecutorAdded"
+                if sm.executor_events[0].event_type == 0
+                else "sparkExecutorRemoved"
+            )
+        return "unknown"
+
+    def _convert_string_numbers_to_int(self, obj):
+        """
+        Recursively convert string numbers to integers in a dictionary.
+
+        MessageToJson converts int64 fields to strings by default to avoid JavaScript
+        precision issues, but the VS Code SparkMonitor extension expects numeric values.
+        """
+        if isinstance(obj, dict):
+            return {
+                k: self._convert_string_numbers_to_int(v)
+                for k, v in obj.items()
+            }
+        elif isinstance(obj, list):
+            return [self._convert_string_numbers_to_int(item) for item in obj]
+        elif isinstance(obj, str):
+            # Try to convert string to int if it looks like a number
+            # Negative numbers (like -1 for completionTime) should also be converted
+            if obj.lstrip("-").isdigit():
+                return int(obj)
+            return obj
+        else:
+            return obj
+
+    def _proto_to_scala_json_format(
+        self, sm: sparkmonitor_pb2.SparkMonitorProgress
+    ) -> dict:
+        """
+        Convert protobuf message to JSON format matching the Scala listener's output.
+
+        Handles the new ExecutionProgress-based protocol where events are delivered as
+        typed sub-messages with enums (JobEvent, DetailedStageEvent, TaskEvent, ExecutorEvent)
+        rather than the old string msg_type + separate data messages approach.
+
+        The output format is unchanged from before:
+        - 'msgtype' (lowercase) for the event type string
+        - camelCase for all other fields
+        - Numeric fields as JSON numbers (not strings)
+        """
+        try:
+            # Convert proto to JSON with camelCase field names
+            try:
+                # Protobuf 5.x+ uses always_print_fields_with_no_presence
+                json_str = json_format.MessageToJson(
+                    sm,
+                    preserving_proto_field_name=False,
+                    always_print_fields_with_no_presence=True,
+                )
+            except TypeError:
+                # Protobuf <5.x uses including_default_value_fields
+                json_str = json_format.MessageToJson(
+                    sm,
+                    preserving_proto_field_name=False,
+                    including_default_value_fields=True,
+                )
+        except Exception as e:
+            logger.error(f"Failed to convert proto to JSON: {e}")
+            return {"msgtype": "unknown", "error": "conversion_failed"}
+
+        msg = json.loads(json_str)
+
+        # Convert string numbers to actual numbers for compatibility with VS Code extension
+        # MessageToJson converts int64 to strings by default to avoid JS precision issues,
+        # but the SparkMonitor extension expects numeric values
+        msg = self._convert_string_numbers_to_int(msg)
+
+        # Use proto HasField / list length for type detection.
+        # Then pull event data from the corresponding JSON key and strip the enum 'eventType' field.
+        if sm.HasField("application_info"):
+            msgtype = (
+                "sparkApplicationStart"
+                if sm.application_info.HasField("start_time")
+                else "sparkApplicationEnd"
+            )
+            event_data = msg.get("applicationInfo", {})
+        elif sm.job_events:
+            msgtype = (
+                "sparkJobStart"
+                if sm.job_events[0].event_type == 0
+                else "sparkJobEnd"
+            )
+            raw = msg.get("jobEvents", [{}])[0]
+            event_data = {k: v for k, v in raw.items() if k != "eventType"}
+        elif sm.stage_events:
+            msgtype = [
+                "sparkStageSubmitted",
+                "sparkStageActive",
+                "sparkStageCompleted",
+            ][sm.stage_events[0].event_type]
+            raw = msg.get("stageEvents", [{}])[0]
+            event_data = {k: v for k, v in raw.items() if k != "eventType"}
+        elif sm.task_events:
+            msgtype = (
+                "sparkTaskStart"
+                if sm.task_events[0].event_type == 0
+                else "sparkTaskEnd"
+            )
+            raw = msg.get("taskEvents", [{}])[0]
+            event_data = {k: v for k, v in raw.items() if k != "eventType"}
+        elif sm.executor_events:
+            msgtype = (
+                "sparkExecutorAdded"
+                if sm.executor_events[0].event_type == 0
+                else "sparkExecutorRemoved"
+            )
+            raw = msg.get("executorEvents", [{}])[0]
+            event_data = {k: v for k, v in raw.items() if k != "eventType"}
+        else:
+            return {"msgtype": "unknown"}
+
+        return {"msgtype": msgtype, **event_data}
+
+    def _send_to_vscode(self, msg: dict):
+        """Send SparkMonitor data to VS Code using IPython display mechanism.
+
+        Matches the remote kernel format exactly:
+        - Wraps the event in a 'fromscala' envelope
+        - Converts the msg dict to a JSON string (like the Scala listener does)
+        """
+        if not self._ipython_available:
+            return
+
+        try:
+            from IPython.display import display
+
+            display_id = self._current_cell_run_id or str(uuid.uuid4())
+
+            wrapper = {"msgtype": "fromscala", "msg": json.dumps(msg)}
+
+            display_data = {
+                "application/vnd.sparkmonitor+json": wrapper,
+            }
+
+            display(display_data, raw=True, display_id=display_id)
+
+        except Exception as e:
+            logger.debug(f"Error sending to VS Code: {e}")
+
     @staticmethod
     @functools.lru_cache(maxsize=1)
     def get_tqdm_bar():
diff --git a/setup.py b/setup.py
index 539e50e..2163f51 100644
--- a/setup.py
+++ b/setup.py
@@ -28,6 +28,13 @@
     url="https://github.com/GoogleCloudDataproc/dataproc-spark-connect-python",
     license="Apache 2.0",
     packages=find_namespace_packages(include=["google.*"]),
+    package_data={
+        "google.cloud.dataproc_spark_connect.proto": [
+            "*.proto",
+            "*_pb2.py",
+        ],
+    },
+    include_package_data=True,
     install_requires=[
         "google-api-core>=2.19",
         "google-cloud-dataproc>=5.18",
@@ -35,5 +42,6 @@
         "pyspark[connect]~=4.0.0",
         "tqdm>=4.67",
         "websockets>=14.0",
+        "protobuf>=3.20.0",
     ],
 )
diff --git a/tests/unit/test_session.py b/tests/unit/test_session.py
index 2b1a624..3e0ddb3 100644
--- a/tests/unit/test_session.py
+++ b/tests/unit/test_session.py
@@ -1617,6 +1617,7 @@ def test_execute_plan_request_default_behaviour(
 
         try:
             session = DataprocSparkSession.builder.getOrCreate()
+            mock_uuid4.reset_mock()  # clear calls from session init (e.g. _setup_cell_execution_tracking)
             client = session.client
 
             result_request = client._execute_plan_request_with_metadata()
@@ -1710,6 +1711,7 @@ def test_execute_plan_request_with_operation_id_provided(
 
         try:
             session = DataprocSparkSession.builder.getOrCreate()
+            mock_uuid4.reset_mock()  # clear calls from session init (e.g. _setup_cell_execution_tracking)
             client = session.client
 
             result_request = client._execute_plan_request_with_metadata()
@@ -2644,5 +2646,344 @@ def test_session_skip_terminated(self, mock_session_controller_client):
         mock_client.get_session.assert_called_once()
 
 
+class SparkMonitorTests(unittest.TestCase):
+    """Tests for the SparkMonitor integration added to DataprocSparkSession."""
+
+    def setUp(self):
+        self.original_environment = dict(os.environ)
+        os.environ.clear()
+        os.environ["GOOGLE_CLOUD_PROJECT"] = "test-project"
+        os.environ["GOOGLE_CLOUD_REGION"] = "test-region"
+
+    def tearDown(self):
+        os.environ.clear()
+        os.environ.update(self.original_environment)
+
+    @staticmethod
+    def _make_session_instance(**attrs):
+        """Create a minimal mock DataprocSparkSession with given attributes."""
+        session = mock.MagicMock(spec=DataprocSparkSession)
+        for key, value in attrs.items():
+            setattr(session, key, value)
+        return session
+
+    @staticmethod
+    def _encode_varint(value):
+        """Encode an integer as a protobuf base-128 varint."""
+        result = b""
+        while value > 127:
+            result += bytes([(value & 0x7F) | 0x80])
+            value >>= 7
+        result += bytes([value])
+        return result
+
+    def _build_fake_grpc_response(self, sm):
+        """Build a fake gRPC response with SparkMonitorProgress packed in extension (Any, field 999)."""
+        from google.cloud.dataproc_spark_connect.session import _SPARK_MONITOR_TYPE_URL
+
+        sm_bytes = sm.SerializeToString()
+        mock_response = mock.MagicMock()
+        mock_response.HasField.side_effect = lambda field: field == "extension"
+        mock_response.extension.type_url = _SPARK_MONITOR_TYPE_URL
+        mock_response.extension.value = sm_bytes
+        return mock_response
+
+    def test_convert_string_numbers_to_int_positive(self):
+        session = self._make_session_instance()
+        result = DataprocSparkSession._convert_string_numbers_to_int(
+            session, "42"
+        )
+        self.assertEqual(result, 42)
+        self.assertIsInstance(result, int)
+
+    def test_convert_string_numbers_to_int_negative(self):
+        """Negative string numbers such as completionTime=-1 should be converted."""
+        session = self._make_session_instance()
+        result = DataprocSparkSession._convert_string_numbers_to_int(
+            session, "-1"
+        )
+        self.assertEqual(result, -1)
+        self.assertIsInstance(result, int)
+
+    def test_convert_string_numbers_to_int_preserves_non_numeric(self):
+        session = self._make_session_instance()
+        result = DataprocSparkSession._convert_string_numbers_to_int(
+            session, "sparkJobStart"
+        )
+        self.assertEqual(result, "sparkJobStart")
+
+    def test_convert_string_numbers_to_int_nested_dict_and_list(self):
+        session = self._make_session_instance()
+        # Wire up the recursive self-call so nested values are also converted
+        session._convert_string_numbers_to_int = (
+            lambda x: DataprocSparkSession._convert_string_numbers_to_int(
+                session, x
+            )
+        )
+        obj = {"jobId": "5", "status": "SUCCEEDED", "stageIds": ["1", "2"]}
+        result = DataprocSparkSession._convert_string_numbers_to_int(
+            session, obj
+        )
+        self.assertEqual(
+            result, {"jobId": 5, "status": "SUCCEEDED", "stageIds": [1, 2]}
+        )
+
+    def test_convert_string_numbers_to_int_passthrough_non_string(self):
+        session = self._make_session_instance()
+        self.assertEqual(
+            DataprocSparkSession._convert_string_numbers_to_int(session, 99), 99
+        )
+        self.assertIsNone(
+            DataprocSparkSession._convert_string_numbers_to_int(session, None)
+        )
+
+    def test_proto_to_scala_json_format_job_start(self):
+        from google.cloud.dataproc_spark_connect.proto import sparkmonitor_pb2
+
+        session = self._make_session_instance()
+        session._convert_string_numbers_to_int = (
+            lambda x: DataprocSparkSession._convert_string_numbers_to_int(
+                session, x
+            )
+        )
+
+        sm = sparkmonitor_pb2.SparkMonitorProgress()
+        je = sm.job_events.add()
+        je.event_type = sparkmonitor_pb2.SparkMonitorProgress.JobEvent.JOB_START
+        je.job_id = 3
+        je.num_tasks = 10
+        je.num_executors = 2
+
+        result = DataprocSparkSession._proto_to_scala_json_format(session, sm)
+
+        self.assertEqual(result["msgtype"], "sparkJobStart")
+        self.assertEqual(result["jobId"], 3)
+        self.assertEqual(result["numTasks"], 10)
+        self.assertNotIn("eventType", result)
+
+    def test_proto_to_scala_json_format_job_end(self):
+        from google.cloud.dataproc_spark_connect.proto import sparkmonitor_pb2
+
+        session = self._make_session_instance()
+        session._convert_string_numbers_to_int = (
+            lambda x: DataprocSparkSession._convert_string_numbers_to_int(
+                session, x
+            )
+        )
+
+        sm = sparkmonitor_pb2.SparkMonitorProgress()
+        je = sm.job_events.add()
+        je.event_type = sparkmonitor_pb2.SparkMonitorProgress.JobEvent.JOB_END
+        je.job_id = 3
+        je.status = "SUCCEEDED"
+
+        result = DataprocSparkSession._proto_to_scala_json_format(session, sm)
+
+        self.assertEqual(result["msgtype"], "sparkJobEnd")
+        self.assertEqual(result["jobId"], 3)
+        self.assertEqual(result["status"], "SUCCEEDED")
+
+    def test_proto_to_scala_json_format_stage_active(self):
+        from google.cloud.dataproc_spark_connect.proto import sparkmonitor_pb2
+
+        session = self._make_session_instance()
+        session._convert_string_numbers_to_int = (
+            lambda x: DataprocSparkSession._convert_string_numbers_to_int(
+                session, x
+            )
+        )
+
+        sm = sparkmonitor_pb2.SparkMonitorProgress()
+        se = sm.stage_events.add()
+        se.event_type = (
+            sparkmonitor_pb2.SparkMonitorProgress.DetailedStageEvent.STAGE_ACTIVE
+        )
+        se.stage_id = 7
+        se.num_tasks = 20
+        se.num_completed_tasks = 20  # optional field
+
+        result = DataprocSparkSession._proto_to_scala_json_format(session, sm)
+
+        self.assertEqual(result["msgtype"], "sparkStageActive")
+        self.assertEqual(result["stageId"], 7)
+        self.assertEqual(result["numTasks"], 20)
+        self.assertNotIn("eventType", result)
+
+    def test_send_to_vscode_skips_when_ipython_unavailable(self):
+        session = self._make_session_instance(_ipython_available=False)
+
+        with mock.patch("IPython.display.display") as mock_display:
+            DataprocSparkSession._send_to_vscode(
+                session, {"msgtype": "sparkJobStart"}
+            )
+            mock_display.assert_not_called()
+
+    def test_send_to_vscode_calls_display_when_ipython_available(self):
+        import json
+
+        run_id = "test-run-id-1234"
+        session = self._make_session_instance(
+            _ipython_available=True,
+            _current_cell_run_id=run_id,
+        )
+        msg = {"msgtype": "sparkJobEnd", "jobId": 1}
+
+        with mock.patch("IPython.display.display") as mock_display:
+            with mock.patch.dict(
+                "sys.modules",
+                {"IPython.display": mock.MagicMock(display=mock_display)},
+            ):
+                DataprocSparkSession._send_to_vscode(session, msg)
+
+            mock_display.assert_called_once()
+            call_args = mock_display.call_args
+            display_data = call_args[0][0]
+            self.assertIn("application/vnd.sparkmonitor+json", display_data)
+            wrapper = display_data["application/vnd.sparkmonitor+json"]
+            self.assertEqual(wrapper["msgtype"], "fromscala")
+            self.assertEqual(json.loads(wrapper["msg"]), msg)
+
+    def test_extract_and_send_skips_response_without_sparkmonitor_data(self):
+        session = self._make_session_instance()
+
+        # Response that has no extension field at all
+        mock_response = mock.MagicMock()
+        mock_response.HasField.side_effect = lambda field: False
+
+        msg_type_counts = {}
+        responses_with_sparkmonitor = [0]
+
+        DataprocSparkSession._extract_and_send_sparkmonitor(
+            session,
+            mock_response,
+            1,
+            msg_type_counts,
+            responses_with_sparkmonitor,
+        )
+
+        self.assertEqual(responses_with_sparkmonitor[0], 0)
+        session._send_to_vscode.assert_not_called()
+
+    def test_extract_and_send_skips_stream_complete_signal(self):
+        from google.cloud.dataproc_spark_connect.proto import sparkmonitor_pb2
+
+        session = self._make_session_instance()
+
+        sm = sparkmonitor_pb2.SparkMonitorProgress()
+        sm.stream_complete = True
+        mock_response = self._build_fake_grpc_response(sm)
+
+        # Wire up _derive_sparkmonitor_msgtype
+        session._derive_sparkmonitor_msgtype = (
+            lambda s: DataprocSparkSession._derive_sparkmonitor_msgtype(
+                session, s
+            )
+        )
+
+        msg_type_counts = {}
+        responses_with_sparkmonitor = [0]
+
+        DataprocSparkSession._extract_and_send_sparkmonitor(
+            session,
+            mock_response,
+            1,
+            msg_type_counts,
+            responses_with_sparkmonitor,
+        )
+
+        # Counter incremented but _send_to_vscode NOT called
+        self.assertEqual(responses_with_sparkmonitor[0], 1)
+        self.assertEqual(msg_type_counts["sparkMonitorStreamComplete"], 1)
+        session._send_to_vscode.assert_not_called()
+
+    def test_extract_and_send_processes_valid_job_start_payload(self):
+        from google.cloud.dataproc_spark_connect.proto import sparkmonitor_pb2
+
+        session = self._make_session_instance()
+
+        sm = sparkmonitor_pb2.SparkMonitorProgress()
+        je = sm.job_events.add()
+        je.event_type = sparkmonitor_pb2.SparkMonitorProgress.JobEvent.JOB_START
+        je.job_id = 1
+        je.num_tasks = 8
+
+        mock_response = self._build_fake_grpc_response(sm)
+
+        # Wire up real implementations so the full extraction pipeline runs
+        session._convert_string_numbers_to_int = (
+            lambda x: DataprocSparkSession._convert_string_numbers_to_int(
+                session, x
+            )
+        )
+        session._proto_to_scala_json_format = (
+            lambda s: DataprocSparkSession._proto_to_scala_json_format(
+                session, s
+            )
+        )
+        session._derive_sparkmonitor_msgtype = (
+            lambda s: DataprocSparkSession._derive_sparkmonitor_msgtype(
+                session, s
+            )
+        )
+
+        msg_type_counts = {}
+        responses_with_sparkmonitor = [0]
+
+        DataprocSparkSession._extract_and_send_sparkmonitor(
+            session,
+            mock_response,
+            1,
+            msg_type_counts,
+            responses_with_sparkmonitor,
+        )
+
+        self.assertEqual(responses_with_sparkmonitor[0], 1)
+        self.assertEqual(msg_type_counts["sparkJobStart"], 1)
+        session._send_to_vscode.assert_called_once()
+        sent_msg = session._send_to_vscode.call_args[0][0]
+        self.assertEqual(sent_msg["msgtype"], "sparkJobStart")
+
+    def test_setup_cell_tracking_sets_flag_when_ipython_present(self):
+        """When IPython is available and has a live shell, _ipython_available should be True."""
+        session = self._make_session_instance(
+            _ipython_available=False, _current_cell_run_id=None
+        )
+
+        mock_ip = mock.MagicMock()
+        with mock.patch("IPython.get_ipython", return_value=mock_ip):
+            with mock.patch("IPython.display.display"):
+                DataprocSparkSession._setup_cell_execution_tracking(session)
+
+        self.assertTrue(session._ipython_available)
+        self.assertIsNotNone(session._current_cell_run_id)
+        mock_ip.events.register.assert_called_once_with(
+            "pre_run_cell", mock.ANY
+        )
+
+    def test_setup_cell_tracking_leaves_flag_false_when_no_ipython_shell(self):
+        """When get_ipython() returns None, _ipython_available should remain False."""
+        session = self._make_session_instance(
+            _ipython_available=False, _current_cell_run_id=None
+        )
+
+        with mock.patch("IPython.get_ipython", return_value=None):
+            DataprocSparkSession._setup_cell_execution_tracking(session)
+
+        self.assertFalse(session._ipython_available)
+        self.assertIsNone(session._current_cell_run_id)
+
+    def test_setup_cell_tracking_is_resilient_to_import_error(self):
+        """If IPython is not installed, the method should not raise."""
+        session = self._make_session_instance(
+            _ipython_available=False, _current_cell_run_id=None
+        )
+
+        with mock.patch.dict("sys.modules", {"IPython": None}):
+            # Should not raise
+            DataprocSparkSession._setup_cell_execution_tracking(session)
+
+        self.assertFalse(session._ipython_available)
+
+
 if __name__ == "__main__":
     unittest.main()