From e620e9635fc5331a95776df2ff078b6698d385b8 Mon Sep 17 00:00:00 2001
From: Siddartha Pothapragada <sidart@meta.com>
Date: Wed, 24 Jun 2026 23:42:46 -0700
Subject: [PATCH] Disable qnn_16a16w Llama runner test (OOM on linux.2xlarge)

The test-llama-runner-qnn-linux (qnn_16a16w) job has been OOM-killed on
linux.2xlarge since PR #19660 landed, blocking viable/strict from
advancing for 73+ commits. Disable it while the Qualcomm team
investigates the memory regression and potential accuracy issue.
---
 .github/workflows/pull.yml  | 3 ++-
 .github/workflows/trunk.yml | 3 ++-
 2 files changed, 4 insertions(+), 2 deletions(-)

diff --git a/.github/workflows/pull.yml b/.github/workflows/pull.yml
index 06369811449..b46c6b898f7 100644
--- a/.github/workflows/pull.yml
+++ b/.github/workflows/pull.yml
@@ -825,7 +825,8 @@ jobs:
     strategy:
       matrix:
         dtype: [fp32]
-        pt2e_quantize: [qnn_16a16w, qnn_8a8w]
+        # TODO(T12345): re-enable qnn_16a16w once OOM on linux.2xlarge is resolved
+        pt2e_quantize: [qnn_8a8w]
         mode: [qnn]
       fail-fast: false
     with:
diff --git a/.github/workflows/trunk.yml b/.github/workflows/trunk.yml
index 7604ca474b0..7ded9e4cecc 100644
--- a/.github/workflows/trunk.yml
+++ b/.github/workflows/trunk.yml
@@ -951,7 +951,8 @@ jobs:
     strategy:
       matrix:
         dtype: [fp32]
-        pt2e_quantize: [qnn_16a16w, qnn_8a8w]
+        # TODO(T12345): re-enable qnn_16a16w once OOM on linux.2xlarge is resolved
+        pt2e_quantize: [qnn_8a8w]
         mode: [qnn]
       fail-fast: false
     with: