Windows Server 2012 上の IIS8 で、ARRを使ったリバースプロキシによるWebサイトを構築しています。(以下、概念図)

Webサイト1は主にURL書き換え機能により不正なリクエストを拒否したりしているサイトです。
ASP.NET で作成しているアプリ本体はWebサイト2にあり、Webサイト1からはARRによるリバースプロキシによりアクセスされます。
このような状況下で、同時に多数のリクエスト(同時接続数がCPUコア数を大きく超えるような数)が来た場合、このサーバーのCPUやメモリ消費量が増えずに、パフォーマンスカウンタのRequest Queueのみが一方的に増加していくような状況になってしまいます。
CPUがほぼ100%処理しつつ、かつ処理しきれない分のリクエストがQueueに積まれているのであれば理解できるのですが、なぜCPUがまったく使われないかが理解できておりません。
サービス運用としては、複数台のサーバーを水平分散しているのですが、アクセス数が増えると上のような状況が発生しCPU使用率が上がらないままリクエストが処理できなくなってしまうため、監視しづらいという状況になっております。
また、同じ程度の量の負荷をWebサイト1を経由せずに直接Webサイト2にかけると、こちらの想定通り、CPU使用率が100%近くになり、さばききれない分のリクエストがエラーになります。リバースプロキシ経由との挙動の違いについても理解できずにいます。
同時接続数が増えた際に、なぜCPUを使わずにQueueに積まれていく状況になるのかの理由、もしくはその対策をご存知の方、教えていただけないでしょうか。