Si bien no estoy seguro de qué desencadena específicamente el problema (parece que una conexión abierta de alguna manera puede terminar en un estado roto en el lado del clúster RDS), parece que el problema se ve agravado por la agrupación agresiva de conexiones y la reutilización en el lado del cliente ocurre en MySQL .NET Connector.
Una vez que ocurre el problema, las conexiones afectadas parecen permanecer en el grupo, se recuperan arbitrariamente del grupo y se reutilizan una y otra vez. (Muy probablemente relacionado con la forma en que ve que el problema continúa ocurriendo aleatoriamente una vez que ha comenzado).
Agregar Connection Lifetime=x
a la cadena de conexión, siendo x el tiempo en segundos que una conexión se mantiene activa para su reutilización, parece que al menos reduce los síntomas.