\xEF\xBF\xBD
es la codificación UTF-8 para el carácter Unicode U+FFFD
. Este es un carácter especial, también conocido como el "carácter de reemplazo". Una cita de la página de wikipedia sobre los caracteres especiales Unicode
:
Entonces parece que su fuente de datos contiene datos corruptos. También es posible que intente leer los datos usando una codificación incorrecta. ¿De dónde vienen las líneas?
Si no puede corregir los datos y su entrada contiene caracteres no válidos, simplemente puede eliminar los caracteres de reemplazo:
lines[n] = lines[n].Replace("\xFFFD", "");