Después de muchas pruebas (y de desactivar StopList, que impidió indexar las cadenas de solo números enteros, lo que hizo el autor del artículo vinculado) parece que indexa cada cadena delimitada por un espacio, incluidos los números enteros. Creo que las palabras que realmente están indexadas van en el catálogo usando información sobre la fila, la columna y el tipo de celda dentro de esa columna, o posición, más bien.
Todo en esa tabla completa obtiene un índice relacional, siempre que esté delimitado por espacios.