utf8_turkish_ci
y utf8_romanian_ci
-- como se muestra en http://mysql.rjweb.org/utf8_collations.html
(Además, por supuesto, utf8_bin
.)
Para su pregunta adicional:está buscando un "conjunto de caracteres" (no una "intercalación") que pueda representar Emoji y otros caracteres no latinos:UTF-8
es el que hay que usar. En MySQL, es utf8mb4
. Las "intercalaciones" asociadas con eso se denominan utf8mb4_...
. Las intercalaciones controlan el orden y la igualdad, como se indica en la primera parte de su pregunta sobre s
y ş
.
CHARACTER SET utf8
de MySQL es un subconjunto de utf8mb4
. Cualquiera de los dos puede manejar todas las "letras" del mundo. Pero solo utf8mb4 puede manejar emoji y algunos caracteres chinos.