La colección es la menor de tus preocupaciones, en lo que debes pensar es en el conjunto de personajes para la columna/tabla/base de datos. La intercalación (reglas que rigen cómo se comparan los datos y ordenado ) es solo un corolario de eso.
MySQL admite varios juegos de caracteres Unicode, utf8
y utf8mb4
siendo el más interesante. utf8
admite caracteres Unicode en el BMP
, es decir, un subconjunto de todo Unicode. utf8mb4
, disponible desde MySQL 5.5.3, admite todos de Unicode.
La colección lo más probable es que se use con cualquiera de las codificaciones Unicode xxx_general_ci
o xxx_unicode_ci
. El primero es un algoritmo general de clasificación y comparación independiente del idioma, el segundo es un más completo algoritmo independiente del idioma que admite más funciones Unicode (por ejemplo, tratar "ß" y "ss" como equivalentes), pero por lo tanto también es más lento.
Consulte https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .