Я попытался перенести некоторые таблицы из одной базы данных MySQL в другую, но обнаружил ошибку:
ERROR 1062 (23000) at line 108: Duplicate entry 'außer' for key 'PRIMARY'
И я попытался выяснить, почему в целевой базе данных я запустил
mysql> select 'außer' = 'auser';
+--------------------+
| 'außer' = 'auser' |
+--------------------+
| 1 |
+--------------------+
1 row in set (0.07 sec)
Как видите, MySQL считает, что они оба одинаковы, и я проверил переменные конфигурации
mysql> show variables like 'coll%';
+----------------------+-----------------+
| Variable_name | Value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+----------------------+-----------------+
mysql> show variables like 'character%';
+--------------------------+------------------------------------------+
| Variable_name | Value |
+--------------------------+------------------------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /rdsdbbin/mysql-5.5.8.R1/share/charsets/ |
+--------------------------+------------------------------------------+
Затем я возвращаюсь к исходной базе данных и пытаюсь
mysql> select 'außer' = 'auser';
+--------------------+
| 'außer' = 'auser' |
+--------------------+
| 0 |
+--------------------+
1 row in set (0.00 sec)
mysql> show variables like 'coll%';
+----------------------+-----------------+
| Variable_name | Value |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database | utf8_general_ci |
| collation_server | utf8_general_ci |
+----------------------+-----------------+
3 rows in set (0.00 sec)
mysql> show variables like 'haracter%';
Empty set (0.00 sec)
mysql> show variables like 'character%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)
Исходная версия MySQL 5.0.77, а целью миграции является 5.5.8. Понятия не имею, как это могло случиться. Почему они по-разному сравнивают строку? Как я могу решить эту проблему? Спасибо.
Как указано в http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-sets.html это кажется правильным поведением:
utf8_general_ci также подходит как для немецкого, так и для французского языков, за исключением того, что «ß» равно «s», а не «ss». Если это приемлемо для вашего приложения, вы должны использовать utf8_general_ci, потому что это быстрее. В противном случае используйте utf8_unicode_ci, потому что это более точно.