Назад | Перейти на главную страницу

MySQL думает, что außer равно пользователю

Я попытался перенести некоторые таблицы из одной базы данных MySQL в другую, но обнаружил ошибку:

ERROR 1062 (23000) at line 108: Duplicate entry 'außer' for key 'PRIMARY'

И я попытался выяснить, почему в целевой базе данных я запустил

mysql> select 'außer' = 'auser';
+--------------------+
| 'außer' = 'auser'  |
+--------------------+
|                  1 |
+--------------------+
1 row in set (0.07 sec)

Как видите, MySQL считает, что они оба одинаковы, и я проверил переменные конфигурации

mysql> show variables like 'coll%';
+----------------------+-----------------+
| Variable_name        | Value           |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database   | utf8_general_ci |
| collation_server     | utf8_general_ci |
+----------------------+-----------------+

mysql> show variables like 'character%';
+--------------------------+------------------------------------------+
| Variable_name            | Value                                    |
+--------------------------+------------------------------------------+
| character_set_client     | utf8                                     |
| character_set_connection | utf8                                     |
| character_set_database   | utf8                                     |
| character_set_filesystem | binary                                   |
| character_set_results    | utf8                                     |
| character_set_server     | utf8                                     |
| character_set_system     | utf8                                     |
| character_sets_dir       | /rdsdbbin/mysql-5.5.8.R1/share/charsets/ |
+--------------------------+------------------------------------------+

Затем я возвращаюсь к исходной базе данных и пытаюсь

mysql> select 'außer' = 'auser';
+--------------------+
| 'außer' = 'auser'  |
+--------------------+
|                  0 |
+--------------------+
1 row in set (0.00 sec)

mysql> show variables like 'coll%';
+----------------------+-----------------+
| Variable_name        | Value           |
+----------------------+-----------------+
| collation_connection | utf8_general_ci |
| collation_database   | utf8_general_ci |
| collation_server     | utf8_general_ci |
+----------------------+-----------------+
3 rows in set (0.00 sec)

mysql> show variables like 'haracter%';
Empty set (0.00 sec)

mysql> show variables like 'character%';
+--------------------------+----------------------------+
| Variable_name            | Value                      |
+--------------------------+----------------------------+
| character_set_client     | utf8                       |
| character_set_connection | utf8                       |
| character_set_database   | utf8                       |
| character_set_filesystem | binary                     |
| character_set_results    | utf8                       |
| character_set_server     | utf8                       |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
8 rows in set (0.00 sec)

Исходная версия MySQL 5.0.77, а целью миграции является 5.5.8. Понятия не имею, как это могло случиться. Почему они по-разному сравнивают строку? Как я могу решить эту проблему? Спасибо.

Как указано в http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-sets.html это кажется правильным поведением:

utf8_general_ci также подходит как для немецкого, так и для французского языков, за исключением того, что «ß» равно «s», а не «ss». Если это приемлемо для вашего приложения, вы должны использовать utf8_general_ci, потому что это быстрее. В противном случае используйте utf8_unicode_ci, потому что это более точно.