У меня очень быстрый вопрос относительно греческих имен хостов с учетом регистра. Например, если бы я хотел зарегистрировать имя хоста, используя греческую букву омега Ω, например: ΩΩΩΩ.com, на самом деле это выглядело бы как версия в нижнем регистре: ωωωω.com.
В английском языке, конечно, это также верно, где, например, E превратилось бы в e. Это не проблема, если его следует читать как язык, но если цель этого состоит в том, чтобы использовать омега в качестве символа «Ω» в имени хоста, а не буквы, то это проблематично.
Есть ли способ обойти это, чтобы сохранить заглавную букву? Существуют ли сайты регистрации доменов, которые предлагают этот тип услуг?
Нет, и это сделано намеренно. Символы верхнего регистра фактически полностью запрещены новым стандартом и были преобразованы в нижний регистр старым.
Из IDN FAQ:
В: Чем IDNA2008 отличается от IDNA2003?
A: Он запрещает использовать около восьми тысяч символов, которые раньше были действительными, включая все символы верхнего регистра, варианты полной / половинной ширины, символы и знаки препинания. Он также по-разному интерпретирует четыре символа.
Вопрос: Почему IDNA2003 сопоставляет конечную сигму (ς) с сигмой (σ), отображает eszett (ß) в «ss» и удаляет ZWJ / ZWNJ?
О: Это решение о сопоставлении этих символов было принято в соответствии с рекомендациями стандарта Unicode по сопоставлению без учета регистра. Эти символы являются аномальными: верхний регистр ς - это Σ, то же самое, что и верхний регистр σ. Обратите внимание, что текст «ΒόλοΣ.com», который появляется на http: //Βόλος.com, иллюстрирует это: нормальное отображение Σ - это σ. Если бы σ и ς не рассматривались как варианты регистра в Unicode, не было бы совпадения между ΒόλοΣ и Βόλος.
Стандарты Интернета (запрос комментариев) для протоколов требуют, чтобы метки имен хостов компонентов могли содержать только буквы ASCII от «a» до «z» (без учета регистра), цифры от «0» до «9» и дефис. ('-'). Исходная спецификация имен хостов в RFC 952 требовала, чтобы метки не могли начинаться с цифры или дефиса и не должны заканчиваться дефисом. Однако последующая спецификация (RFC 1123) разрешила имена хостов начинаться с цифр. Никакие другие символы, знаки препинания или пробелы не допускаются.
Имя хоста нечувствительно к регистру.