Есть ли какой-либо стандартизированный или широко используемый метод для извлечения чего-то вроде «имени хоста верхнего уровня» из URL-адреса?
Например, для http://images.google.com
я хотел бы иметь google.com
(даже если images.
подключает другой сервер как http://google.com
будет), тогда как http://www.amazon.co.uk
должен дать amazon.co.uk
.
Поэтому мне нравится получать имя хоста с удаленным поддоменом.
Mozilla ведет составленный список ограничений домена второго уровня.
Описание: http://publicsuffix.org/learn/
Список: http://mxr.mozilla.org/mozilla-central/source/netwerk/test/unit/data/test_psl.txt?raw=1
Этот список может быть проанализирован, и полученные правила могут использоваться для определения того, является ли домен второго уровня ограниченным, и, таким образом, имя хоста включает домен третьего уровня.