Я хотел бы передать URL-адрес с помощью curl, но символы с диакритическими знаками зашифрованы. Вот что я получаю:
Bulletin cÙtier pour la bande des 20 milles de Port Camargue ‡ Saint<br>
Raphael le mardi 27 septembre 2011 ‡ 11:30 lÈgales.<br>
Это то, что должно быть
Bulletin côtier pour la bande des 20 milles de Port Camargue à Saint
Raphael le mardi 27 septembre 2011 à 11:30 légales.
Я также заметил, что html файл не содержит указания кодировки в заголовке:
<html>
<head>
<title>METEO-FRANCE</title>
<META http-equiv="pragma" content="no-cache">
<META http-equiv="expires" content="Thu, 12 Jul 2001 10:09:34 GMT">
</head>
Что я могу сделать, чтобы восстановить текст с правильными символами?
Curl просто загружает запрошенную последовательность битов как есть. Это ваш терминал не обрабатывает кодировку. Используйте редактор или программу просмотра текста, которая обрабатывает исходную кодировку символов или кодирует / декодирует ее, чтобы адаптировать ее к вашим потребностям.