Но это работает неправильно. Как называются эти %3A и %2F форматы и как мне их преобразовать?
Переведено автоматически
Ответ 1
Это не имеет никакого отношения к кодировкам символов, таким как UTF-8 или ASCII. Строка, которая у вас есть, имеет кодировку URL. Этот вид кодирования полностью отличается от кодировки символов.
Попробуйте что-то вроде этого:
try { Stringresult= java.net.URLDecoder.decode(url, StandardCharsets.UTF_8.name()); } catch (UnsupportedEncodingException e) { // not going to happen - value came from JDK's own StandardCharsets }
Java 10 добавила прямую поддержку Charset в API, что означает отсутствие необходимости перехватывать исключение UnsupportedEncodingException:
Обратите внимание, что кодировка символов (например, UTF-8 или ASCII) определяет преобразование символов в необработанные байты. Подробное введение в кодировки символов смотрите в этой статье.
Ответ 2
Полученная вами строка находится в application/x-www-form-urlencoded кодировке.
Используйте URLDecoder, чтобы преобразовать его в строку Java.
URLDecoder.decode( url, "UTF-8" );
Ответ 3
На этот вопрос уже был дан ответ раньше (хотя этот вопрос был первым!):
"Вы должны использовать java.net.URI для этого, поскольку класс URLDecoder выполняет декодирование x-www-form-urlencoded, что неверно (несмотря на название, оно предназначено для данных формы)."
Рекомендуемый способ управления кодированием и декодированием URL-адресов - использовать URI и выполнять преобразование между этими двумя классами с помощью toURI() и URI.toURL().
Классы URLEncoder и URLDecoder также могут использоваться, но только для кодирования формы HTML, что отличается от схемы кодирования, определенной в RFC2396.