Вопрос-ответ

How to do URL decoding in Java?

Как выполнить декодирование URL-адресов в Java?

В Java я хочу преобразовать это:

https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do%3Frequest_type

К этому:

https://mywebsite/docs/english/site/mybook.do&request_type

Это то, что у меня есть на данный момент:

class StringUTF 
{
public static void main(String[] args)
{
try{
String url =
"https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do" +
"%3Frequest_type%3D%26type%3Dprivate";

System.out.println(url+"Hello World!------->" +
new String(url.getBytes("UTF-8"),"ASCII"));
}
catch(Exception E){
}
}
}

Но это работает неправильно. Как называются эти %3A и %2F форматы и как мне их преобразовать?

Переведено автоматически
Ответ 1

Это не имеет никакого отношения к кодировкам символов, таким как UTF-8 или ASCII. Строка, которая у вас есть, имеет кодировку URL. Этот вид кодирования полностью отличается от кодировки символов.

Попробуйте что-то вроде этого:

try {
String result = java.net.URLDecoder.decode(url, StandardCharsets.UTF_8.name());
} catch (UnsupportedEncodingException e) {
// not going to happen - value came from JDK's own StandardCharsets
}

Java 10 добавила прямую поддержку Charset в API, что означает отсутствие необходимости перехватывать исключение UnsupportedEncodingException:

String result = java.net.URLDecoder.decode(url, StandardCharsets.UTF_8);

Обратите внимание, что кодировка символов (например, UTF-8 или ASCII) определяет преобразование символов в необработанные байты. Подробное введение в кодировки символов смотрите в этой статье.

Ответ 2

Полученная вами строка находится в application/x-www-form-urlencoded кодировке.

Используйте URLDecoder, чтобы преобразовать его в строку Java.

URLDecoder.decode( url, "UTF-8" );
Ответ 3

На этот вопрос уже был дан ответ раньше (хотя этот вопрос был первым!):


"Вы должны использовать java.net.URI для этого, поскольку класс URLDecoder выполняет декодирование x-www-form-urlencoded, что неверно (несмотря на название, оно предназначено для данных формы)."


Как указано в документации по классу URL:


Рекомендуемый способ управления кодированием и декодированием URL-адресов - использовать URI и выполнять преобразование между этими двумя классами с помощью toURI() и URI.toURL().


Классы URLEncoder и URLDecoder также могут использоваться, но только для кодирования формы HTML, что отличается от схемы кодирования, определенной в RFC2396.


В основном:

String url = "https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do%3Frequest_type";
System.out.println(new java.net.URI(url).getPath());

даст вам:

https://mywebsite/docs/english/site/mybook.do?request_type
Ответ 4

%3A и %2F являются символами в кодировке URL. Используйте этот Java-код для преобразования их обратно в : и /

String decoded = java.net.URLDecoder.decode(url, "UTF-8");
java