En ocasiones necesitamos obtener el código fuente de una página web. Varios ejemplos de uso podrían ser:
- Visualizar el código fuente en nuestra aplicación.
- Seguir enlaces de una URL para comprobar que no hay enlaces rotos.
- Guardar en disco todas las páginas de un website automáticamente.
Un breve código de ejemplo de una clase que recibe un String con la URL a leer y devuelve un String con el código fuente:
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.MalformedURLException; import java.net.URL; public class UrlToString { public UrlToString(){}; public String getUrlString(String url) { URL miURL = null; InputStreamReader isReader = null; BufferedReader bReader = null; String lineaURL; StringBuffer buffer = new StringBuffer(); try { miURL = new URL(url); isReader = new InputStreamReader(miURL.openStream()); bReader = new BufferedReader(isReader); while ((lineaURL = bReader.readLine()) != null){ buffer.append(lineaURL); } bReader.close(); isReader.close(); } catch (MalformedURLException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } return buffer.toString(); } }