Leer el código fuente de una URL (Java)

En ocasiones necesitamos obtener el código fuente de una página web. Varios ejemplos de uso podrían ser:

  • Visualizar el código fuente en nuestra aplicación.
  • Seguir enlaces de una URL para comprobar que no hay enlaces rotos.
  • Guardar en disco todas las páginas de un website automáticamente.

Un breve código de ejemplo de una clase que recibe un String con la URL a leer y devuelve un String con el código fuente: 

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;

public class UrlToString {
  public UrlToString(){};

  public String getUrlString(String url)
  {
    URL miURL = null;
    InputStreamReader isReader = null;
    BufferedReader bReader = null;
    String lineaURL;
    StringBuffer buffer = new StringBuffer();

    try {
      miURL = new URL(url);
      isReader = new InputStreamReader(miURL.openStream());
      bReader = new BufferedReader(isReader);
      while ((lineaURL = bReader.readLine()) != null){
        buffer.append(lineaURL);
      }
      bReader.close();
      isReader.close();
    } catch (MalformedURLException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    }

    return buffer.toString();
  }
}
Sin categoría

Deja una respuesta