Una tarea muy habitual en PHP es comprobar si un archivo o una URL existe. En este tutorial vamos a ver como hacerlo, diferentes alternativas y sus peculiaridades para que puedas elegir la mejor en cada caso.

Comprobar un archivo: is_file y file_exists

is_file y file_exists son dos funciones nativas de PHP que se pueden utilizar para verificar si un determinado archivo existe o no. Aunque sus nombre son bastante descriptivos, hay que saber que:

  • is_file devuelve true sólo si la ruta pasada a la función es efectivamente un archivo existente.
  • file_exists devuelve true tanto si la ruta pasada es un archivo como un directorio válido (utiliza is_dir si quieres comprobar específicamente si una ruta es un directorio pero no un archivo).

Esta diferencia es muy importante. Si tu objetivo son únicamente archivos y no directorios is_file es tu función. Si quieres comprobar un directorio o un archivo indiferentemente elige file_exists.

$file ='/home/misitio/public_html/directorio/archivo.php';
$directory ='/home/misitio/public_html/directorio/';

//Devuelve true
$exists = is_file( $file );
//Devuelve false
$exists = is_file( $directory );

//Devuelve true
$exists = file_exists( $file );
//Devuelve TRUE
$exists = file_exists( $directory );

Comprobar una URL: get_headers, file_get_contents y cURL

Para comprobar la existencia de una URL únicamente necesitamos tener acceso a las cabeceras de respuesta del servidor al que se le solicita la URL y comprobar que el código de respuesta sea del tipo 2xx (OK) o 3xx (reidrecciones, opcional); nunca un código 4xx o 5xx que son códigos de error. Para obtener las cabeceras basta con hacer una solicitud HTTP con el método HEAD, mucho más ligero que el método GET o el método POST.

La función file_get_contents admite una URL y es muy frecuentemente mencionada como método para comprobar si una URL existe o no. Sinceramente, creo que esta función sobrepasa lo necesario y es poco eficiente para este fin. No obstante, como es muy utilizada, os dejo un ejemplo “eficiente” del uso de file_get_contents para comprobar una URL; fíjate en que la solicitud HTTP se realiza mediante el método HEAD:

$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ) {
 
    if( empty( $url ) ){
        return false;
    }
 
    $options['http'] = array(
        'method' => "HEAD",
        'ignore_errors' => 1,
        'max_redirects' => 0
    );
    $body = @file_get_contents( $url, NULL, stream_context_create( $options ) );
    
    // Ver http://php.net/manual/es/reserved.variables.httpresponseheader.php
    if( isset( $http_response_header ) ) {
        sscanf( $http_response_header[0], 'HTTP/%*d.%*d %d', $httpcode );
 
        //Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
        $accepted_response = array( 200, 301, 302 );
        if( in_array( $httpcode, $accepted_response ) ) {
            return true;
        } else {
            return false;
        }
     } else {
         return false;
     }
}

Otra forma sería utilizando get_headers:

$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ) {

    if( empty( $url ) ){
        return false;
    }

    // get_headers() realiza una petición GET por defecto
    // cambiar el método predeterminadao a HEAD
    // Ver http://php.net/manual/es/function.get-headers.php
    stream_context_set_default(
        array(
            'http' => array(
                'method' => 'HEAD'
             )
        )
    );
    $headers = @get_headers( $url );
    sscanf( $headers[0], 'HTTP/%*d.%*d %d', $httpcode );

    //Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
    $accepted_response = array( 200, 301, 302 );
    if( in_array( $httpcode, $accepted_response ) ) {
        return true;
    } else {
        return false;
    }
}

Y por último el método idóneo desde mi punto de vista utilizando la biblioteca cURL (incluida en PHP desde 4.0.2). El código es un poco más largo pero permite controlar de forma granular las opciones de conexión y solicitud de la URL:

$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ) {

    if( empty( $url ) ){
        return false;
    }

    $ch = curl_init( $url );
 
    //Establecer un tiempo de espera
    curl_setopt( $ch, CURLOPT_TIMEOUT, 5 );
    curl_setopt( $ch, CURLOPT_CONNECTTIMEOUT, 5 );

    //establecer NOBODY en true para hacer una solicitud tipo HEAD
    curl_setopt( $ch, CURLOPT_NOBODY, true );
    //Permitir seguir redireccionamientos
    curl_setopt( $ch, CURLOPT_FOLLOWLOCATION, true );
    //recibir la respuesta como string, no output
    curl_setopt( $ch, CURLOPT_RETURNTRANSFER, true );

    $data = curl_exec( $ch );

    //Obtener el código de respuesta
    $httpcode = curl_getinfo( $ch, CURLINFO_HTTP_CODE );
    //cerrar conexión
    curl_close( $ch );

    //Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
    $accepted_response = array( 200, 301, 302 );
    if( in_array( $httpcode, $accepted_response ) ) {
        return true;
    } else {
        return false;
    }

}

Y si estás en WordPress, deberías utilizar la función wp_remote_head:

$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );

function url_exists( $url = NULL ){

    if( empty( $url ) ){
        return false;
    }

    $response = wp_remote_head( $url, array( 'timeout' => 5 ) );

    //Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
    $accepted_response = array( 200, 301, 302 );
    if( ! is_wp_error( $response ) && in_array( wp_remote_retrieve_response_code( $response ), $accepted_response ) ) { 
        return true;
    } else {
         return false;
    }

}

¿Algún método más o que consideres mejor?

  • Facundo

    Funciona excelente!

  • Rafael Calafell Cladera

    Utilizando la biblioteca cURL no funciona pues no está definido $handle

    • Cierto. Gracias por avisar, ya está corregido.

    • Rafael Calafell Cladera

      Y por si consideras apropiado una función de PHP que sirve tanto para ficheros como URL:

      function url_exists($url)
      {
      $handle = @fopen($url, “r”);
      if ($handle == false)
      return false;
      fclose($handle);
      return true;
      }

    • Interesante, pero me surgen dudas sobre rendimiento. Abrir un archivo debe ser más costoso que simplemente hacer un is_file() (digo “debe ser” porque no tengo datos, lo digo sólo por lógica).

      Y en el caso de URL, también para reducir los recursos empleados, habría que hacer una solicitud con el método HEAD ya que no es necesario nada más que las cabeceras de respuesta para saber si la URL existe o no. Con fopen() sería algo similar a lo que hago en el post con file_get_contents() (no tengo ni idea si funciona, sólo lo he escrito aquí):

      $options['http'] = array(
      'method' => 'HEAD',
      'ignore_errors' => 1,
      'max_redirects' => 0
      );
      fopen ( $url, "r", false , stream_context_create( $options ) );

      Ahora ya, si la intención va más allá de saber de la existencia, la petición mediante HEAD se queda corta.