Comprobar en PHP si existe un archivo o una URL PHP
Una tarea muy habitual en PHP es comprobar si un archivo o una URL existe. En este tutorial vamos a ver como hacerlo, diferentes alternativas y sus peculiaridades para que puedas elegir la mejor en cada caso.
Comprobar un archivo: is_file
y file_exists
is_file y file_exists son dos funciones nativas de PHP que se pueden utilizar para verificar si un determinado archivo existe o no. Aunque sus nombre son bastante descriptivos, hay que saber que:
is_file
devuelvetrue
sólo si la ruta pasada a la función es efectivamente un archivo existente.file_exists
devuelvetrue
tanto si la ruta pasada es un archivo como un directorio válido (utiliza is_dir si quieres comprobar específicamente si una ruta es un directorio pero no un archivo).
Esta diferencia es muy importante. Si tu objetivo son únicamente archivos y no directorios is_file
es tu función. Si quieres comprobar un directorio o un archivo indiferentemente elige file_exists
.
$file ='/home/misitio/public_html/directorio/archivo.php';
$directory ='/home/misitio/public_html/directorio/';
// Devuelve true
$exists = is_file( $file );
// Devuelve false
$exists = is_file( $directory );
// Devuelve true
$exists = file_exists( $file );
// Devuelve TRUE
$exists = file_exists( $directory );
Comprobar una URL: get_headers
, file_get_contents
y cURL
Para comprobar la existencia de una URL únicamente necesitamos tener acceso a las cabeceras de respuesta del servidor al que se le solicita la URL y comprobar que el código de respuesta sea del tipo 2xx (OK) o 3xx (reidrecciones, opcional); nunca un código 4xx o 5xx que son códigos de error. Para obtener las cabeceras basta con hacer una solicitud HTTP con el método HEAD, mucho más ligero que el método GET o el método POST.
La función file_get_contents admite una URL y es muy frecuentemente mencionada como método para comprobar si una URL existe o no. Sinceramente, creo que esta función sobrepasa lo necesario y es poco eficiente para este fin. No obstante, como es muy utilizada, os dejo un ejemplo «eficiente» del uso de file_get_contents
para comprobar una URL; fíjate en que la solicitud HTTP se realiza mediante el método HEAD:
$url = "https://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );
function url_exists( $url = NULL ) {
if( empty( $url ) ){
return false;
}
$options['http'] = array(
'method' => "HEAD",
'ignore_errors' => 1,
'max_redirects' => 0
);
$body = @file_get_contents( $url, NULL, stream_context_create( $options ) );
// Ver http://php.net/manual/es/reserved.variables.httpresponseheader.php
if( isset( $http_response_header ) ) {
sscanf( $http_response_header[0], 'HTTP/%*d.%*d %d', $httpcode );
// Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
$accepted_response = array( 200, 301, 302 );
if( in_array( $httpcode, $accepted_response ) ) {
return true;
} else {
return false;
}
} else {
return false;
}
}
Otra forma sería utilizando get_headers
:
$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );
function url_exists( $url = NULL ) {
if( empty( $url ) ){
return false;
}
// get_headers() realiza una petición GET por defecto,
// cambiar el método predeterminadao a HEAD
// Ver http://php.net/manual/es/function.get-headers.php
stream_context_set_default(
array(
'http' => array(
'method' => 'HEAD'
)
)
);
$headers = @get_headers( $url );
sscanf( $headers[0], 'HTTP/%*d.%*d %d', $httpcode );
// Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
$accepted_response = array( 200, 301, 302 );
if( in_array( $httpcode, $accepted_response ) ) {
return true;
} else {
return false;
}
}
Y por último el método idóneo desde mi punto de vista utilizando la biblioteca cURL (incluida en PHP desde 4.0.2). El código es un poco más largo pero permite controlar de forma granular las opciones de conexión y solicitud de la URL:
$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );
function url_exists( $url = NULL ) {
if( empty( $url ) ){
return false;
}
$ch = curl_init( $url );
// Establecer un tiempo de espera
curl_setopt( $ch, CURLOPT_TIMEOUT, 5 );
curl_setopt( $ch, CURLOPT_CONNECTTIMEOUT, 5 );
// Establecer NOBODY en true para hacer una solicitud tipo HEAD
curl_setopt( $ch, CURLOPT_NOBODY, true );
// Permitir seguir redireccionamientos
curl_setopt( $ch, CURLOPT_FOLLOWLOCATION, true );
// Recibir la respuesta como string, no output
curl_setopt( $ch, CURLOPT_RETURNTRANSFER, true );
// Descomentar si tu servidor requiere un user-agent, referrer u otra configuración específica
// $agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36';
// curl_setopt($ch, CURLOPT_USERAGENT, $agent)
$data = curl_exec( $ch );
// Obtener el código de respuesta
$httpcode = curl_getinfo( $ch, CURLINFO_HTTP_CODE );
//cerrar conexión
curl_close( $ch );
// Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
$accepted_response = array( 200, 301, 302 );
if( in_array( $httpcode, $accepted_response ) ) {
return true;
} else {
return false;
}
}
Y si estás en WordPress, deberías utilizar la función wp_remote_head:
$url = "http://ejemplo.com/una-url-a-comprobar";
$urlexists = url_exists( $url );
function url_exists( $url = NULL ){
if( empty( $url ) ){
return false;
}
$response = wp_remote_head( $url, array( 'timeout' => 5 ) );
// Aceptar solo respuesta 200 (Ok), 301 (redirección permanente) o 302 (redirección temporal)
$accepted_response = array( 200, 301, 302 );
if( ! is_wp_error( $response ) && in_array( wp_remote_retrieve_response_code( $response ), $accepted_response ) ) {
return true;
} else {
return false;
}
}
¿Algún método más o que consideres mejor?