URL

Un URL (Uniform Resource Locator) è un formato di denominazione universale che definisce una risorsa su internet.

Che cos'è un URL

Un URL si articola in una stringa di caratteri ASCII stampabili che si scompone in cinque parti:

Il nome del protocollo, cioè il linguaggio usato per comunicare sulla rete. Il protocollo più diffuso è il protocollo HTTP (HyperText Transfer Protocol), il protocollo che permette di scambiare delle pagine web di formato HTML. Tuttavia si possono usare numerosi altri protocolli (FTP,News,Mailto,Gopher);

ID e password, permettono di specificare i parametri di accesso ad un server sicuro. Questa opzione è sconsigliata dato che la password è visibile nell'URL, il nome del server, si tratta di un nome di dominio del computer che ospita la risorsa richiesta. Da notare che è possibile usare l'indirizzo IP del server, rendendo però l'URL meno leggibile.

Il numero della porta, si tratta di un numero associato ad un servizio che consente al server di sapere quale tipo di risorsa è richiesta. La porta associata per default al protocollo è la numero 80. Così, quando il servizio web del server è associato al numero di porta 80, il numero di porta è facoltativo;

Il percorso di accesso alla risorsa, questa permette al server di conoscere la posizione della risorsa, cioè in maniera generale la posizione (cartella) e il nome del file richiesto. Un URL ha quindi la struttura seguente:

Protocollo Password (facoltativa) Nome del server Porta (facoltativa se 80) Percorso
[http://] user:password@ it.kioskea.net :80 /glossair/glossair.php3

I protocolli seguenti possono ad esempio essere usate nell'URL:

HTTP, per la consultazione di pagine web;

FTP, per la consultazione di siti FTP;

Telnet, per la connessione a un terminale remoto;

Mailto, per l'invio di posta elettronica;

Wais URL;

Gopher.

Il nome del file nell'URL può essere seguito da un punto interrogativo poi da dati in formato ASCII, si tratta di dati supplementari inviati in parametri di un'applicazione sul server (uno script CGI ad esempio). L'URL assomiglierà allora a una stringa di caratteri come questa:

 https://it.ccm.net/forum/?page=2

La codifica di un URl

Dato che l'URL è un mezzo per inviare delle informazioni attraverso internet (per inviare dei dati a uno script CGI ad esempio), è necessario poter inviare dei carattere speciali, ma gli URL non possono contenere dei caratteri speciali. Inoltre, alcuni caratteri sono riservati dato che hanno un significato (lo slash permette di specificare una sotto-cartella, i caratteri & e ? servono ad inviare dei dati di modulo, ecc.). Infine gli URL possono essere inclusi in un documento HTML, cosa che rende difficile l'inserimento di caratteri come < o > nell'URL.

La codifica consiste nel sostituire i caratteri speciali con il carattere % (che diventa a sua volta un carattere speciale) seguito dal ASCII del carattere da codificare in notazione esadecimale.

Ecco la lista dei caratteri che necessitano di una codifica particolare:

Carattere Codifica URL
Tabulazione %09
Spazio %20
" %22
# %23
% %25
& %26
( %28
) %29
+ %2B
, %2C
. %2E
/ %2F
: %3A
; %3B
< %3C
= %3D
> %3E
? %3F
@ %40
[ %5B
\ %5C
] %5D
^ %5E
' %60
{ %7B
%7C
} %7D
~ %7E

Ulteriori informazioni

Il formato degli URL è definito dalla RFC 1738: RFC 1738.

Foto: © Pixabay.

I nostri contenuti sono creati in collaborazione con esperti di high-tech, sotto la direzione di Jean-François Pillou, fondatore di CCM.net. CCM è un sito di high-tech leader a livello internazionale ed è disponibile in 11 lingue.
Il documento intitolato « URL » dal sito CCM (it.ccm.net) è reso disponibile sotto i termini della licenza Creative Commons. È possibile copiare, modificare delle copie di questa pagina, nelle condizioni previste dalla licenza, finché questa nota appaia chiaramente.