URL

Luglio 2015

Che cos'è un URL?


Un URL (Uniform Resource Locator) è un formato di denominazione universale per designare una risorsa su internet. Si tratta di una stringa di caratteri ASCII stampabili che si scompone in cinque parti :
  • Il nome del protocollo : cioè in un certo senso il linguaggio usato per comunicare sulla rete. Il protocollo più diffuso è il protocollo HTTP (HyperText Transfer Protocol), il protocollo che permette di scambiare delle pagine Web di formato HTML. Tuttavia si possono usare numerosi altri protocolli (FTP,News,Mailto,Gopher,...)
  • ID e password : permettono di specificare i parametri di accesso ad un server sicuro. Questa opzione è sconsigliata dato che la password è visibile nell'URL
  • Il nome del server : si tratta di un nome di dominio del computer che ospita la risorsa richiesta. Da notare che è possibile usare l'indirizzo IP del server, rendendo però l'URL meno leggibile.
  • Il numero della porta : si tratta di un numero associato ad un servizio che permette al server di sapere quale tipo di risorsa è richiesta. La porta associata per default al protocollo è la numero 80. Così, quando il servizio Web del server è associato al numero di porta 80, il numero di porta è facoltativo.
  • Il percorso di accesso alla risorsa : quest'ultima parte permette al server di conoscere la posizione della risorsa, cioè in maniera generale la posizione (cartella) e il nome del file richiesto



Un URL ha quindi la struttura seguente :

ProtocolloPassword (facoltativa)Nome del serverPorta (facoltativa se 80)Percorso
http://user:password@it.kioskea.net:80/glossair/glossair.php3


I protocolli seguenti possono ad esempio essere usate nell'URL :
  • http, per la consultazione di pagine web
  • ftp, per la consultazione di siti FTP
  • telnet, per la connessione a un terminale remoto
  • mailto, per l'invio di posta elettronica
  • wais
  • gopher


Il nome del file nell'URL può essere seguito da un punto interrogativo poi da dati in formato ASCII, si tratta di dati supplementari inviati in parametri di un'applicazione sul server (uno script CGI ad esempio). L'URL assomiglierà allora a una stringa di caratteri come questa :
 http://it.kioskea.net/forum/index.php3?cat=1&page=2 

La codifica di un URl


Dato che l'URL è un mezzo per inviare delle informazioni attraverso internet (per inviare dei dati a uno script CGI ad esempio), è necessario poter inviare dei carattere speciali, ma gli URL non possono contenere dei caratteri speciali. Inoltre, alcuni caratteri sono riservati dato che hanno un significato (lo slash permette di specificare una sotto-cartella, i caratteri & e ? servono ad inviare dei dati di modulo...). Infine gli URL possono essere inclusi in un documento HTML, cosa che rende difficile l'inserimento di caratteri come < o > nell'URL.

Ecco perché una codifica è necessaria! La codifica consiste nel sostituire i caratteri speciali con il carattere % (che diventa a sua volta un carattere speciale) seguito dal codice ASCII del carattere da codificare in notazione esadecimale.

Ecco la lista dei caratteri che necessitano di una codifica particolare :

CarattereCodifica URL
Tabulazione%09
Spazio%20
"%22
#%23
%%25
&%26
(%28
)%29
+%2B
,%2C
.%2E
/%2F
:%3A
;%3B
<%3C
=%3D
>%3E
?%3F
@%40
[%5B
\%5C
]%5D
^%5E
'%60
{%7B
%7C
}%7D
~%7E

Ulteriori informazioni


Il formato degli URL è definito dalla RFC 1738 :
Per poter consultare questo documento offline, ne potete scaricare gratuitamente una versione in formato PDF:
Url .pdf

Vedi anche


URL
URL
URL
URL
URL
URL
URL
URL
URL
URL
Il documento intitolato « URL » da CCM (it.ccm.net) è reso disponibile sotto i termini della licenza Creative Commons. È possibile copiare, modificare delle copie di questa pagina, nelle condizioni previste dalla licenza, finché questa nota appaia chiaramente.