Un file è una serie di informazioni binarie, cioè una serie di 0 e di 1. Questo file può essere stoccato per mantenere una traccia di queste informazioni. Un file di testo è un file composto da alcuni caratteri stoccati sotto forma di bytes. Questo file è salvato sul disco rigido sotto la forma "nome_del_file.ext".
L'estensione .ext è un mezzo per riconoscere il tipo di programma con cui il file può essere aperto. Questo non garantisce il tipo di file perché quando si carica l'estensione non si cambia tipologia di file). La lunghezza del nome e dell'estensione può variare secondo il sistema operativo:
8 caratteri per il nome e 3 per l'estensione su DOS e Windows 3.1;
256 caratteri per il nome e l'estensione su Windows 95, 98 e NT;
256 sui sistemi Unix.
Quindi, su DOS o Windows 3.1, un file proveniente da Windows 9x avrà un nome troncato con i primi 6 caratteri del nome seguiti da ~x dove x rappresenta una cifra che è incrementata ogni volta che un file avrà lo stesso nome. Cioè se già esiste un file chiamato "file~1" il successivo si chiamerà "file~2". Inoltre, un file contiene un'intestazione che permette di stoccare delle informazioni supplementari, come il tipo di file e soprattutto la dimensione. Esso contiene anche un carattere finale del file che segnala che le informazioni poste dopo questo carattere non fanno più parte dello stesso file. Vi state chiedendo perché mettere nell'intestazione del file la sua dimensione visto che la si conosce? Ecco due esempi che vi dimostreranno la sua utilità.
Vi sarà sicuramente già capitato di scaricare un file da internet e il navigatore si sia bloccato oppure il server di hosting del file interrompa la comunicazione. Se il file è un file di testo, vi mancherà solo la fine del testo, invece se si tratta di un file binario (un programma eseguibile ad esempio) la sua esecuzione potrebbe essere pericolosa data la mancanza di informazioni. Il sistema operativo paragona quindi la sua dimensione reale alla dimensione indicata nell'intestazione per verificare la validità del file. Si parla generalmente di integrità. In realtà questo controllo è realizzato attraverso un algoritmo più performante detto CRC (controllo di ridondanza ciclica).
Quando un file è infettato da un virus, quest'ultimo aggiunge delle stringhe di codice. Così, l'informazione che riguarda la dimensione del file posta nell'intestazione non corrisponderà più (a meno che il virus non sia programmato in modo da modificare l'intestazione) e potrà essere individuato.
Foto: © Pixabay.