Obiettivi
- Comprendere il concetto di codifica delle informazioni testuali.
- Conoscere i principali sistemi di codifica per rappresentare il testo nei computer.
- Capire l'importanza della standardizzazione della codifica.
Tempo di apprendimento
Apprendimento in: 2 ore
Contenuti
1. Cos’è la Codifica del Testo?
Quando scriviamo un testo al computer, le informazioni che inseriamo (lettere, numeri, simboli) devono essere rappresentate digitalmente affinché possano essere elaborate e memorizzate. Il computer lavora con numeri binari (0 e 1), quindi ogni carattere deve essere convertito in una sequenza di bit.
La codifica del testo è un sistema che associa a ogni simbolo (lettera, cifra, punteggiatura) un numero che può essere rappresentato nel sistema binario.
2. Il Sistema ASCII: La Base della Codifica
Uno dei primi sistemi di codifica del testo è stato l’ASCII (American Standard Code for Information Interchange).
- Caratteristiche principali:
- ASCII utilizza 7 bit per codificare ogni carattere.
- Può rappresentare fino a 128 caratteri, sufficienti per codificare le lettere dell’alfabeto inglese, i numeri, i segni di punteggiatura e alcuni simboli di controllo (come l’inizio o la fine di un messaggio).
- Ad esempio:
- La lettera “A” è rappresentata dal numero 65 (in binario: 1000001).
- La lettera “a” è rappresentata dal numero 97 (in binario: 1100001).
3. Estensione dell’ASCII: Il Codice a 8 bit
Per codificare più simboli e caratteri (ad esempio caratteri speciali e lettere di alfabeti diversi), l’ASCII è stato esteso a 8 bit, creando la tabella estesa, che supporta fino a 256 caratteri.
4. UNICODE: La Codifica Universale
Con la globalizzazione e la necessità di rappresentare i testi in tutte le lingue del mondo, l’ASCII è diventato insufficiente. È stato quindi introdotto Unicode, un sistema di codifica che può rappresentare praticamente qualsiasi carattere utilizzato in qualsiasi lingua.
- Caratteristiche principali:
- Utilizza un numero variabile di bit (da 8 a 32 bit) per codificare ogni carattere.
- Il set Unicode include oltre 1 milione di caratteri, tra cui simboli di alfabeti, segni di punteggiatura, emoji, ecc.
- Il formato più comune di Unicode è l’UTF-8, che utilizza da 1 a 4 byte per carattere e mantiene la compatibilità con ASCII.
Esempio:
- La lettera “A” rimane codificata come 65, come in ASCII.
- Un carattere cinese come “你” è codificato da Unicode con il numero 20320 (in binario: 100111110010000), che in UTF-8 viene codificato in tre byte.
5. Perché è Importante la Codifica del Testo?
- Compatibilità: Grazie ai sistemi standard come ASCII e Unicode, computer diversi possono scambiarsi testi senza errori.
- Rappresentazione multilingue: Unicode permette la corretta visualizzazione di testi scritti in lingue diverse, inclusi caratteri speciali e simboli.
- Efficienza: Utilizzando sistemi come UTF-8, i testi possono essere memorizzati in modo efficiente, occupando meno spazio possibile.
6. Conclusioni
La codifica del testo è fondamentale per il funzionamento di qualsiasi sistema informatico. I principali sistemi di codifica, come ASCII e Unicode, consentono ai computer di interpretare correttamente i testi in diverse lingue e simboli. Conoscere questi concetti permette di comprendere come i computer gestiscono le informazioni testuali e quanto sia importante avere standard condivisi.
Dopo aver letto la scheda, rispondi alle domande di verifica.
Approfondimenti:
Esercizio: Cerca di scoprire come viene codificata la tua iniziale nel sistema ASCII e in Unicode.
Ricerca: Indaga come i caratteri speciali come emoji e simboli matematici vengono rappresentati in Unicode.
Cos'è la codifica ASCII?
Qual è la differenza principale tra ASCII e Unicode?
Perché è stato necessario introdurre Unicode?