In der Regel erfolgt die Auswertung von Datensätzen computergestützt. Deshalb ist es wichtig, dass Daten für diese Auswertung auch in einer passenden Form angelegt werden. Für die Auswertung mit einer Statistik-Software und um das Eingeben von Daten zu beschleunigen, werden Merkmale mit Kurzbezeichnungen versehen und die Ausprägungen codiert. Dieses Vorgehen wird als Datencodierung bezeichnet. Alle wichtigen Informationen zu der Datencodierung werden in einem Codeplan oder Codebuch festgehalten. Dabei gibt es verschiedene Arten von Codebüchern. Solche, die für die einfache, einheitliche Datenübertragung genutzt werden wie der ASCII und andere, die die Datenmenge reduzieren, also zu einer Datenkompression genutzt werden. Hierzu zählt der Huffman-Code.