
Allel-Häufigkeits-Tabellen enthalten populations-abhängige Informationen darüber, wie oft jedes Allel an einem bestimmten DNA-Marker vorkommt. Diese Informationen können aus Textdateien (ASCII) gelesen werden, in denen die Allel-Häufigkeiten für jeden DNA-Marker auf zwei Zeilen verteilt sind. In der oberen Zeile stehen die Allel-Bezeichnungen, in der unteren die Häufigkeitswerte. Diese Dateien können infolge des Kopierens und Einfügens in und aus Excel auch ungültige Allel-Bezeichnungen enthalten. Oft werden Allel-Bezeichnungen von Excel automatisch in ein Datum umgewandelt, z.B. 07.07.2002 (ursprünglich 7/7.2, d.h. Allel 7 und 7.2) oder 15.Feb (ursprünglich 15.2). In dieser Form können die Informationen nicht in der Datenbank gespeichert werden, sondern müssen erst aufbereitet werden. Monate (Jan, Feb, Mrz) und Datumsangaben werden von SampleCheck durch Zahlen ersetzt. Es kommt auch vor, dass mehrere Allele zusammengefasst sind und nur einen gemeinsamen Häufigkeitswert haben. Bezeichnungen wie >20 (Allele größer als 20) werden von SampleCheck in zwei Allele aufgeteilt. Kombinierte Allele wie 7/7.2 werden ebenfalls in mehrere Allele aufgeteilt. Wenn kombinierte Allele geteilt werden, dann werden auch deren Häufigkeitswerte geteilt. Allele mit einem Wert = 0.0 werden nicht gespeichert.
Es gibt auch eine Methode, um die Allel-Häufigkeitswerte zu normalisieren. Die Summe der Werte für einen Marker darf nicht größer sein als 1. Die Gleitpunktzahlen sind auf vier Dezimalstellen begrenzt. Die gültigen und normalisierten Daten werden dann in der Datenbank gespeichert.

Mutationsraten beschreiben, wie oft eine Mutation an einem bestimmten DNA-Marker vorkommt. Dateien, die solche Informationen enthalten, sollten drei Spalten haben, die erste für den Markernamen, die zweite für die paternale Mutationsrate und die dritte für die maternale Mutationsrate.