Information und Wissen können durch Gruppierung von Einzelzeichen nach bestimmten Regeln kodiert werden, dabei gibt es prinzipielle strukturelle Gemeinsamkeiten zwischen Genomcode und sprachlichem Code sowie biologischer Entwicklung und Sprachentwicklung (vgl. Schlagwörter wie „ABC der Menschheit“, „Buch des Lebens“, „Sprachfamilie“). Ein zentrales Kennzeichen neben dieser „Entwicklungsfähigkeit“ und damit „Historizität“ ist die Vielfalt bzw. Varianz der Erscheinungen. Ein differenzierteres Verständnis der Mechanismen und Regeln von Entwicklung und Varianz ermöglicht neue und präzisere Verfahren der Informationsgewinnung sowie der Speicherung, Bearbeitung und Auswertung der dadurch gewonnenen Daten. Aussagekräftige Modelle können nur auf einer breiten Datenbasis entwickelt werden. In der Bioinformatik sind solche Datengrundlagen bereits generiert und öffentlich zugänglich, für den Bereich Sprachwissenschaft müssen sie – unter Verwendung entsprechender Vorarbeiten der Projektpartner – dagegen erst innerhalb des Projekts in Form der „Meta-Lemmaliste“ generiert werden. Basierend auf dieser tragfähigen Materialbasis sollen dann Verfahren, Methoden und Algorithmen entwickelt und erprobt werden, mittels derer die Varianz erschlossen und geordnet werden kann. Dabei können biologische Prozesse unter Nutzung von sprachbezogenen Konzepten modelliert werden, und umgekehrt kann die Analyse sprachlicher Varianz über bioinformatische Modelle vorgenommen werden. Für beide Bereiche ergeben sich Synergien aufgrund neuer algorithmischer Entwicklungen. Die Ergebnisse sind übertragbar auf andere Philologien bzw. auf weitere Disziplinen, die sich ebenfalls mit Fragestellungen zu Entwicklungsprozessen beschäftigen.