Im Rahmen von NAPKON bildet der GECCO-Kerndatensatz den Minimaldatensatz aller drei NAPKON-Kohorten HAP (hochauflösende Plattform), SÜP (sektorenübergreifende Plattform) und POP (populationsbasierte Plattform). Kohorten-übergreifend existieren ungefähr 2000 Datenelemente. Die Schnittmenge aller drei NAPKON-Kohorten gründen den GECCOplus-Datensatz.
Die Identifikation der Schnittmengen erfolgte auf Basis der einzelnen Kohortendatensätze sowie eines programmierten Python-Skriptes unter Verwendung der Levenshtein-Distance.
Der GECCO83 ist wesentlicher Bestandteil aller drei Kohortendatensätze und somit bereits in jedem Kohortendatensatz enthalten. Um die Dopplung von Datenelementen im GECCOplus zu vermeiden, wurde der erzeugte Output um diese Datenelemente entsprechend bereinigt.
Die daraus resultierende Schnittmenge zweier Kohorten (z.B. SÜP und POP) wurde der dritten Kohorte (z.B. HAP) gegenübergestellt.
Schlussendlich bildet der letzte Abgleich die Definition des GECCOplus-Datensatzes und somit die Schnittmenge aller drei Kohortendatensätze.
Um den GECCOplus standardisiert abzubilden und aufzubereiten wurde eine einheitliche Bezeichnung der Items mit Hilfe von SNOMED-CT und Medical Subject Headings (MeSH) vorgenommen. Außerdem wurden die Antwortausprägungen durch die Redaktionsgruppe des GECCO83 festgelegt.