1. Zum Inhalt springen

Inhalt

Regeln der statistischen Geheimhaltung

Die Statistische Geheimhaltung besteht aus der primären und sekundären Geheimhaltung.

Primäre Geheimhaltung:

Die wichtigste Vorgabe der primären Geheimhaltung lautet, dass zu jedem Tabellenwert eine Mindestzahl an Fällen (z.B. Personen, Maßnahmen, Betriebe) beitragen muss. Die Zahl der Mindestfälle richtet sich nach dem Risiko bzw. der Wahrscheinlichkeit des Offenlegens von Einzelangaben. Als Standard für die Mindestfallzahlregel gilt eine Mindestfallzahl von drei. Bei erhöhtem Risiko aufgrund eines hohen Detaillierungsgrades der Daten kann die Mindestfallzahl auch mit größer als 3 festgesetzt werden. 

Neben der Mindestfallzahlregel von drei für jede Zellbesetzung muss stets geprüft werden, ob sich die dargestellten Informationen, die in einer hierarchischen Beziehung zueinander stehen, auf nur sehr wenige Merkmalsträger beziehen, z.B. Betriebe in der in der Beschäftigungsstatistik oder der Statistik zu Kurzarbeit sowie Bedarfsgemeinschaften in der Grundsicherungsstatistik.

Darüber hinaus besteht erhöhtes Risiko der Offenlegung von Einzelangaben auch dann, wenn ein Tabellenwert durch einen einzelnen dahinterstehenden Fall dominiert wird. Vor diesem Hintergrund gilt zur Gewährleistung der statistischen Geheimhaltung zusätzlich die sogenannte „Dominanzregel“. Diese Regel wird im Folgenden am Beispiel der der Beschäftigungsstatistik erläutert:

Selbst wenn hinter der Beschäftigtenzahl eines Wirtschaftszweiges drei oder mehr Betriebe stehen, kann einer dieser Betriebe einen so hohen Beschäftigtenanteil auf sich vereinen, dass die Beschäftigtenzahl praktisch eine Einzelangabe über den Branchenführer darstellt. Würde dann der Wert der Beschäftigten für diese Branche in dieser Region ausgewiesen, so könnte leicht auf die Beschäftigtenzahl des Dominanzbetriebs rückgeschlossen werden. Die Identifikation von Dominanzbetrieben ist über eine Differenzierung von Betrieben und Beschäftigten nach Betriebsgrößenklassen möglich.

 

Sekundäre Geheimhaltung (Ausschluss der Rückrechenbarkeit):

 Die sekundäre Geheimhaltung stellt sicher, dass ein gesperrter Tabellenwert nicht wieder  über einfache Rechenoperationen ermittelt werden kann. Das ist immer dann möglich, wenn Einzelfelder mit Spalten- oder Zeilensummen oder anderen Vergleichswerten in einem rechnerischen Zusammenhang stehen.

 

Maßnahmen zur Reduzierung des Informationsverlustes:

Muss ein Wert aufgrund der primären oder sekundären Geheimhaltung gesperrt werden, so wird dieser Wert durch ein * ersetzt.

Um jedoch möglichst viele relevante Informationen zu erhalten, sollte man im Vorfeld von statistischen Anfragen überlegen, wie detailliert eine bestimmte Auswertung sein muss. Eine Möglichkeit besteht darin, den Fokus auf bestimmte wesentliche Kategorien anstelle der Abbildung aller einzelnen Ausprägungen eines Merkmals zu legen (Muss es z. B. bei berufsfachlichen Darstellungen immer der komplette Zwei- und Dreisteller nach tief gegliederten regionalen Strukturen sein oder gibt es aggregierte Darstellungen, die vergleichbar informativ sind?). Ein Verzicht auf nicht interessierende Kategorien oder Summen kann ebenfalls die vollständige Darstellung der benötigten Daten ermöglichen. Insbesondere ist es häufig hilfreich, nicht alle Merkmale miteinander zu kreuzen, sondern Kombinationen eher sparsam auszuwählen oder sich auf die "Ränder" von Tabellen zu konzentrieren. 

Eine ausführliche Beschreibung der rechtlichen Grundlagen und den fachlichen Regeln der statistischen Geheimhaltung finden Sie unter weitere Informationen.

Darüber hinaus können Sie sich ebenfalls an Ihren zuständigen Statistik-Service wenden.

Marginalspalte

Weitere Informationen