Statistik der Bundesagentur für Arbeit

Statistik erklärt: Methodik und Systematik

Hier finden Sie häufig gestellte Fragen rund um das Thema "Methodik und Systematik"

Arbeitslosenstatistik und Beschäftigungsstatistik nach Wirtschaftszweigen

Die Statistik der Bundesagentur für Arbeit veröffentlicht regelmäßig Daten für Wirtschaftszweige bzw. Branchen, beispielsweise zum Baugewerbe oder zur Arbeitnehmerüberlassung (Zeitarbeit). Umfassende Publikationen stehen insbesondere für die Beschäftigungsstatistik und die Statistik der gemeldeten Arbeitsstellen zur Verfügung. Auch in der Arbeitslosenstatistik werden Daten für Branchen veröffentlicht.

Hier lassen sich Aussagen darüber treffen, in welcher Branche Arbeitslose tätig waren bevor sie arbeitslos wurden bzw. in welcher Branche sie eine Beschäftigung aufnehmen, wenn sie die Arbeitslosigkeit beenden.

Sie finden bei uns detaillierte Daten für Wirtschaftszweige in den Bereichen Arbeitslosigkeit, Beschäftigung und Gemeldete Arbeitsstellen.

Zugänge nach Wirtschaftszweigen in Arbeitslosigkeit finden Sie in den Tabellen Arbeitslose nach Rechtskreisen - Deutschland, West/Ost, Länder und Agenturen für Arbeit (Monatszahlen).

Darüber hinaus stehen zusammenfassende monatlich aktualisierte Analysen auf Bundesebene mit Grafiken und Zeitreihen zu Beschäftigten, gemeldeten Arbeitsstellen und zugegangenen Arbeitslosen in den einzelnen Wirtschaftszweigen in den Tabellen und Grafiken Arbeitsmarkt nach Branchen bereit.

Berufe mit System - die Klassifikation der Berufe 2010 (KldB 2010) oder: Wie finde ich Informationen über einen Beruf?

Angenommen, jemand möchte sich beruflich verändern, sucht eine neue Arbeit oder interessiert sich für eine Ausbildung bzw. ein Studium, am liebsten "irgendetwas" mit Informationstechnik. In der Jobbörse der Bundesagentur für Arbeit wird man fündig: "In wenigen Klicks zum Stellenangebot" steht dort. Aber nach was suchen? Ohne eine konkrete Bezeichnung wie "IT-Fachkraft" oder "Informatiker" eingeben zu müssen, lässt sich hier "IT, DV, Computer, Mathematik" auswählen. Dabei handelt es sich um Zusammenstellungen von ähnlichen Berufen, die alle etwas mit Tätigkeiten der Informationstechnik zu tun haben.

Schon in diesem Beispiel gibt es viele einzelne Berufsbezeichnungen wie "IT-Berater", "IT-Betriebswirte", "IT-Kaufleute", "IT-Koordinatoren", "IT-Techniker" aber auch "Softwareentwickler" und "Webdesigner". In Deutschland existieren insgesamt mehr als 27.000 verschiedene Berufsbezeichnungen. Damit die Arbeitsmarktstatistiken übersichtlich bleiben, werden die berufsbezogenen Informationen häufig in Gruppen von ähnlichen Berufen veröffentlicht. Dafür braucht man eine "Klassifikation der Berufe" und nicht nur eine einfache Liste aller Berufe.

Ein weiterer Vorteil dieser gruppierten Sicht auf die Berufe liegt in der Flexibilität bei der Stellensuche auch die verwandten Berufe zu erkennen. Denn Qualifikationen und Kompetenzen sind innerhalb einer Gruppe von Berufen häufig austauschbar. So lässt sich z.B. feststellen, dass die Berufe Parkettmacher/in (22322) und Fensterbauer/in – Holz (22332) der gleichen Gruppe angehören und damit mehr Ähnlichkeiten aufweisen als z.B. Leimer/in - Papier-, Zellstoffherstellung (23112).

Typischerweise bildet man also immer dann eine Klassifikation, wenn eine solche Vielfalt von einzelnen Elementen zusammenzufassen ist, wie bei den Berufen. In Form dieser hierarchischen Zusammenfassungen kann man ein höheres Maß an Übersichtlichkeit und Vergleichbarkeit für Statistiken schaffen. Man braucht die Klassifikation der Berufe (KldB 2010) in allen wichtigen Arbeitsmarktstatistiken, um z.B. herauszufinden, in welchen Berufen Engpässe bestehen, welche Berufe in der Vermittlung gesucht sind (Zielberuf) oder in welchen Berufen eine hohe Arbeitslosigkeit herrscht, weil es dort viele Zugänge in Arbeitslosigkeit gibt. Oder ganz einfach um zu wissen in welchen Berufen wie viele Menschen arbeiten.

Die Klassifikation der Berufe bildet die gesamte Berufswelt mit fünf numerischen Gliederungsebenen ab - von den Berufsbereichen bis zu den Berufsgattungen. In der letzten Ebene werden die Berufe zudem nach dem Komplexitätsgrad der Tätigkeiten unterschieden und zwar nach:
1 - Helfern,
2 - Fachkräften,
3 - Spezialisten,
4 - Experten.

Alle Berufsbezeichnungen und ihre Einordnung in die KldB 2010 sind in einem systematischen und einem alphabetischen Verzeichnis dokumentiert. Weitergehende Informationen zur Klassifikation der Berufe finden Sie im Internetangebot der Statistik der BA.

Die Notwendigkeit der Saisonbereinigung

Unter Saisonbereinigung versteht man eine statistische Methode, mit der eine Zeitreihe von Originaldaten um die Saisonschwankungen geglättet wird, damit der saisonunabhängige, aktuelle (kurzfristige) Trend erkennbar wird. Zyklische, nach ähnlichem Muster wiederkehrende Schwankungen überlagern die trendmäßige Entwicklung bei vielen ökonomischen Größen. Diese saisonalen Einflüsse treten typischerweise bei Zeitreihen mit unterjährigen Messzeitpunkten auf, wie Monats- oder Quartalsdaten. Reihen mit Jahresdaten enthalten keine Saisonmuster.

Monatliche Arbeitsmarktdaten sind bekannte Beispiele für Größen mit einer deutlich ausgeprägten saisonalen Komponente. Die Arbeitslosenzahl liegt in den Wintermonaten Januar und Februar üblicherweise am höchsten im Jahr, da vor allem aufgrund von Witterungseinflüssen in der Baubranche oder in der Landwirtschaft die Nachfrage nach Arbeitskräften in diesen Monaten deutlich geringer ist ("Winterarbeitslosigkeit").

Ein Beispiel soll die Überlagerung verdeutlichen. Der originale Arbeitslosenbestand lag im Dezember 2016 bei 2.568.000 und im Januar 2017 bei 2.777.000 Personen. Das bedeutet auf den ersten Blick einen Anstieg von 209.000 Personen zum Vormonat Dezember 2016. Man könnte aus den Originaldaten somit den falschen Schluss ziehen, dass sich aktuell ein deutlich steigender Trend bei der Arbeitslosigkeit abzeichnet.

Saisonbereinigt ergibt sich für Dezember 2016 ein Bestand von 2.631.000 Arbeitslosen und im Januar 2017 von 2.605.000. Im Vergleich zum Vormonat ist damit ein Rückgang von 26.000 Personen festzustellen. Die Überlagerung durch saisonale Einflüsse fällt im konkreten Fall derart stark aus, dass zunächst verborgen bleibt, dass hinter dem augenscheinlich starken Anstieg der Arbeitslosigkeit nach der Bereinigung – also im aktuellen Trend – sogar ein leichter Rückgang der Arbeitslosenzahlen verbirgt. Der beobachtete Effekt signalisiert also keine konjunkturelle Schwäche am Arbeitsmarkt, sondern hat seinen Ursprung in einem jahreszeitlich üblichen Phänomen.

Das Beispiel zeigt deutlich wie unerlässlich es ist, solche regelmäßigen Schwankungen heraus zu rechnen (Saisonbereinigung), insbesondere im Hinblick auf eine zutreffende Interpretation des tatsächlichen Trends am aktuellen Rand. Mittels Saisonbereinigung werden jedoch nicht alle spezifischen Einflüsse eliminiert, sondern eben nur diejenigen, welche auf saisonale Effekte zurückzuführen sind und in festen Abständen mit ähnlicher Intensität auftreten.

Einmalige Witterungseinflüsse, beispielsweise die Auswirkungen eines außergewöhnlich frühen, kalten, schneereichen Winters, werden bei der Saisonbereinigung bewusst nicht "herausgerechnet". Diese Einflüsse sollen weiterhin sichtbar bleiben, um sie in der analytischen Bewertung berücksichtigen zu können. Gegen eine Bereinigung außergewöhnlicher Witterungseinflüsse spricht auch, dass sie nur schwer exakt zu quantifizieren sind – was noch mehr für Aufholeffekte in den Folgeperioden gilt, die dann ebenfalls zu entfernen wären. Aus ähnlichen Gründen führt die Statistik der Bundesagentur für Arbeit auch keine Bereinigung um Brückentag- und Schulferien-Effekte durch und weiß sich dabei im Einklang mit den Richtlinien des Europäischen Statistischen Systems.

Die Statistik der BA bietet in ihrem Internetauftritt monatlich eine Vielzahl an saisonbereinigten Reihen, u. a. zur Arbeitslosigkeit, zu gemeldeten Arbeitsstellen oder zur Beschäftigung.
Beispielsweise in der Analyse Arbeitsmarkt "Frühindikatoren für den Arbeitsmarkt" finden sich saisonbereinigte Reihen zu verschiedenen Größen für Deutschland und die Länder.
Saisonbereinigte Reihen zu Arbeitslosen nach ausgewählten Strukturen ab 1998 stehen in der Tabelle "Zeitreihe zur Arbeitslosigkeit seit 1950 nach Strukturmerkmalen (Monats-/Jahreszahlen)" zur Verfügung.
Saisonbereinigte Eckdaten findet man ebenfalls in den Monatsberichten und grafische Darstellungen von originalen mit saisonbereinigten Zeitreihenverläufen in der Analyse Arbeitsmarkt "Arbeitsmarkt in Deutschland".

Die regionale Gliederung in der Statistik und Arbeitsmarktberichterstattung der Bundesagentur für Arbeit

Die Statistik und Arbeitsmarktberichterstattung der Bundesagentur für Arbeit (BA) erfüllt den gesetzlichen Auftrag, die Lage und Entwicklung der Beschäftigung und des Arbeitsmarktes im Allgemeinen und nach Regionen zu beobachten, zu untersuchen und auszuwerten. Dementsprechend sind Regionen ein zentrales Element in der Berichterstattung: in Tabellenheften und statistischen Berichten, in interaktiven Tabellen, Grafiken und Karten und in den Apps.

Statistiken beziehen sich immer auf ein abgegrenztes Gebiet. Im Veröffentlichungsangebot der Statistik und Arbeitsmarktberichterstattung der BA werden drei Gebietsgliederungen verwendet:

  • Politische Gebietsstruktur (Bund, Länder, Kreise, Gemeinden)
  • BA-Gebietsstruktur (Regionaldirektionsbezirke, Agenturbezirke, Geschäftsstellenbezirke)
  • Gebietsstruktur der Grundsicherungsträger SGB II (Jobcenterbezirke)

Daneben finden sich in einigen Veröffentlichungen die vom Institut für Arbeitsmarkt- und Berufsforschung (IAB) entwickelten Typisierungen des Arbeits- und Ausbildungsmarktes. Die Arbeitsagenturen und Jobcenter werden je nach ihrer jeweiligen Arbeitsmarktlage bestimmten Vergleichstypen zugeordnet. Somit können Regionen mit ähnlicher Arbeitsmarktlage untereinander verglichen werden.

Darüber hinaus gibt es weitere regionale Gliederungen, die vereinzelt in Veröffentlichungen enthalten sind und auf Anfrage in Auswertungen dargestellt werden können:

  • Raumordnungsregionen (vom Bundesinstitut für Bau-, Stadt- und Raumforschung)
  • Siedlungsstrukturelle Kreistypen (vom Bundesinstitut für Bau-, Stadt- und Raumforschung)
  • Metropolregionen
  • NUTS-Klassifikation (EU-Systematik der Gebietseinheiten für die Statistik)

Grundsätzlich handelt es sich bei den Statistiken der BA um eine Vollerhebung und die Daten stehen entsprechend kleinräumig zur Verfügung (z.B. Gemeinden). Bei kleinen Regionen können die Werte unter Umständen aber sehr klein ausfallen, so dass die Aussagekraft der Statistiken an Grenzen stößt und Daten aufgrund der Einhaltung des Datenschutzes nicht unbegrenzt herausgegeben werden dürfen.

Weitere Hintergrundinformationen der Statistik und Arbeitsmarktberichterstattung der Bundesagentur für Arbeit zu den regionalen Gliederungen.

Fiktive Gebietsstände

Fiktion und Statistik: ein Begriffspaar, das eigentlich nicht zusammenpasst. Aufgabe von Statistik ist es ja gerade, durch die Bereitstellung belastbarer Daten ein objektives Bild der Realitäten entstehen zu lassen. Aufgabe von Statistik als Dienstleistung ist es allerdings auch, die Interpretation der Daten zu unterstützen. Angesichts immer wieder vorkommender Änderungen in den Gebietsständen (z.B. Änderung von Grenzen von Agenturbezirken) wurde die Möglichkeit zur Ausweisung von Statistiken für "fiktive" Gebietsstände geschaffen. Mit Hilfe von fiktiven Gebietsständen lassen sich die Daten früherer Berichtsmonate nach dem aktuellen Gebietsstand auswerten. Daraus lassen sich dann auch Entwicklungen – beispielsweise der Arbeitslosigkeit und Beschäftigung – zeigen, die unabhängig von Änderungen der Gebietsstrukturen sind. Für einen neu geschaffenen Agenturbezirk kann so nicht nur am aktuellen Rand, sondern eben auch die Entwicklung in diesem Gebiet über längere Zeit beschrieben werden. Auch im Bereich der politischen Gebietsstrukturen (Kreise, Gemeinden) kommt es immer wieder durch Kreisgebietsreformen zu Veränderungen. Die Nutzung fiktiver Gebietsstände lässt auch dafür ein realistisches Bild der neu abgegrenzten Gebiete entstehen.

Hochrechnung am aktuellen Rand

Die statistischen Daten der Bundesagentur für Arbeit (BA) werden grundsätzlich aus Vollerhebungen gewonnen. Erforderliche Fallbearbeitungsvorgänge (z.B. Nachbewilligungen) sowie der Zeitbedarf für die Bearbeitung in den Jobcentern, Agenturen für Arbeit bzw. den Betrieben führen jedoch dazu, dass zum statistischen Stichtag ("Zähltag") noch nicht alle relevanten Erhebungseinheiten (z. B. Beschäftigungsverhältnisse oder Einkommenshöhen) erfasst sind. Erst nach einer gewissen "Wartezeit" sind diese Daten vollständig. Dabei beschreibt in diesem Zusammenhang der Begriff "x-Monatswert" die bis dahin aufgetretene Wartezeit x. Eine vollständige Datengrundlage liegt - in dem Beispiel der Statistik zu den Arbeitslosengeldempfängern - erst nach einer 2-monatigen "Wartezeit" vor. Daher werden diese sogenannten 2-Monatswerte als die "endgültigen" Werte von der Statistik der BA veröffentlicht.

Um die Informationslücken der zeitlichen Verzögerung so gering wie möglich zu halten, kommen Schätzungen bzw. Hochrechnungen der jeweils aktuellen Daten als methodische Lösung in Betracht. Denn eine Veröffentlichung von untererfassten Daten – ohne vorherige Hochrechnung – würde schnell zu fehlerhaften Interpretationen führen. Hochgerechnete Werte werden als "vorläufige" Werte bezeichnet und für grundlegende Merkmale ausgewiesen.

Detaillierte Informationen zu den jeweiligen Hochrechnungen der Fachstatistiken finden Sie in den jeweiligen Qualitätsberichten.

Lange Zeitreihen, warum ist das sinnvoll?

Die Statistik der Bundesagentur für Arbeit (BA) veröffentlicht monatlich aktuelle Daten zum Arbeitsmarkt und der Grundsicherung. In der Regel werden diese aktuellen Daten in einen zeitlichen Bezug gesetzt, um deren Entwicklung abzuschätzen. Dabei ist jedoch zu beachten, dass die Daten häufig jahreszeitlichen Schwankungen unterliegen. Um diese saisonalen Effekte zu berücksichtigen, müssen längere Zeiträume betrachtet werden. Daher werden in der Regel neben den Veränderungen zum Vormonat auch die Veränderungen zum Vorjahresmonat und saisonbereinigte Daten berichtet.

Daneben ist auch die Betrachtung von längeren Zeitreihen geboten, denn vor allem konjunkturelle Effekte zeigen sich erst bei der Betrachtung mehrerer Jahre. Ebenso werden strukturelle Änderungen, zum Beispiel aufgrund gesetzlicher Änderungen, oft erst nach mehreren Jahren in ihren vollen Auswirkungen sichtbar (siehe z.B. die Entwicklung der Beschäftigungsquoten insgesamt und nach Altersgruppen). Je nach Fragestellung ist daher die Auswahl des Betrachtungszeitraumes sehr wichtig.

Aktuelle Daten, längere Zeitreihen und saisonbereinigte Daten zu unterschiedlichen Themen finden sie zum Beispiel im Internet in der Tabelle "Eckwerte des Arbeitsmarktes und der Grundsicherung - Deutschland, West/Ost und Länder (Monatszahlen)".

Quantile, Median und Durchschnitt - Lagemaße in der Arbeitsmarktstatistik

In der Statistik werden Lagemaße eingesetzt, um die Verteilung eines Merkmals über seine Beobachtungseinheiten zu beschreiben, z. B. die Verteilung der Bruttoarbeitsentgelte (Merkmal) über alle sozialversicherungspflichtig Vollzeitbeschäftigten der Kerngruppe in Deutschland (Beobachtungseinheiten; etwa 20,24 Mio. Personen mit Entgeltangabe im Dezember 2015). Bekanntestes Beispiel eines solchen "Lagemaßes" ist der arithmetische Mittelwert.

Manchmal lassen sich Mittelwerte nicht exakt berechnen oder man benötigt weitere Lagemaße um die Verteilung differenzierter und aussagekräftiger zu beschreiben. Häufig verwendet werden dabei Quartile (oder allgemeiner Quantile) und der Median. Das dahinterliegende Konzept bedarf einer Erläuterung:
Man kann dazu vom allgemeinen Begriff des "Perzentils" ausgehen. Gegenstand der Betrachtung ist eine Menge von Personen, für die ein bestimmtes Merkmal gemessen ist. Die Einzeldaten für alle Personen seien aufsteigend sortiert (im genannten Beispiel die Beschäftigten nach der Höhe ihres Bruttoarbeitsentgelts). Dann teilen Perzentile ("Prozentwerte") die Personen in 100 von der Besetzung her gleich starke Gruppen auf und die Perzentilwerte geben die Größe des Merkmals an den Gruppenrändern an. Im oben angeführten Beispiel befinden sich somit in jedem Perzentil rund 202.400 Personen. Der Wert des 1%-Perzentils steht damit für das maximale Bruttoarbeitsentgelt, welches eine Person beziehen darf, um zu den rund 202.400 Beschäftigten mit dem geringsten Verdienst unter allen Beobachtungseinheiten zu zählen.

Einige Perzentile hebt man besonders hervor: vier Quartile (vier gleich starke Gruppe), von den das erste Quartil das 25% Perzentil und die beiden nächsten das 50%- und 75%- Perzentil sind. Analog teilen die fünf Quintile die Gesamtheit in fünf gleich starke Gruppen von je 20% auf. Der Median entspricht dem 50%-Perzentil und wird auch "Zentralwert" genannt.

Beim Median handelt es sich somit um einen Mittelwert, welcher die Verteilung eines Merkmals in zwei gleich große Hälften teilt. Für das oben angeführte Beispiel ergibt sich ein Wert von 3.084 €. Damit erhalten 10,12 Mio. Beschäftigte ein Bruttoarbeitsentgelt von 3.084 € oder weniger, wohingegen die andere Hälfte mindestens dieses Einkommen oder mehr aufweist.

Der Median ist nicht mit dem arithmetischen Mittelwert (dem sog. Durchschnitt) zu verwechseln, welcher rechnerisch völlig anders ermittelt wird. Das arithmetische Mittel verteilt den Totalwert eines Merkmals (im Beispiel also die Summe der Bruttoarbeitsentgelte aller berücksichtigten Beschäftigten) gleichmäßig auf die einzelnen Beobachtungseinheiten.

Gegenüber dem Durchschnitt weist der Median in der Praxis nicht selten zwei Vorteile auf:
Er kann in der Regel auch ermittelt werden, wenn eine offene Randklasse auftritt (z. B. als oberste Klasse "5.100 € und mehr" Bruttoarbeitsentgelt), es sei denn der Median fällt selbst in diese Klasse. Der Durchschnitt hingegen kann stets nur noch geschätzt werden (mit geeigneten Annahmen), da der benötigte Totalwert (im Beispiel die Summe der Bruttoarbeitsentgelte aller berücksichtigten Beschäftigten) nicht (exakt) zu bestimmen ist.

Der Zentralwert reagiert kaum auf Ausreißer-Werte. Man versteht darunter außergewöhnlich hohe (oder niedrige) Merkmalswerte von Beobachtungseinheiten aus den Rändern der Merkmalsverteilung (z. B. außergewöhnlich hohe Arbeitsentgelte). Das arithmetische Mittel verhält sich in diesem Punkt häufig deutlich weniger robust. Der Umstand ist insbesondere bei sehr schiefen bzw. unsymmetrischen Merkmalsverteilungen und/oder kleinen bis mittleren Fallzahlen zu beachten.

In der Hintergrundinformation "Sozialversicherungspflichtige Bruttoarbeitsentgelte" (PDF, 2MB) finden Quantile und der Median Anwendung.
Der arithmetische Mittelwert wird u.a. für die Ermittlung der "durchschnittlichen Vakanzzeit" in der Statistik der gemeldeten Arbeitsstellen verwendet.

Statistik ist Vertrauenssache - Der Verhaltenskodex der Europäischen Statistiken

Im System der Europäischen Statistik bestehen für alle statistischen Stellen verbindliche Standards zur Sicherung der Qualität der amtlichen Statistiken. Wesentliches Element ist der Verhaltenskodex der europäischen Statistiken. Er wurde 2005 vom Rat der Wirtschafts- und Finanzminister beschlossen und im Herbst 2011 in einigen Bereichen neu gefasst. Der Verhaltenskodex soll das Vertrauen in die statistischen Stellen stärken, indem er bestimmte institutionelle und organisatorische Maßnahmen fordert. Er soll die Qualität der von ihnen erstellten und verbreiteten Statistiken verbessern, indem er die einheitliche Anwendung statistischer Grundsätze, Methoden und Verfahren fördert. Die Statistik der Bundesagentur für Arbeit (BA) ist als Teil der amtlichen Statistik diesem Verhaltenskodex verpflichtet.

Der Verhaltenskodex der Europäischen Statistiken setzt sich aus folgenden Grundsätzen zusammen:

  1. Fachliche Unabhängigkeit
  2. Auftrag zur Datenlieferung
  3. Angemessene Ressourcen
  4. Verpflichtung zur Qualität
  5. Statistische Geheimhaltung
  6. Unparteilichkeit und Objektivität
  7. Eine solide Methodik
  8. Geeignete Statistische Verfahren
  9. Vermeidung einer übermäßigen Belastung der Auskunftgebenden
  10. Wirtschaftlichkeit
  11. Relevanz
  12. Genauigkeit und Zuverlässigkeit
  13. Aktualität und Pünktlichkeit
  14. Kohärenz und Vergleichbarkeit
  15. Zugänglichkeit und Klarheit

Die aktualisierte Fassung finden Sie in unseren Leitlinien.

Stock-Flow-Modell: Was ist das und warum passt es nicht immer genau?

Statistiken erfassen Sachverhalte, die sich im Zeitablauf ändern und von begrenzter Dauer sind, die also beginnen und enden. Neben Bestandsdaten benötigen Statistiken deshalb auch Bewegungsdaten:

  • Bestandsdaten bieten eine Momentaufnahme. Wie ist die Situation zu einem Zeitpunkt?
  • Bewegungsdaten spiegeln Ereignisse wieder. Welche Vorgänge gab es in einem Zeitraum?

Die Messung des Bestandes steht zunächst im Mittelpunkt der Statistik der Arbeitslosen: Wie viele Personen sind am Stichtag arbeitslos? Über mehrere Stichtage hinweg lassen sich durch Zeitreihen Veränderungen erkennen. Die Dynamik am Arbeitsmarkt in Folge der Entstehung und Beendigung von Beschäftigung und Arbeitslosigkeit lässt sich durch Bestandsdaten jedoch kaum ermitteln. Sie wird erst sichtbar, wenn die Zugänge in und Abgänge aus Arbeitslosigkeit, also die Bewegungen, in die Betrachtung einbezogen werden. Bewegungen sind Ereignisse und werden im Zeitraum zwischen zwei Stichtagen gemessen. Sie sind die Bestimmungsfaktoren des Bestandes:

Arbeitslosenbestand (am Stichtag des Vormonats)
+ Zugänge in Arbeitslosigkeit (im Laufe des Monats)
- Abgänge aus Arbeitslosigkeit (im Laufe des Monats)
= Arbeitslosenbestand (am Stichtag des aktuellen Monats)

Diesen Zusammenhang zwischen Bestand und Bewegung nennt man Stock-Flow-Modell.

Beispiele in Zahlen:
Im Berichtsmonat April 2016, genauer gesagt am 13. April 2016, waren bundesweit 2.743.864 Menschen arbeitslos (Bestand). Zwischen dem Stichtag März und dem Stichtag April wurden 600.232 Menschen arbeitslos (Zugang) und 701.259 beendeten die Arbeitslosigkeit (Abgang). Nach der Stock-Flow-Formel ergibt sich:
2.844.891 Arbeitslose (14. März 2016)
+ 600.232 Zugänge in Arbeitslosigkeit (15. März bis 13. April 2016)
- 701.259 Abgänge aus Arbeitslosigkeit (15. März bis 13. April 2016)
= 2.743.864 Arbeitslose (13. April 2016)

Die exakte Übereinstimmung der programmtechnisch gemessenen Werte mit dem idealen Stock-Flow-Modell wie hier im Berichtsmonat April 2016 gelingt nicht in jedem Berichtsmonat. Die Abweichungen liegen meist im zweistelligen Bereich, also unter 100, und sind deshalb unbeachtlich.

Die Ergebnisse der Arbeitslosenstatistik sind in tiefer Differenzierung verfügbar nach soziodemographischen und erwerbsbiografischen Merkmalen sowie regionalen Unterteilungen. Je tiefer differenziert eine Auswertung ist, desto weniger gilt das Stock-Flow-Modell, denn die Merkmale können sich ändern, ohne den Bestand an Arbeitslosen zu beeinflussen. So verändert ein Umzug einer arbeitslosen Person den Arbeitslosenbestand der betroffenen Regionen, nicht aber Deutschlands insgesamt. Die Person ist durchgehend arbeitslos, es findet weder ein Abgang aus Arbeitslosigkeit (in einer Region) noch ein Zugang in Arbeitslosigkeit (in der anderen Region) statt.

Ähnliches gilt für die Änderung des Zielberufs einer Person. Auch dies stellt keinen Zugang in oder Abgang aus Arbeitslosigkeit dar. Es ändert sich nur der Bestand an Arbeitslosen mit dem bisherigen Zielberuf (Rückgang um 1) und des neuen Zielberufs (Zuwachs um 1).

Vertiefende Informationen finden Sie im Qualitätsbericht "Statistik der Arbeitslosen, Arbeitsuchenden und gemeldeten erwerbsfähigen Personen" (PDF, 809KB).

Warum ist der Berichtsmonat nicht identisch mit dem Kalendermonat?

Die Statistik der Bundesagentur für Arbeit veröffentlicht die Daten des Arbeitsmarktes und der Grundsicherung für Arbeitsuchende immer für sogenannte Berichtsmonate. Der Berichtsmonat ist nicht identisch mit dem Kalendermonat, denn der Berichtsmonat beginnt am Tage nach einem Stichtag und endet mit dem nächsten Stichtag. Dieser Stichtag ist der Tag an dem zum Beispiel die Arbeitslosen gezählt werden und liegt immer in der Mitte eines Kalendermonats. Lediglich in der Beschäftigungsstatistik liegt der Stichtag am letzten Tag des Kalendermonats. Die Benennung des Berichtsmonats entspricht dem Monat, in dem der Stichtag liegt.

Zum Beispiel ist Bestand an Arbeitslosen für den Berichtsmonat März 2017 der Bestand am 14. März 2017 (Stichtag März 2017). Die Zu- und Abgänge von Arbeitslosen für den Berichtsmonat März 2017 sind alle Zu- und Abgänge die zwischen dem 14. Februar 2017 (einen Tag nach dem Stichtag Februar 2017) und dem 14. März 2017 (Stichtag März 2017) erfasst wurden.

Veröffentlicht werden die statistischen Daten eines Berichtsmonats zum sogenannten Veröffentlichungstermin. Aufgrund der technischen und fachlichen Aufbereitung liegt dieser Termin ca. zwei Wochen nach dem Stichtag.
Die Stichtage und Veröffentlichungstermine finden Sie im Veröffentlichungskalender.

Warum liegen am Jahresende noch nicht alle Jahresdaten vor?

Die Daten der Statistik der BA werden zum Großteil aus Verwaltungsdaten gewonnen. Dabei handelt es sich zum Beispiel um personenbezogene Informationen, die zum Zwecke der Arbeitsvermittlung, Förderung oder Leistungsgewährung erhoben werden. Bestimmte Informationen liegen erst mit zeitlicher Verzögerung, d.h. nach einer gewissen Wartezeit, vollständig vor. Beispielsweise sieht der Prozess zur Gewährung von Leistungen nach dem SGB II die sorgfältige, zum Teil mehrere Wochen andauernde Prüfung der finanziellen Situation des Antragstellers vor. Erfolgreiche Anträge werden somit oft rückwirkend, also mit einem bestimmten Zeitversatz, bewilligt. Umgekehrt können bereits bewilligte Anträge im Nachhinein aufgehoben werden.

Im Saldo kommen in aller Regel mit zunehmender Wartezeit mehr Fälle hinzu. Somit liegt am aktuellen Rand, d.h. ohne Wartezeit ermittelte Informationen, ein Wissensdefizit vor, welches als Untererfassung zu interpretieren ist. Der Grad der Untererfassung ist vor allem abhängig von dem betrachteten Sachverhalt. Informationen über Arbeitslosigkeit liegen normalerweise ohne zeitliche Verzögerung vor, Information zu sozialversicherungspflichtig Beschäftigten erst nach einer Wartezeit von sechs Monaten. Die einzelnen Fachstatistiken der Statistik der BA berichten endgültige Ergebnisse somit nach unterschiedlicher Wartezeit.

Da sich auch nach mehreren Jahren nachträgliche Änderungen in den Verwaltungsdaten ergeben können, kann niemals von einer vollständigen Erfassung gesprochen werden. Die Wartezeit, mit der bestimmte Daten veröffentlicht werden, ist daher immer ein Kompromiss aus größtmöglicher Aktualität der Ergebnisse und vollständiger Erfassung. Rückwirkende Änderungen an Sachverhalten, die außerhalb der Wartezeit bekannt werden, werden statistisch nicht berücksichtigt. Der nach Wartezeit veröffentlichte Wert ist somit der endgültige Wert.

Daten mit verkürzter Wartezeit werden in der Regel nicht veröffentlicht, beispielsweise um Fehlinterpretationen zu vermeiden. Um dem Bedarf nach aktuellen Ergebnissen nachzukommen, werden einzelne Kennzahlen auf Basis von vorläufigen Daten und Erfahrungswerten auf den zu erwartenden endgültigen Wert hochgerechnet. Die Beschäftigungsstatistik veröffentlicht beispielsweise vorläufige Ergebnisse über Beschäftigte im Bestand bereits nach zwei und drei Monaten - hochgerechnet auf den nach sechs Monaten Wartezeit zu erwartenden Wert.

Es wurde gezeigt, dass die Wartezeit, mit der über bestimmte Sachverhalte berichtet wird, Resultat eines Wissensdefizites am aktuellen Rand ist. Für den Prozess der Aufbereitung der Daten und der Erstellung von Statistikprodukten werden zusätzlich einige Tage Arbeitszeit benötigt, sodass sich ausgehend vom statistischen Stichtag die Zeit bis zum Veröffentlichungstermin entsprechend verlängert. Selbst wenn am aktuellen Rand kein Wissensdefizit vorliegt, ist es daher erst möglich, zu Beginn des neuen Jahres über den Dezember und das Vorjahr zu berichten. Bis die Berichterstattung über den Dezember und das Vorjahr mit endgültigen statistischen Ergebnissen möglich ist, muss die je Statistikverfahren festgelegte Wartezeit abgewartet werden. Dies ist z.B. Anfang April für die Grundsicherungsstatistik SGB II und die Förderstatistik der Fall.

Warum sind Mindestfallzahlen in der Statistik relevant?

Bei den von der Statistik der BA präsentierten Daten handelt es sich fast ausschließlich um Vollerhebungen. Eine Vollerhebung bezieht im Gegensatz zu einer Teilerhebung alle statistischen Einheiten der Grundgesamtheit ein. Während bei einer Teilerhebung eine Mindestbesetzungszahl vorliegen muss, um repräsentativ für die Grundgesamtheit zu sein, kann man auf Basis einer Vollerhebung theoretisch Aussagen zu jeder Merkmalskombination treffen, unabhängig davon auf wie viele statistische Einheiten diese Kombination zutrifft. Man kann dann unterscheiden zwischen dem Zählergebnis und statistischen Maßzahlen, wie Durchschnitten, Anteilswerten oder Quoten, die auf Basis der Zählergebnisse berechnet werden.

Bei statistischen Maßzahlen kann nun auch in einer Vollerhebung die Aussagekraft erheblich eingeschränkt sein. Passend zu dieser Frage konstatierte der frühere US-Präsident Roosevelt einmal: "… laut Statistik haben ein Millionär und ein Habenichts je eine halbe Million." Wenn also der Millionär und der Vermögenslose die einzigen statistischen Einheiten mit übereinstimmenden Identifikationskriterien sind, z.B. weil sie die einzigen Bewohner in einer bestimmten Straße sind, so kann zwar das Durchschnittsvermögen in dieser Straße ermittelt werden (500.000 Geldeinheiten), das Ergebnis dürfte aber weder stabil noch relevant sein. Zum nächsten Erhebungszeitpunkt könnte nämlich der Millionär weggezogen sein und damit das Durchschnittsvermögen um 500.000 Geldeinheiten sinken. Und egal, ob ein oder zwei Bewohner in dieser Straße wohnen, für eine Sozialpolitik dürften die Ergebnisse nicht relevant sein. Anders dürfte es schon aussehen, wenn man Durchschnitte für das ganze Stadtviertel oder gar die ganze Stadt berechnet. Grundsätzlich gilt aber auch hier: je kleiner die Einheit, desto eher sind Ergebnisse "zufällig" und desto weniger sind die Ergebnisse "systematischer" Natur.

Für bestimmte Bereiche in der Berichterstattung hat die Statistik der BA bereits Mindestbesetzungszahlen als Voraussetzung für die Ermittlung von statistischen Maßzahlen festgelegt. Dies sind zum Beispiel Arbeitslosenquoten oder Medianentgelt von Beschäftigten. Aber auch für andere kleine Zählergebnisse kann die Aussagekraft von statistischen Maßzahlen eingeschränkt sein und sollte bei der Analyse der Daten berücksichtigt werden.

Was hat die Anhebung der Regelaltersgrenze mit der Statistik der Bundesagentur für Arbeit zu tun?

Am 20.04.2007 wurde das Gesetz zur Anpassung der Regelaltersgrenze an die demografische Entwicklung und zur Stärkung der Finanzierungsgrundlagen der gesetzlichen Rentenversicherung beschlossen. Dieses sieht eine sukzessive Anhebung der Regelaltersgrenze von 65 auf 67 Jahre vor. Ab 01.01.2012 sind die ersten Fälle (Geburtsjahrgang 1947) von dieser Anhebung betroffen.

Diese Regelaltersgrenze ist für die Gewährung von Leistungen im Sozialgesetzbuch III (SGB III) und für die Leistungen der Grundsicherung für Arbeitsuchende (SGB II) relevant. Der Anspruch auf Arbeitslosengeld (§ 117 SGB III) und auf Leistungen der Grundsicherung für Arbeitsuchende (§ 7 SGB II) besteht bis zum Ablauf des Monats, in dem das für die Regelaltersrente im Sinne des SGB VI erforderliche Lebensjahr vollendet wurde. Daher ist das Ende des Monats, in dem die Regelaltersgrenze erreicht wird, für die Statistik die entscheidende Obergrenze. Dieser Zeitpunkt wird als "Altersgrenze" bezeichnet. Die Anhebung der Regelaltersgrenze hebt somit auch die Altersgrenze an. Aus diesem Grund gibt es erstmalig im Berichtsmonat Februar 2012 Leistungsberechtigte im SGB III und in der Grundsicherung für Arbeitsuchende, die 65 Jahre und ein Monat alt sind.

Darüber hinaus hat die Anhebung der Altersgrenze auch Auswirkungen auf die Zahl der Arbeitslosen, da eine Person so lange als arbeitslos gilt, bis die Altersgrenze für den Renteneintritt erreicht ist.

In der Förder- und der Beschäftigungsstatistik hingegen spielt die Anhebung der Altersgrenze eine untergeordnete Rolle, da die Personen unabhängig vom Alter den entsprechenden Status erhalten.

Woher kommen die Daten der Statistik der Bundesagentur für Arbeit und wie werden sie geschützt?

Die Statistiken der Bundesagentur für Arbeit basieren überwiegend auf den Geschäftsdaten, die bei der Durchführung der Aufgaben nach dem Sozialgesetzbuch II und III in den Arbeitsagenturen und in den Jobcentern anfallen. Zum Beispiel liegen über einen Arbeitslosen unter anderem Informationen zum Alter, zum bisherigen Erwerbsleben oder zur Berufsausbildung vor.

Eine weitere Grundlage der Statistik der Bundesagentur für Arbeit sind die Arbeitgebermeldungen zu den sozialversicherungspflichtig Beschäftigten und geringfügig entlohnt Beschäftigten sowie Meldungen der Verleihbetriebe nach dem Arbeitnehmerüberlassungsgesetz.

Die Bundesagentur für Arbeit hat im Rahmen des Statistikauftrages demzufolge viele vertrauliche Informationen zu verarbeiten, welche datenschutzrechtlich gem. §§ 35, SGB I, 67 SGB X Sozialdaten darstellen und dem höchsten Schutzbedürfnis unterliegen. Gem. § 35 Abs. 1 S. 1 SGB I hat jeder Anspruch darauf, dass die ihn betreffenden Sozialdaten von den Leistungsträgern – zu denen auch die Bundesagentur für Arbeit zählt – nicht unbefugt erhoben, verarbeitet oder genutzt werden (Sozialgeheimnis). Die Wahrung der datenschutzrechtlichen Vorschriften hat im Rahmen der Organisation und der täglichen Arbeit innerhalb der Bundesagentur für Arbeit grundlegende Bedeutung; das gilt insbesondere für die Erfüllung des gesetzlichen Statistikauftrags durch die Statistik der Bundesagentur für Arbeit.

Neben den Datenschutzbestimmungen für Sozialdaten gilt für die Statistik der Bundesagentur für Arbeit darüber hinaus der Grundsatz der statistischen Geheimhaltung, wie er im § 16 des Bundesstatistikgesetzes und in der Verordnung über Europäische Statistik (EG-Verordnung 223/2009) verankert ist. Das bedeutet konkret, dass Fallzahlen (z. B. Arbeitslosenzahlen oder Maßnahmeteilnehmer) in der Regel erst ab einer Zahl von mindestens 3 berichtet werden. Alle geringeren Werte (1 oder 2) werden in der statistischen Berichterstattung durch ein * ersetzt. Darüber hinaus muss auch ausgeschlossen werden, dass über Berechnungen (z. B. ausgewiesene Summen) auf den gesperrten Wert geschlossen werden kann, indem zum Beispiel weitere Werte durch ein * ersetzt werden. Ferner muss der Schutz der Betriebedaten gewährleistet sein.

In unserem Internetangebot finden Sie eine ausführlichere Beschreibung der fachlichen Regelungen zur statistischen Geheimhaltung sowie einen Überblick über die ermächtigenden Gesetze und Verordnungen der Statistik der Bundesagentur für Arbeit.