De volkstelling van 1960 was de eerste telling die door het CBS met behulp van computers is verwerkt. Iedere getelde persoon vormde één ponskaart in het bestand van in totaal ca. 11,5 miljoen ponskaarten. Toen de Volkstelling van 1971 werd voorbereid, was er opslagruimte nodig voor de nieuwe telkaarten. Inmiddels was in 1964 de Steinmetz-stichting opgericht. Deze stichting ijverde voor de oprichting van een wetenschappelijk data-instituut, dat computerbestanden ten behoeve van sociaal-wetenschappelijk onderzoek zou archiveren en ter beschikking stellen. Vanaf 1967 correspondeerden de Steinmetz-stichting (voorzitter H. 't Hart) en CBS (Directeur-Generaal J.Ch.W. Verstege) over de ponskaartenverzamelingen van CBS (vanaf ca. 1935; de ponskaarten van vóór 1960 werden met behulp van zogenaamde Hollerith-machines verwerkt).

In 1969 vond de overdracht van de ponskaarten van de Volkstelling 1960 (11,5 miljoen ponskaarten) aan de Steinmetz-stichting plaats. De overdracht zelf was al een logistieke operatie van aanzienlijke omvang. De Steinmetz-stichting was toen in afwachting van subsidie van de Ministeries van Onderwijs & Wetenschappen en Economische Zaken voor de oprichting van het data-instituut en had vrijwel geen financiële middelen. Voor transport en tijdelijke opslag van de ponskaarten was naar schatting al f. 12.600,- vereist, waarvoor een subsidie was aangevraagd bij de Universiteit van Amsterdam.

De bestanden nu en de verwerking sinds 1991

De volkstelling van 1960 werd uiteindelijk studienummer P0061 in het Steinmetz-archief. In de jaren zeventig zijn de dozen met ponskaarten, na geruime tijd opgeslagen te zijn geweest, opnieuw ingelezen en op magneetband gezet. Helaas is gebleken dat het toen opnieuw gecreëerde bestand een aantal gebreken vertoont.

De bestanden zijn in november 1991 door het Steinmetz-archief van zes of zeven magneetbanden van de CDC-Cyber mainframe computer overgezet naar een UNIX-computer. Bij deze conversie zijn enkele onregelmatigheden in de data waargenomen.

De oudste nu bestaande versies van de bestanden (aanwezig op CD-ROM in het Steinmetz-archief) dateren van 19 oktober 1994. De data zijn beschikbaar in de vorm van zeven bestanden met onbewerkte data. Deze bestanden bevatten de data in hun meest oorspronkelijke vorm (als afspiegeling van de ponskaarten in ASCII-formaat).

Cleaning van de data en het maken van SPSS-bestanden

In 1995 zijn de ruwe ASCII-bestanden door het Steinmetz-archief omgezet naar SPSS-systeembestanden. Volgens de beschikbare documentatie (bestand p0061_1.doc op de CD-ROM, zie http://dx.doi.org/10.17026/dans-zdn-gj52) is bij deze omzetting een beperkte vorm van datacleaning toegepast. Ernstig vervuilde records zijn terzijde gelegd en niet in de SPSS-bestanden opgenomen. Als ernstig vervuild zijn ondermeer aangemerkt alle records waarin zogenaamde dubbelponsingen voorkomen (met uitzondering van waar dat was toegestaan volgens de documentatie). Hierbij zijn ongeveer 3600 records 'vervuilde' records uit de bestanden verwijderd, die overigens in afzonderlijke restbestanden zijn opgeslagen. Lees verder...

De data-cleaning is in eerste instantie in november 1995 uitgevoerd door het Steinmetz-archief met behulp van twee UNIX-scripts ('SPLITS' en 'CLEAN'). Deze scripts met bijbehorende documentatie zijn op de CD-ROM aanwezig. De originele databestanden uit 1994 (of 1991) zijn met het SPLITS-script ingedeeld in bestanden per provincie. Met het script CLEAN zijn vervuilde records op de volgende criteria afgezonderd: Een record is minimaal 30 posities lang en maximaal 80 posities. Een record met 80 posities heeft in positie 80 altijd een spatie of &. Een record bevat uitsluitend spaties, de codes 0 t/m 9 en de bovenponsingen - en &. Hierop is één uitzondering: positie 22 kan elk karakter bevatten. De posities 1 t/m 9, 29 en 30 zijn altijd ingevuld (ongelijk spatie). Let op: positie 28 kan leeg (gelijk spatie) zijn. De eerste positie bevat altijd een 1. De met CLEAN en SPLITS afgezonderde records zijn in rest-bestanden bewaard gebleven.

Bij het maken van de SPSS-bestanden zijn ook variabelen gehercodeerd en zijn zij (evenals een groot aantal gecodeerde waarden) van 'labels' voorzien, zodat het werken met de gegevens werd vergemakkelijkt. Eén van de uitgevoerde controles was op het voorkomen van zogenaamde wildcodes. Dit zijn codes die niet zijn gedocumenteerd en die dus niet zouden mogen voorkomen Lees verder...

De controles op wildcodes in de volkstelling van 1960 betroffen de spatie, het liggend streepje en het ampersand-teken (&). Geconstateerde wildcodes zijn gehercodeerd naar code "onbekend" ("99", "990", "9900" of "990000" afhankelijk van het aantal posities van de variabele in het oorspronkelijke databestand). Spaties die na de wildcodes-controle overbleven, zijn ook gehercodeerd. Wanneer volgens de beschikbare codeboek-informatie een "lege" variabele staat voor "niet van toepassing", zijn spaties gehercodeerd naar "98" "980", "9800" of "980000" afhankelijk van het aantal posities van de variabele in het oorspronkelijke databestand.

De wildcodes-controle was niet volledig. Op basis van de beschikbare codeboek-informatie konden nog meer aanwezige codes als wildcodes worden aangemerkt. Omdat de beschikbare codeboek-informatie niet op alle punten volledig duidelijk was, is verdere hercodering nagelaten teneinde informatieverlies te voorkomen.

In het document p0061_2.doc (zie zie http://dx.doi.org/10.17026/dans-zdn-gj52) wordt ter afronding van de bewerkingen gemeld: "Gebruikers van deze studie dienen rekening te houden met een zekere mate van onvolledigheid van de data. Op basis van een vergelijking met de gepubliceerde aantallen mannen en vrouwen per gemeente, heeft het Steinmetz-archief geconstateerd dat sommige gemeenten in de databestanden geheel ontbreken, voor andere gemeenten alle personen van een bepaald geslacht ontbreken, voor andere gemeenten juist veel te veel personen van een bepaald geslacht voorkomen. Voor veel gemeenten zijn kleine en soms grotere verschillen geconstateerd tussen de gepubliceerde aantallen en de aantallen in de databestanden. De volledige resulaten van deze vergelijking zijn bij het Steinmetz-archief beschikbaar."

Ontbrekende en dubbele informatie

Van 24 gemeenten, verspreid over de provincies Gelderland, Noord-Brabant, Noord- en Zuid-Holland ontbreken alle gegevens. Voorts ontbreken van drie gemeenten in Drenthe, Overijssel en Noord-Holland alle vrouwen.

Bij veel gemeenten zijn er grotere of kleinere afwijkingen in de aantallen mannen en vrouwen (van de bestanden ten opzichte van de gepubliceerde gegevens). Opvallend bij de vergelijking is, dat zich een grote spreiding in de afwijkingen voordoet. Er zijn zowel gemeenten waarin slechts enkele of tientallen records ontbreken, als gemeenten met duizenden ontbrekende records.

Nog opmerkelijker is het voorkomen van gemeenten met meer records in het bestand dan in de publicaties. Zo zijn er 224.131 teveel mannen in Den Haag (tegenover 12.295 te weinig vrouwen. Bovendien heeft de provincie Zuid-Holland juist het grootste aantal missende gemeenten (namelijk 14, waaronder Dordrecht, Delft en Gorinchem). Ook Den Bosch telt maar liefst 18.834 mannen te veel.

Er zijn duidelijke aanwijzingen dat een deel van de ponskaarten niet en een deel dubbel is ingelezen. Er is ook informatie in de bestanden terechtgekomen die er niet in thuishoort, waarbij ook data is overschreven (zie ook: documentatiebestand p006101.doc op CD-ROM ― http://dx.doi.org/10.17026/dans-zdn-gj52).

Om de data nader te analyseren zijn SPSS-bestanden aangemaakt (tussen eind 1995 en 22 januari 1996). In mei 1996 is nog een vergelijking gemaakt van de bevolkingsaantallen per gemeente in de bestanden met die in de CBS-publicaties. Hiervan is een beknopt verslag beschikbaar (document P006104.doc op CD-ROM ― http://dx.doi.org/10.17026/dans-zdn-gj52).

Controles en bewerkingen sinds zomer 2002

In de zomer van 2002 is bestudeerd of de gehanteerde criteria niet hebben geleid tot het ongebruikt laten van te veel records. Dit heeft tot nu toe het volgende opgeleverd:

  • In één van de bestanden bevond zich midden tussen de data-records van Den Bosch een Fortran-programma van de geograaf Rinus Deurloo. Met hem is contact opgenomen over de mogelijke verklaring hiervan. Mogelijk is zijn 'job' tussendoor ingelezen zonder dat er End-Of-File kaarten zijn geplaatst, zodat het hele programma als data is geïnterpreteerd. Dit is waarschijnlijk al gebeurd tijdens het inlezen van de ponskaarten in de jaren zeventig.
  • Er zijn in de restbestanden ca. 3000 records gevonden, waarvan slechts één of enkele karakters onjuist lijken te zijn. Het lijkt erop alsof hier enkele bits zijn veranderd, mogelijk ten gevolge van lees- of schrijffouten op de tapes. Er kan ook sprake zijn van ponsfouten uit de tijd dat de bestanden zijn ingevoerd. In een aantal gevallen is aan de hand van de omliggende records in de oorspronkelijke bestanden (1991-1994) met grote waarschijnlijkheid af te leiden wat de foutieve waarde moet zijn. Echter, de mogelijke reconstructie van ca. 3000 records biedt bij lange na geen soelaas voor alle geconstateerde gebreken en afwijkingen.
  • Er is een aantal records gevonden, waarvan de eerste posities datarecords lijken te zijn en de laatste programmacode.

In een meer uitvoerig verslag Report+VT1960.pdf (zie http://dx.doi.org/10.17026/dans-zdn-gj52) in het Engels wordt de stand van zaken van het databestand van de volkstelling 1960 beschreven en worden aanbevelingen gedaan voor de 'digitale restauratie' en toegankelijkheid van de gegevens. Over de gemeenten met ontbrekende en veel missende personen zijn gegevens ingevoerd uit handgeschreven basistabellen, die in het archief en de bibliotheek van het CBS bewaard zijn gebleven.

LET OP: De individuele data van de volkstelling 1960 zijn onder voorwaarden te raadplegen. Belangstellenden kunnen zich wenden tot het Centrum voor Beleidsstatistiek (CvB) van het CBS.

Beroepenclassificatie

De beroepenclassificatie behorende bij de volkstelling 1960 is niet in zijn geheel digitaal beschikbaar. Het NIWI heeft een deel van de classificatie gescand, maar vanwege tegenvallende resultaten is dit nooit afgerond. Hieronder vindt u vier zip-bestanden met daarin de images van de scans en gedeeltelijk ook de ge-OCR-de tekst uit die images. Deze zijn in EASY te vinden via http://dx.doi.org/10.17026/dans-xsc-vkws onder 'Documentatie'.

Beroepenclassificatie 1/4: Volkstelling+1960_beroepen+1.zip [application/x-zip-compressed](4 MB)
Beroepenclassificatie 2/4: Volkstelling+1960_beroepen+2.zip [application/x-zip-compressed] (2 MB)
Beroepenclassificatie 3/4: Volkstelling+1960_beroepen+3.zip [application/x-zip-compressed] (2023 KB)
Beroepenclassificatie 4/4: Volkstelling+1960_beroepen+4.zip [application/x-zip-compressed] (762 KB)

• Ga naar de volkstelling van 1960 in EASY: http://dx.doi.org/10.17026/dans-xsc-vkws.

Bleoemenveiling Bloemenveiling, Aalsmeer. © Foto Freek Aal, 1960. Bron: Nederlands Fotomuseum.

Krotwoningen Krotwoningen, Amsterdam. © Foto Freek Aal, 1960. Bron: Nederlands Fotomuseum.

Staatsmijn Beatrix Aanleg van Staatsmijn Beatrix, Herkenbosch (1959). © Foto Dolf Kruger. Bron: Nederlands Fotomuseum.

DUW-arbeiders DUW-arbeiders scheppen klei in kiepwagens, Sint Annaparochie (1959). Na de oorlog werd nog steeds in werkverschaffing gewerkt door zogenaamde DUW arbeiders (Dienst Uitvoering Werken). © Foto Dolf Kruger, 9 januari 1959. Bron: Nederlands Fotomuseum.

(Klik op bovenstaande afbeeldingen voor een grotere versie)