Vabariigi Valitsuse loenduskomisjonile
Memo: Eesti 2020. aasta rahvaloenduse ettevalmistusest
Rahvaloendus on riigi andmekorralduse üks alustalasid. Seetõttu on väga tähtis, et loenduse korraldusega seotud põhimõttelisi valikuid kaalutakse hoolikalt, võttes arvesse ühiskonna teabevajadust ja võimalikke riske.
Statistikaamet on rahvastikuküsimustega tegelevaid teadlasi loenduse ettevalmistuste käigust regulaarselt teavitanud. Käesolev memo on koostatud loenduse projektijuhi Diana Beltadze ettepanekul ning põhineb pikema aja jooksul Statistikaametilt saadud mitmekülgsel teabel. Memos on tähelepanu juhitud eelkõige nendele küsimustele, milles teadlaste seisukoht võib Statistikaameti omast oluliselt erineda.
Soovime juhtida memoga tähelepanu sellele, et registripõhise rahvaloenduse ettevalmistuseks ja läbiviimiseks kulutab riik suurusjärgus 25 miljonit eurot, kuid Statistikaameti analüüsid näitavad, et saadav tulemus ei vasta ootustele. Oluliste probleemide allikad ei ole tehnilist laadi ja neid ei ole võimalik loenduseni jäänud kahe-kolme aastaga kõrvaldada. Seepärast soovitame rakendada kombineeritud loendusmeetodit, kus lisaks põhiosa info ammutamisele registritest kogutaks väikese osa teabest otse inimestelt, kasutades selleks maksimaalselt veebipõhise iseloenduse meetodit.
1. Loendusmeetodid
Rahvaloendus on rahvastiku arvu, koostise ja paiknemise inventuur, mida on võimalik teostada erinevate meetoditega. Nüüdisajal eristatakse kolme peamist loendusmeetodit vastavalt sellele, kuidas loendusandmeid kogutakse.
Traditsioonilise loendusmeetodi puhul saadakse kõik andmed otse inimestelt. Algselt eeldas see meetod loendajate poolt eluruumide külastamist, kuid tänapäeval tähendab traditsiooniline meetod järjest enam iseloendamist, kus inimesed täidavad küsimustikud loendaja vahenduseta. Alates 2000. aasta loendusvoorust kasutatakse kasvaval määral internetipõhist iseloendamist. Registripõhise loendusmeetodi rakendamisel pärinevad kõik andmed riigi administratiivregistritest. Kombineeritud loendusmeetodi puhul saadakse üks osa teabest registritest ning teine osa, mida registritest pole võimalik küllaldase usaldusväärsusega hankida, kogutakse inimestelt. Nüüdisajal toimub see järjest enam internetipõhise iseloenduse abil, mille väga edukas näide on Eesti 2011. aasta rahvaloendus.
Statistikaameti seisukoht: Dokumendis “Registripõhise rahva- ja eluruumide loenduse II prooviloenduse põhimõtted” pakub Statistikaamet välja lahenduse, mille puhul kombineeritud loendusmeetodit rakendataks viisil, kus tunnuste jaoks, mida registrite põhjal ei õnnestu piisavalt täpselt moodustada, võetakse kasutusele viimase aasta või viimaste aastate jooksul kogutud andmed statistikaameti mahukatest isiku-uuringutest („Eesti tööjõu-uuring“, „Eesti sotsiaaluuring“ ning „Leibkonna ja elukoha andmete võrdlusuuring“). Nende uuringute andmete põhjal tuletatakse puuduvate tunnuste väärtused, kasutades mõnd sobivat statistilise prognoosimise eeskirja.
Teadlaste seisukoht: Selline lahendus ei ole sobiv. Esiteks on pakutud lahendus vastuolus loenduse aluspõhimõttega, mille kohaselt rahvaloendus (erinevalt valimipõhistest uuringutest) on kõikne andmekogumise viis, kus teave saadakse kõigi rahvastikku kuuluvate isikute kohta. Ainult selle põhimõtte järgimine tagab, et loendus annab sisult samaväärse teabe nii suurte kui väga väikeste rahvastikurühmade ja piirkondade kohta. Näiteks on Eesti linnades märgatavalt kasvanud segregatsioon, kuid viimane usaldusväärne teave selle ulatuse kohta pärineb 2011. aasta rahvaloendusest ning 2020 rahvaloendus ei pakuks segregatsiooni kohta enam olulist ja võrreldavat teavet. Samas on näiteks Majandus- ja Kommunikatsiooniministeerium otsustanud elamumajandusele senisest suuremat tähelepanu pöörata. Selliste kaotuste loetelu on pikk ja seda ei ole võimalik siinkohal ära tuua.Teiseks läheb valimipõhiste uuringute tulemuste abil “prognoosimine” vastuollu teise fundamentaalse põhimõttega, mille kohaselt loendus on tegelikkust peegeldav statistiline vaatlus, mitte prognoosimeetodite abil loodud kujutluspilt. Kolmandaks tähendaks uuringuandmete alusel loendustunnuste prognoosimine seda, et küsitlusuuringutele mittevastanute (neid on valimitesse sattunutest tihti kuni 50%), pole võimalik arvestada. Kuna valimuuringutele mittevastamine pole juhuslik, tekitaks see asjaolu saadud tulemustes süstemaatilisi moonutusi.
2. Loendusmeetodi valiku kriteerium ja teiste riikide praktika
Loendusmeetodi valik ei tohiks lähtuda eeldusest, et on olemas paremad (tänapäevased) ja halvemad (iganenud) meetodid. Igal loenduse põhimeetodil on oma tugevad ja nõrgad küljed, mis erinevate meetodite puhul ei kattu. Loendusmeetodi valiku kriteeriumiks peaks olema selle optimaalne sobivus konkreetse riigi oludesse.
Kui oludesse sobivuse asemel lähtutaks mingist meetodite abstraksest paremusjärjestusest, siis kasutaks enamik riike sama meetodit. Tegelikkuses kasutas 2010. aasta loendusvoorus Euroopa riikidest 65% traditsioonilist meetodit (sh iseloendamist), 17% kombineeritud meetodit ja 18% täielikult registripõhist meetodit. Teiste sõnadega eelistas 82% riikidest koguda teavet vähemalt osaliselt või koguni tervikuna otse inimeste käest. Sellise jaotuse põhjuseks ei ole asjaolu, nagu puuduksid neljal viiendikul Euroopa riikidest administratiivsed andmeallikaid (sh rahvastikuregistrid). Põhjuseks on tõsisasi, et registrite rahvaloendusel kasutamine eeldab, et need vastaksid statistikas kehtivatele küllalt rangetele kvaliteedinõuetele.
Statistikaameti seisukoht: Dokumendis “Registripõhise rahva- ja eluruumide loenduse II prooviloenduse põhimõtted” sissejuhatuses märgib Statistikaamet, et registripõhise loenduse “õnnestumisel või ebaõnnestumisel on suur mõju Eesti mainele, eriti IT-võimekusele”.
Teadlaste seisukoht: Loendusmeetodi valikul tuleks esiplaanile seada siiski see, milline loendusmeetod annab meie oludes usaldusväärse tulemuse. On väär luua avalikkuses ja otsustajate hulgas arvamust, nagu oleks täielikult registripõhine loendus juba kujunenud või kohe-kohe kujunemas ainuvaldavaks praktikaks Euroopas riikides, ülejäänud maailmast rääkimata.
3. Registripõhise loenduse metoodikaprojekti tulemused
Eesti valmidust registripõhiseks loenduseks on sel kümnendil mitmekülgselt uuritud. Aastatel 2010–2013 viidi Statistikaameti tellimusel mitme ülikooli teadlaste koostöös läbi analüüs, mis hindas kõigi Euroopa Liidu riikidele kohustuslike loendustunnuste registripõhise moodustamise võimalusi Eestis. Enamiku tunnuste puhul katsetati tunnuste moodustamist ka praktiliselt ja kõrvutati tulemusi 2011. aasta loenduse tegelike andmetega.
Selles põhjalikus uuringus jõuti järeldusele, et sobivaim oleks kasutada Eesti 2020. aasta rahvaloendusel kombineeritud meetodit, mille puhul suurem osa teabest pärineks registritest, kuid väiksem osa (sh teave inimeste tegeliku elukoha ja leibkondade kohta) kogutaks inimestelt. Järelduse aluseks oli prognoos, et Eestis pole realistlik jõuda 2020. aastaks olukorrani, kus valdava enamiku inimeste registripõhine elukoht langeks kokku nende tegeliku elukohaga. Metoodikauuringu teostamise ajal ulatus tegeliku ja registripõhise aadressi lahknevus üle 20%, mis moonutab kuni 50% leibkondade andmeid. Sellise lahknevusmäära puhul ei saa täielikult registripõhine andmekogumine loenduse ette püstitatud ülesandeid täita. Siseministeerium on äsja algatanud mahuka kolmeaastase uuringuhanke (RITA projektide raames), mille eesmärk on leida lahendusi, kuidas elukohaandmete kvaliteeti oluliselt parandada. Seda uuringut pole veel alustatud ning seetõttu on paratamatu, et 2020. aasta loenduseks andmete usaldusväärsus inimeste elukohtade ja leibkondade osas märkimisväärselt ei parane.
Teadlaste seisukoht: 2013. aastal tehtud prognoos täielikult registripõhise loenduse ebarealistlikkuse osas on põhijoontes paika pidanud. Seda on kinnitanud nii 2016. aasta esimese prooviloenduse tulemused kui ka Statistikaameti poolt fookusrühma aruteludel esitatud tulemused. Samuti kinnitab prognoosi õigsust ministeeriumide poolt 2018. aasta kevadel koostatud projekti “Mobiilne eluviis, avalike teenuste tarbimine ja elukohaandmed riiklikes registrites” dokumentides sisalduv olukorra kirjeldus.
4. Esimese prooviloenduse tulemused
Metooodikaprojektile järgnevalt on Statistikaamet tegelenud sihipäraselt 2020. aasta loenduse ettevalmistusega, mis on aidanud registrite andmekvaliteeti oluliselt parandada.
Esimese süsteemse vahehinnangu olukorrale andis 2016. aastal toimunud prooviloendus. Registritest õnnestus prooviloendusel rahuldava või hea kvaliteediga moodustada veidi üle 70% loenduse isikutunnustest. Ülejäänud, ligi 30% tunnuste kvaliteedihindeks kujunes mitterahuldav. Mitterahuldava hinde saanud isikutunnuste hulgas olid alaline elukoht ja suur osa leibkondi ja perekondi iseloomustavaid tunnuseid. Lahknevuse ulatusest ettekujutuse andmiseks võib tuua näiteks üksikvanemaperede arvu — registriandmetele tuginedes leiaksime neid Eestist tegelikuga võrreldes kaks korda rohkem, üksikvanemaga elavate laste arv oleks rohkem kui 100 tuhande võrra tegelikust suurem. Ilmselt pole tarvis lisada, et nii suure veamääraga andmete kasutusväärtus on nullilähedane.
Lisaks ei annaks täielikult registripõhiselt läbiviidud loendus inventuuriteavet mitme muu Eesti oludes väga tähtsa ühiskonnanähtuse kohta. Nende hulka kuulub näiteks rahvastiku eesti keele oskus, mis üheski registris terviklikult ei kajastu. Saamata jääks ka varasematel loendustel kogutud väärtuslik teave rahvastiku terviseseisundi kohta, mis oleks väga vajalik jätkuvat pensioniea tõusu arvestades. Valimipõhistest uuringutest saadav informatsioon kõikset keele-, lõimumis- ja terviseinfot ei asendaks.
Statistikaameti seisukoht: Statistikaamet ise andis prooviloenduse tulemustele rahuldava koondhinnangu, lähtudes sellest, et hinnangu arvutamisel tasakaalustavad umbes 70% tunnuste paremad hinded ligi 30% tunnuste mitterahuldavaid hindeid.
Teadlaste seisukoht: Selline koondhinnang pole põhjendatud, sest loenduse puhul ei kasutata tunnuseid ühe- või kahekaupa, vaid reeglina mitmesugustes laiemates kombinatsioonides. Kooskasutamisel määravad tulemuse aga terviku nõrgemad, mitte tugevamad lülid. Seetõttu peaks koondhinnang esimese prooviloenduse tulemusele olema mitterahuldav.
5. Indeksimeetodi kasutamine mitterahuldava kvaliteediga tunnuste puhul
Mitterahuldava kvaliteediga loendustunnuste probleemi lahendamiseks on Statistikaamet lahendusena pakkunud indeksimeetodi kasutamist, mis tähendab registritest leitud märkide alusel tõenäosuslikult tunnuste väärtuste prognoosimist. Seni on Statistikaamet fookusrühmas tutvustanud residentsusindeksi ja partnerlusindeksi moodustamist ja selle abil tulemusi. Residentsusindeks on mõeldud Eesti alaliste elanike ning sisse- ja väljarändajate kindlakstegemiseks, partnerlusindeks aga meeste ja naiste abielu- ja kooselupaarideks ühendamiseks.
Teadlaste seisukoht: Statististikaametis tehtud töö indeksimeetodi arendamisel on muljetavaldav, metoodika seisukohalt huvipakkuv ja tunnustust vääriv. Siiski ei pea memo koostajad indeksimeetodi abil saadud tulemusi selliseks, et need võiksid lähiajal asendada vastavaid vaatluslikke tunnuseid.
Residentsusindeksi kasutamisel saadud rändehinnangud on suurendanud iga-aastast sisse- ja väljarändajate arvu kolm-neli korda. Statistikaameti andmebaasist nähtub, et uue meetodi rakendamisel pole umbes poolte sisserännanute puhul enam teada, millisest riigist nad on Eestisse saabunud. Ligikaudu poolte väljarännanute puhul ei ole aga teada, millistesse riikidesse nad lahkusid. Sellise kvaliteediga rändestatistikat ei saa paraku pidada täisväärtuslikuks.
Partnerlusindeksi puhul on võimalik kaudsete märkide abil kokku panna hinnanguliselt kuni 85% tegelikest paaridest, kuid see määr on rahvastikurühmiti väga erinev. Näiteks vabaabielupaaride puhul on see oluliselt madalam kui abielupaaride puhul, nooremate (alla 30-aastased) puhul palju madalam kui keskealiste puhul, vanemaealiste puhul on moodustatud paaride hulk seevastu tegelikust suurem. Samasugused süstemaatilised moonutused eksisteerivad ka paljudes muudes lõigetes (sotsiaalmajanduslike rühmade vahel, rahvuspõhiselt, piirkondlikult jne). Selline tulemus on kaugel olukorrast, kus indeksimeetodil loodud andmestikku oleks võimalik kasutada pereprotsesside analüüsiks või standardina valimipõhiste andmete täpsuse ja usaldusväärsuse kontrollimisel. Praegune olukord on vastupidine: andmeid valimipõhistest uuringutest, millele kuni pooled valimisse sattunud jätavad vastamata, kasutatakse standardina loenduse kõikse andmestiku suhtes.
Kolmanda olulise indeksi kohta ei ole Statistikaamet veel katselisi tulemusi esitanud.
6. Lahendus
Väikese ja avatud ühiskonnana peaks Eesti kindlustama end usaldusväärse rahvastikuteabega. See on eelduseks demograafilise kestlikkuse probleemide diagnoosimisel ja lahenduste otsingul, mille tähtsust on praegune valitsuskoalitsioon selgesti deklareerinud.
Teadlaste seisukoht: Registripõhise loenduse metoodikaprojekti ja esimese prooviloenduse tulemused ning Statistikaameti poolt fookusrühmas esitatud tulemused näitavad, et täielikult registripõhisena teostatult rahvaloendus Eestile vajalikku usaldusväärset teabealust kogu rahvastiku kohta ei taga. Seda ei taga ka registripõhise loenduse kombineerimine valimipõhiste küsitlusuuringutega.
Memo koostajate arvates on ainsaks sobivaks lahenduseks kombineeritud loendusmeetodi rakendamine, kus ühe, suhteliselt väikese osa loendustunnuste kohta kogutaks teavet kõiksuse põhimõttel kogu elanikkonnalt. 2011. aasta loenduse vastuvõtt näitas, et asjakohase selgitustöö puhul vastavad inimesed loendusele hea meelega. Fookusrühmas tutvustatud küsitlustulemused ei kinnita ka seda, nagu ootaks enamik inimesi täielikult registripõhist loendust. Pigema vastupidi, vaid suhteliselt väike vähemus eeldas, et järgmine loendus korraldatakse täielikult registripõhisena.
Statistikaamet on hinnanud kombineeritud meetodi kasutamisega seotud täiendavate kulude suuruseks 8 miljonit eurot (arvud põhinevad Statistikaameti 2016. aasta hinnangutel ja võivad olla vahepeal täpsustunud). Nende vahendite leidmine eelseiva kolme aasta vältel (2019–2021) ei tohiks olla poliitilise tahte olemasolul ülejõukäiv. Täiendava rahastusvajaduse hindamisel tuleks tähele panna, et mitterahuldavat tulemust andva täielikult registripõhise loenduse eelarvestatud maksumus on 25 miljonit eurot ning 2011. aasta tavameetodil korraldatud loenduse kogukuludeks on Statistikaamet hinnanud 13,4 miljonit eurot. On vastustustundetu kulutada suurusjärgus 25 miljonit eurot tegevusele, mille tulemus ei suuda ette prognoositavalt saavutada loenduse ette püstitatud eesmärke.
Loendusmeetodit puudutava lõpliku, kirjeldatud probleeme arvestava otsusega ei tohi enam viivitada. Otsuse edasilükkamine teise prooviloenduse tulemuste selgumiseni ei ole mõistlik kahel põhjusel. Esiteks näitavad Statistikaameti poolt fookusrühmas esitatud tulemused, et radikaalset tulemuste paranemist alalist elukohta ning leibkonda ja perekonda puudutavates tunnustes pole tõenäoline saavutada. Teiseks jääb otsuse edasilükkamise puhul Statistikaametil liiga vähe aega kombineeritud loendussüsteemi töövalmis seadmiseks ja testimiseks.
Täielikult registripõhise asemel kombineeritud loenduse teostamist ei tuleks mingil juhul käsitleda läbikukkumisena, vaid vajadusi ja tegelikke võimalusi arvestava kaalutletud valikuna. Isegi kombineeritud meetodi rakendamisel on registrite kasutamine 2020. aasta loendusel kordades suurem ja inimeste vastamiskoormus kordades väiksem kui 2011. aasta loendusel. Sellist samm-sammulist teed registripõhise loenduseni on käinud ka registripõhise loenduse pioneeridena tuntud Põhjamaad.
Eesti saaks kombineeritud loenduse puhul olla kogu maailmale teenäitajaks internetiloenduse uue tippmargi püstitajana. 2011. aasta loendusel püstitatud internetiloenduse maailmarekord lubab eeldada, et ligi 80% inimestelt oleks Eestis 2021. aastal võimalik koguda teavet interneti vahendusel. See saavutus haakuks hästi Eesti kui eduka e-riigi kuvandiga. Saavutuse vastukaja ei oleks väike, sest paljude väljaspool Euroopat asuvate riikide jaoks on rahvaloenduste lähem tulevik seotud interneti laialdase kasutamise, mitte registritega.
Mare Ainsaar, Tartu ülikooli sotsioloogia ja sotsiaalpoliitika vanemteadur
Allan Puur, Tallinna ülikooli rahvastikuteaduse professor
Ellu Saar, Tallinna ülikooli sotsioloogia professor
Luule Sakkeus, Tallinna ülikooli Eesti demograafia keskuse juhataja ja vanemteadur
Tiit Tammaru, Tartu ülikooli linna- ja rahvastikugeograafia professor
Toomas Veidebaum, Tervise arengu instituudi teadusdirektor
Statistikaamet on rahvastikuküsimustega tegelevaid teadlasi loenduse ettevalmistuste käigust regulaarselt teavitanud. Käesolev memo on koostatud loenduse projektijuhi Diana Beltadze ettepanekul ning põhineb pikema aja jooksul Statistikaametilt saadud mitmekülgsel teabel. Memos on tähelepanu juhitud eelkõige nendele küsimustele, milles teadlaste seisukoht võib Statistikaameti omast oluliselt erineda.
Soovime juhtida memoga tähelepanu sellele, et registripõhise rahvaloenduse ettevalmistuseks ja läbiviimiseks kulutab riik suurusjärgus 25 miljonit eurot, kuid Statistikaameti analüüsid näitavad, et saadav tulemus ei vasta ootustele. Oluliste probleemide allikad ei ole tehnilist laadi ja neid ei ole võimalik loenduseni jäänud kahe-kolme aastaga kõrvaldada. Seepärast soovitame rakendada kombineeritud loendusmeetodit, kus lisaks põhiosa info ammutamisele registritest kogutaks väikese osa teabest otse inimestelt, kasutades selleks maksimaalselt veebipõhise iseloenduse meetodit.
1. Loendusmeetodid
Rahvaloendus on rahvastiku arvu, koostise ja paiknemise inventuur, mida on võimalik teostada erinevate meetoditega. Nüüdisajal eristatakse kolme peamist loendusmeetodit vastavalt sellele, kuidas loendusandmeid kogutakse.
Traditsioonilise loendusmeetodi puhul saadakse kõik andmed otse inimestelt. Algselt eeldas see meetod loendajate poolt eluruumide külastamist, kuid tänapäeval tähendab traditsiooniline meetod järjest enam iseloendamist, kus inimesed täidavad küsimustikud loendaja vahenduseta. Alates 2000. aasta loendusvoorust kasutatakse kasvaval määral internetipõhist iseloendamist. Registripõhise loendusmeetodi rakendamisel pärinevad kõik andmed riigi administratiivregistritest. Kombineeritud loendusmeetodi puhul saadakse üks osa teabest registritest ning teine osa, mida registritest pole võimalik küllaldase usaldusväärsusega hankida, kogutakse inimestelt. Nüüdisajal toimub see järjest enam internetipõhise iseloenduse abil, mille väga edukas näide on Eesti 2011. aasta rahvaloendus.
Statistikaameti seisukoht: Dokumendis “Registripõhise rahva- ja eluruumide loenduse II prooviloenduse põhimõtted” pakub Statistikaamet välja lahenduse, mille puhul kombineeritud loendusmeetodit rakendataks viisil, kus tunnuste jaoks, mida registrite põhjal ei õnnestu piisavalt täpselt moodustada, võetakse kasutusele viimase aasta või viimaste aastate jooksul kogutud andmed statistikaameti mahukatest isiku-uuringutest („Eesti tööjõu-uuring“, „Eesti sotsiaaluuring“ ning „Leibkonna ja elukoha andmete võrdlusuuring“). Nende uuringute andmete põhjal tuletatakse puuduvate tunnuste väärtused, kasutades mõnd sobivat statistilise prognoosimise eeskirja.
Teadlaste seisukoht: Selline lahendus ei ole sobiv. Esiteks on pakutud lahendus vastuolus loenduse aluspõhimõttega, mille kohaselt rahvaloendus (erinevalt valimipõhistest uuringutest) on kõikne andmekogumise viis, kus teave saadakse kõigi rahvastikku kuuluvate isikute kohta. Ainult selle põhimõtte järgimine tagab, et loendus annab sisult samaväärse teabe nii suurte kui väga väikeste rahvastikurühmade ja piirkondade kohta. Näiteks on Eesti linnades märgatavalt kasvanud segregatsioon, kuid viimane usaldusväärne teave selle ulatuse kohta pärineb 2011. aasta rahvaloendusest ning 2020 rahvaloendus ei pakuks segregatsiooni kohta enam olulist ja võrreldavat teavet. Samas on näiteks Majandus- ja Kommunikatsiooniministeerium otsustanud elamumajandusele senisest suuremat tähelepanu pöörata. Selliste kaotuste loetelu on pikk ja seda ei ole võimalik siinkohal ära tuua.Teiseks läheb valimipõhiste uuringute tulemuste abil “prognoosimine” vastuollu teise fundamentaalse põhimõttega, mille kohaselt loendus on tegelikkust peegeldav statistiline vaatlus, mitte prognoosimeetodite abil loodud kujutluspilt. Kolmandaks tähendaks uuringuandmete alusel loendustunnuste prognoosimine seda, et küsitlusuuringutele mittevastanute (neid on valimitesse sattunutest tihti kuni 50%), pole võimalik arvestada. Kuna valimuuringutele mittevastamine pole juhuslik, tekitaks see asjaolu saadud tulemustes süstemaatilisi moonutusi.
2. Loendusmeetodi valiku kriteerium ja teiste riikide praktika
Loendusmeetodi valik ei tohiks lähtuda eeldusest, et on olemas paremad (tänapäevased) ja halvemad (iganenud) meetodid. Igal loenduse põhimeetodil on oma tugevad ja nõrgad küljed, mis erinevate meetodite puhul ei kattu. Loendusmeetodi valiku kriteeriumiks peaks olema selle optimaalne sobivus konkreetse riigi oludesse.
Kui oludesse sobivuse asemel lähtutaks mingist meetodite abstraksest paremusjärjestusest, siis kasutaks enamik riike sama meetodit. Tegelikkuses kasutas 2010. aasta loendusvoorus Euroopa riikidest 65% traditsioonilist meetodit (sh iseloendamist), 17% kombineeritud meetodit ja 18% täielikult registripõhist meetodit. Teiste sõnadega eelistas 82% riikidest koguda teavet vähemalt osaliselt või koguni tervikuna otse inimeste käest. Sellise jaotuse põhjuseks ei ole asjaolu, nagu puuduksid neljal viiendikul Euroopa riikidest administratiivsed andmeallikaid (sh rahvastikuregistrid). Põhjuseks on tõsisasi, et registrite rahvaloendusel kasutamine eeldab, et need vastaksid statistikas kehtivatele küllalt rangetele kvaliteedinõuetele.
Statistikaameti seisukoht: Dokumendis “Registripõhise rahva- ja eluruumide loenduse II prooviloenduse põhimõtted” sissejuhatuses märgib Statistikaamet, et registripõhise loenduse “õnnestumisel või ebaõnnestumisel on suur mõju Eesti mainele, eriti IT-võimekusele”.
Teadlaste seisukoht: Loendusmeetodi valikul tuleks esiplaanile seada siiski see, milline loendusmeetod annab meie oludes usaldusväärse tulemuse. On väär luua avalikkuses ja otsustajate hulgas arvamust, nagu oleks täielikult registripõhine loendus juba kujunenud või kohe-kohe kujunemas ainuvaldavaks praktikaks Euroopas riikides, ülejäänud maailmast rääkimata.
3. Registripõhise loenduse metoodikaprojekti tulemused
Eesti valmidust registripõhiseks loenduseks on sel kümnendil mitmekülgselt uuritud. Aastatel 2010–2013 viidi Statistikaameti tellimusel mitme ülikooli teadlaste koostöös läbi analüüs, mis hindas kõigi Euroopa Liidu riikidele kohustuslike loendustunnuste registripõhise moodustamise võimalusi Eestis. Enamiku tunnuste puhul katsetati tunnuste moodustamist ka praktiliselt ja kõrvutati tulemusi 2011. aasta loenduse tegelike andmetega.
Selles põhjalikus uuringus jõuti järeldusele, et sobivaim oleks kasutada Eesti 2020. aasta rahvaloendusel kombineeritud meetodit, mille puhul suurem osa teabest pärineks registritest, kuid väiksem osa (sh teave inimeste tegeliku elukoha ja leibkondade kohta) kogutaks inimestelt. Järelduse aluseks oli prognoos, et Eestis pole realistlik jõuda 2020. aastaks olukorrani, kus valdava enamiku inimeste registripõhine elukoht langeks kokku nende tegeliku elukohaga. Metoodikauuringu teostamise ajal ulatus tegeliku ja registripõhise aadressi lahknevus üle 20%, mis moonutab kuni 50% leibkondade andmeid. Sellise lahknevusmäära puhul ei saa täielikult registripõhine andmekogumine loenduse ette püstitatud ülesandeid täita. Siseministeerium on äsja algatanud mahuka kolmeaastase uuringuhanke (RITA projektide raames), mille eesmärk on leida lahendusi, kuidas elukohaandmete kvaliteeti oluliselt parandada. Seda uuringut pole veel alustatud ning seetõttu on paratamatu, et 2020. aasta loenduseks andmete usaldusväärsus inimeste elukohtade ja leibkondade osas märkimisväärselt ei parane.
Teadlaste seisukoht: 2013. aastal tehtud prognoos täielikult registripõhise loenduse ebarealistlikkuse osas on põhijoontes paika pidanud. Seda on kinnitanud nii 2016. aasta esimese prooviloenduse tulemused kui ka Statistikaameti poolt fookusrühma aruteludel esitatud tulemused. Samuti kinnitab prognoosi õigsust ministeeriumide poolt 2018. aasta kevadel koostatud projekti “Mobiilne eluviis, avalike teenuste tarbimine ja elukohaandmed riiklikes registrites” dokumentides sisalduv olukorra kirjeldus.
4. Esimese prooviloenduse tulemused
Metooodikaprojektile järgnevalt on Statistikaamet tegelenud sihipäraselt 2020. aasta loenduse ettevalmistusega, mis on aidanud registrite andmekvaliteeti oluliselt parandada.
Esimese süsteemse vahehinnangu olukorrale andis 2016. aastal toimunud prooviloendus. Registritest õnnestus prooviloendusel rahuldava või hea kvaliteediga moodustada veidi üle 70% loenduse isikutunnustest. Ülejäänud, ligi 30% tunnuste kvaliteedihindeks kujunes mitterahuldav. Mitterahuldava hinde saanud isikutunnuste hulgas olid alaline elukoht ja suur osa leibkondi ja perekondi iseloomustavaid tunnuseid. Lahknevuse ulatusest ettekujutuse andmiseks võib tuua näiteks üksikvanemaperede arvu — registriandmetele tuginedes leiaksime neid Eestist tegelikuga võrreldes kaks korda rohkem, üksikvanemaga elavate laste arv oleks rohkem kui 100 tuhande võrra tegelikust suurem. Ilmselt pole tarvis lisada, et nii suure veamääraga andmete kasutusväärtus on nullilähedane.
Lisaks ei annaks täielikult registripõhiselt läbiviidud loendus inventuuriteavet mitme muu Eesti oludes väga tähtsa ühiskonnanähtuse kohta. Nende hulka kuulub näiteks rahvastiku eesti keele oskus, mis üheski registris terviklikult ei kajastu. Saamata jääks ka varasematel loendustel kogutud väärtuslik teave rahvastiku terviseseisundi kohta, mis oleks väga vajalik jätkuvat pensioniea tõusu arvestades. Valimipõhistest uuringutest saadav informatsioon kõikset keele-, lõimumis- ja terviseinfot ei asendaks.
Statistikaameti seisukoht: Statistikaamet ise andis prooviloenduse tulemustele rahuldava koondhinnangu, lähtudes sellest, et hinnangu arvutamisel tasakaalustavad umbes 70% tunnuste paremad hinded ligi 30% tunnuste mitterahuldavaid hindeid.
Teadlaste seisukoht: Selline koondhinnang pole põhjendatud, sest loenduse puhul ei kasutata tunnuseid ühe- või kahekaupa, vaid reeglina mitmesugustes laiemates kombinatsioonides. Kooskasutamisel määravad tulemuse aga terviku nõrgemad, mitte tugevamad lülid. Seetõttu peaks koondhinnang esimese prooviloenduse tulemusele olema mitterahuldav.
5. Indeksimeetodi kasutamine mitterahuldava kvaliteediga tunnuste puhul
Mitterahuldava kvaliteediga loendustunnuste probleemi lahendamiseks on Statistikaamet lahendusena pakkunud indeksimeetodi kasutamist, mis tähendab registritest leitud märkide alusel tõenäosuslikult tunnuste väärtuste prognoosimist. Seni on Statistikaamet fookusrühmas tutvustanud residentsusindeksi ja partnerlusindeksi moodustamist ja selle abil tulemusi. Residentsusindeks on mõeldud Eesti alaliste elanike ning sisse- ja väljarändajate kindlakstegemiseks, partnerlusindeks aga meeste ja naiste abielu- ja kooselupaarideks ühendamiseks.
Teadlaste seisukoht: Statististikaametis tehtud töö indeksimeetodi arendamisel on muljetavaldav, metoodika seisukohalt huvipakkuv ja tunnustust vääriv. Siiski ei pea memo koostajad indeksimeetodi abil saadud tulemusi selliseks, et need võiksid lähiajal asendada vastavaid vaatluslikke tunnuseid.
Residentsusindeksi kasutamisel saadud rändehinnangud on suurendanud iga-aastast sisse- ja väljarändajate arvu kolm-neli korda. Statistikaameti andmebaasist nähtub, et uue meetodi rakendamisel pole umbes poolte sisserännanute puhul enam teada, millisest riigist nad on Eestisse saabunud. Ligikaudu poolte väljarännanute puhul ei ole aga teada, millistesse riikidesse nad lahkusid. Sellise kvaliteediga rändestatistikat ei saa paraku pidada täisväärtuslikuks.
Partnerlusindeksi puhul on võimalik kaudsete märkide abil kokku panna hinnanguliselt kuni 85% tegelikest paaridest, kuid see määr on rahvastikurühmiti väga erinev. Näiteks vabaabielupaaride puhul on see oluliselt madalam kui abielupaaride puhul, nooremate (alla 30-aastased) puhul palju madalam kui keskealiste puhul, vanemaealiste puhul on moodustatud paaride hulk seevastu tegelikust suurem. Samasugused süstemaatilised moonutused eksisteerivad ka paljudes muudes lõigetes (sotsiaalmajanduslike rühmade vahel, rahvuspõhiselt, piirkondlikult jne). Selline tulemus on kaugel olukorrast, kus indeksimeetodil loodud andmestikku oleks võimalik kasutada pereprotsesside analüüsiks või standardina valimipõhiste andmete täpsuse ja usaldusväärsuse kontrollimisel. Praegune olukord on vastupidine: andmeid valimipõhistest uuringutest, millele kuni pooled valimisse sattunud jätavad vastamata, kasutatakse standardina loenduse kõikse andmestiku suhtes.
Kolmanda olulise indeksi kohta ei ole Statistikaamet veel katselisi tulemusi esitanud.
6. Lahendus
Väikese ja avatud ühiskonnana peaks Eesti kindlustama end usaldusväärse rahvastikuteabega. See on eelduseks demograafilise kestlikkuse probleemide diagnoosimisel ja lahenduste otsingul, mille tähtsust on praegune valitsuskoalitsioon selgesti deklareerinud.
Teadlaste seisukoht: Registripõhise loenduse metoodikaprojekti ja esimese prooviloenduse tulemused ning Statistikaameti poolt fookusrühmas esitatud tulemused näitavad, et täielikult registripõhisena teostatult rahvaloendus Eestile vajalikku usaldusväärset teabealust kogu rahvastiku kohta ei taga. Seda ei taga ka registripõhise loenduse kombineerimine valimipõhiste küsitlusuuringutega.
Memo koostajate arvates on ainsaks sobivaks lahenduseks kombineeritud loendusmeetodi rakendamine, kus ühe, suhteliselt väikese osa loendustunnuste kohta kogutaks teavet kõiksuse põhimõttel kogu elanikkonnalt. 2011. aasta loenduse vastuvõtt näitas, et asjakohase selgitustöö puhul vastavad inimesed loendusele hea meelega. Fookusrühmas tutvustatud küsitlustulemused ei kinnita ka seda, nagu ootaks enamik inimesi täielikult registripõhist loendust. Pigema vastupidi, vaid suhteliselt väike vähemus eeldas, et järgmine loendus korraldatakse täielikult registripõhisena.
Statistikaamet on hinnanud kombineeritud meetodi kasutamisega seotud täiendavate kulude suuruseks 8 miljonit eurot (arvud põhinevad Statistikaameti 2016. aasta hinnangutel ja võivad olla vahepeal täpsustunud). Nende vahendite leidmine eelseiva kolme aasta vältel (2019–2021) ei tohiks olla poliitilise tahte olemasolul ülejõukäiv. Täiendava rahastusvajaduse hindamisel tuleks tähele panna, et mitterahuldavat tulemust andva täielikult registripõhise loenduse eelarvestatud maksumus on 25 miljonit eurot ning 2011. aasta tavameetodil korraldatud loenduse kogukuludeks on Statistikaamet hinnanud 13,4 miljonit eurot. On vastustustundetu kulutada suurusjärgus 25 miljonit eurot tegevusele, mille tulemus ei suuda ette prognoositavalt saavutada loenduse ette püstitatud eesmärke.
Loendusmeetodit puudutava lõpliku, kirjeldatud probleeme arvestava otsusega ei tohi enam viivitada. Otsuse edasilükkamine teise prooviloenduse tulemuste selgumiseni ei ole mõistlik kahel põhjusel. Esiteks näitavad Statistikaameti poolt fookusrühmas esitatud tulemused, et radikaalset tulemuste paranemist alalist elukohta ning leibkonda ja perekonda puudutavates tunnustes pole tõenäoline saavutada. Teiseks jääb otsuse edasilükkamise puhul Statistikaametil liiga vähe aega kombineeritud loendussüsteemi töövalmis seadmiseks ja testimiseks.
Täielikult registripõhise asemel kombineeritud loenduse teostamist ei tuleks mingil juhul käsitleda läbikukkumisena, vaid vajadusi ja tegelikke võimalusi arvestava kaalutletud valikuna. Isegi kombineeritud meetodi rakendamisel on registrite kasutamine 2020. aasta loendusel kordades suurem ja inimeste vastamiskoormus kordades väiksem kui 2011. aasta loendusel. Sellist samm-sammulist teed registripõhise loenduseni on käinud ka registripõhise loenduse pioneeridena tuntud Põhjamaad.
Eesti saaks kombineeritud loenduse puhul olla kogu maailmale teenäitajaks internetiloenduse uue tippmargi püstitajana. 2011. aasta loendusel püstitatud internetiloenduse maailmarekord lubab eeldada, et ligi 80% inimestelt oleks Eestis 2021. aastal võimalik koguda teavet interneti vahendusel. See saavutus haakuks hästi Eesti kui eduka e-riigi kuvandiga. Saavutuse vastukaja ei oleks väike, sest paljude väljaspool Euroopat asuvate riikide jaoks on rahvaloenduste lähem tulevik seotud interneti laialdase kasutamise, mitte registritega.
Mare Ainsaar, Tartu ülikooli sotsioloogia ja sotsiaalpoliitika vanemteadur
Allan Puur, Tallinna ülikooli rahvastikuteaduse professor
Ellu Saar, Tallinna ülikooli sotsioloogia professor
Luule Sakkeus, Tallinna ülikooli Eesti demograafia keskuse juhataja ja vanemteadur
Tiit Tammaru, Tartu ülikooli linna- ja rahvastikugeograafia professor
Toomas Veidebaum, Tervise arengu instituudi teadusdirektor