2.1 Tilastotietojen taustalla olevan tutkimusaineiston aineiston muodostaminen lyhyesti (Katso tarkemmin Suomen Perustan raportin luku 4: Maahanmuuton aluekohtaiset tilastotiedot.).
Tilastotietojen taustalla oleva tutkimusaineisto muodostuu Tilastokeskuksen viidestä aineistokokonaisuudesta:
Tilastotiedot ovat pääasiassa peräisin Tilastokeskuksen FOLK perustieto -tutkimusaineistosta ja FOLK tulotieto -tutkimusaineistosta.
Henkilöiden syntymävaltiot ovat peräisin Tilastokeskuksen FOLK muutto -tutkimusaineistosta ja Tilastokeskukselta erikseen tutkimuskäyttöön haetuista henkilöiden syntymävaltiotiedoista (koskien ennen v. 1990 Suomeen muuttaneita).
Tilastokeskuksen FOLK lapsi -- vanhemmat -tutkimusaineiston tiedoilla yhdistetään henkilöt heidän vanhempiinsa, jolloin yhdessä syntymävaltiotietojen kanssa on mahdollista päätellä 2. sukupolven maahanmuuttajien taustamaa. Taustamaa määräytyy 2. sukupolven maahanmuuttajan venhempien syntymävaltioiden perusteella.
Tilastokeskuksen asuntokunta -tutkimusaineiston tiedot kertovat, ketkä kuuluvat samaan asuntokuntaan (eli ketkä asuvat samassa asunnossa).
Tutkimuskäytössä ollut Tilastokeskuksen INFRA Sijaintitietomoduuli -tutkimusaineisto sisältää 250m x 250m -ruututiedot henkilöiden asuinpaikasta. Tämän tiedon avulla pääteltiin, että millä oppilasalueella Helsingissä asuneet asuivat ja missä kaupunginosassa Espoossa ja Vantaalla asuneet asuivat.
Tilastokeskuksen rekisteriaineistojen henkilötasoiset tiedot yhdistetettiin yhdeksi kokonaisuudeksi Tilastokeskuksen henkilötunnuksen avulla. Tilastokeskuksen henkilötunnus toimi siten tilastoavaimena yllä luetellun kahdeksan aineistokokonaisuuden välillä. Väestönkehitystietojen osalta tilastoavaimena toimi Tilastokeskuksen henkilötunnukset lisäksi kalenterivuosi.
Tilastotulokset rajattiin koskemaan kaikkein uusinta (tilasto)vuotta, jolta kaikki tilastotulokset ovat saatavilla. Tämä vuosi oli vuosi 2020.
Tilastotiedot koskevat kaikkia niitä henkilöitä, joilla on ollut kotikunta Suomessa vuonna 2020 joko Helsingissä, Espoossa tai Vantaalla &ndash -- ja joille löytyy asuinpaikkatieto Tilastokeskuksen INFRA Sijaintitietomoduuli -tutkimusaineistosta. Asuinpaikkatieto löytyy noin 98 prosentille, joten tutkimusaineisto sisältää noin 98 prosenttia Helsingin, Espoon ja Vantaan väestöistä vuonna 2020 (98 prosenttia niistä, joille löytyy kotikunta).
2.2 Alueiden rajojen lähteet ja tutkimusaineiston henkilöiden jakaminen alueisiin
Alueiden rajat ovat peräisin seuraavista avoimista lähteistä:
Helsingin oppilasalueiden (oppilaaksiottoalueiden) rajojen lähde on Helsingin kaupungin kaupunkimittauspalvelujen avoimet paikkatietoaineistot https://www.hel.fi/fi/paatoksenteko-ja-hallinto/tietoa-helsingista/kartat-ja-paikkatieto/paikkatiedot-tehokayttoon/avoimet-paikkatiedot. Oppilaaksiottoalueet kuuluvat Kartta- ja paikkatietoaineistoon, joiden tekijänä on Helsingin kaupunki, kaupunkiympäristön toimialan kaupunkimittauspalvelut.
Espoon kaupunginosien rajojen lähde on Espoon rajapintapalveluiden avoimet aineistot: GIS:Kaupunginosat (https://kartat.espoo.fi/avoindata/).
Vantaan kaupunginosien rajojen lähde on Vantaan kaupungin Vantaan karttarajapinnat (https://gis.vantaa.fi/rajapinnat/).
Tutkimusaineisto käsittää noin 98 prosenttia henkilöistä, joilla oli vuonna 2020 kotikunta Helsingissä, Espoossa tai Vantaalla. 98 prosenttia on osuus, joille löytyy asuinpaikkatieto Tilastokeskuksen INFRA Sijaintitietomoduuli -tutkimusaineistosta. Nämä henkilöt jaettiin Helsingissä asuvien osalta oppilasalueisiin ja Espoossa ja Vantaalla asuvien osalta kaupunginosiin. Tämä tapahtui INFRA Sijaintitietomoduulin asuinpaikkatietoihin ja alueiden (raja)tietoihin perustuvan päättelyn avulla: katso tarkemmin raportin luku 6: Maahanmuuton aluekohtaiset tilastotiedot.
2.3 Muuta: tulosten vertailu julkisiin tilastoihin ja haaste muille tutkijoille
Tilastotietojen vertailu julkisiin tilastoihin verrattuna. Suomen Perustan raportin liitteessä B varmistetaan, että julkaistut tilastotiedot vastaavat julkisesti saatavilla olevia tilastotietoja (koko Suomea yhteensä koskien).
Haaste tutkijoilla toistaa tulokset. Viitatun raportin liitteessä C esitetään haaste muille tutkijoille siitä, kuinka aluekartassa esitetyt tulokset on suhteellisen helppo toistaa. Raportin liitteessä C esitetään askeleet sille, kuinka muut tutkijat voivat toistaa esitetyt aluekohtaiset tilastotulokset Tilastokeskuksen rekisteriaineistoihin perustuen.
Aluekartasta ja aluekohtaisten lukujen taulukosta löytyvien tilastotietojen nimet on esitetty alla olevissa kuvauksissa kursiivilla.
"Väestön kehitys alueittain"-välilehdeltä löytyvät tiedot vuosille 1990–2020 ovat väestönosuustietoja, jotka esitellään alla kohdassa 3.1.
Katso vielä tarkemmat kuvaukset Suomen Perustan raportin luvussa 7 (s. 52–61).
Yksityisyydensuojan vuoksi on poistettu kaikki tiedot, jotka perustuvat alle 5 henkilöön alueella tai, jos ryhmään kuuluu alueella alle 10 henkilöä. Sosiaalietuuksien osalta rajoitus tarkoittaa sitä, että sekä tuen saajia että "ei-saajia" pitää olla alueella vähintään 5, jotta tieto on julkaistu. Lisäksi tarvittaessa on poistettu myös muita pienempiin henkilölukumääriin perustuvia tietoa, jotta alle 5 henkilöön perustuvia tietoja ei voisi epäsuoraan päätellä muiden ryhmien tiedoista.
Mikäli sosiaalietuuksien saajia on tuloksissa yli 75 prosenttia väestöstä, tällöin osuus esitetään 75,0 prosenttina tuloksissa. Eli esimerkiksi osuus 81,4 % esitetään 75,0 prosenttina.
Henkilöiden lukumäärä
Osuus koko väestöstä (%)
Alle 16-vuotiaiden henkilöiden lukumäärä
Osuus alle 16-vuotiaista (%)
Huomautus: Alle 16-vuotiaita koskevat lukumäärät ja osuudet esitetään vain, kun kokonaishenkilölukumäärän ja alle 16-vuotiaiden lukumäärän välinen erotus on vähintään 5 henkilöä.
Suurin osa ARA-vuokra-asunnoista pääkaupunkiseudulla on kaupunkien vuokra-asuntoja, joten tämän vuoksi "kaupungin vuokra-asunnot" in suluissa "ARA-vuokra-asuntojen" jälkeen tiedon nimessä.
ARA-vuokra-asuntojen asukkaita
Osuus ARA-vuokra-asuntojen asukkaista (%)
Mukana luvuissa ovat kaikentyyppisissä vuokra-asunnoissa asuvat eli sekä ARA-vuokra-asunnoissa asuvat (mukaan lukien korkotuetut vuokra-asunnot) että vapaarahoitteisissa vuokra-asunnoissa asuvat.
Vuokra-asunto on "uusi", mikäli sen rakennusvuosi on vuosi 2010 tai myöhempi vuosi. Muussa tapauksessa vuokra-asunto on vanha.
Uusien vuokra-asuntojen asukkaita
Osuus alueen uusien vuokra-asuntojen asukkaista (%)
Vanhojen vuokra-asuntojen asukkaita
Osuus alueen vanhojen vuokra-asuntojen asukkaista (%)
Tiedon rekisterilähde: Tilastokeskuksen FOLK tulotieto -tutkimusaineisto, muuttujan nimi aineistossa: Toimeentulotuet.
Sisältää sekä toimeentulotuen perusosan että “harkinnanvaraiset” osat: täydentävän ja ehkäisevän toimeentulotuen.
Toimeentulotukiin on laskettu yhteen näiden toimeentulotukien osien yhteenlaskettu summa vuonna 2020.
Toimeentulotukea saaneiden osuus (%)
Toimeentulotukien kokonaissumma (€)
Osuus alueen maksetuista toimeentulotuista (%)
Työttömyysturvaetuuksiin on laskettu yhteen saatujen eri työttömyysturvaetuuksien summa (sisältäen muun muassa maksetut työmarkkinatuet) vuonna 2020.
Työttömyysturvaetuuksia saaneiden osuus (%)
Työttömyysturvaetuuksien kokonaissumma (€)
Osuus alueen maksetuista työttömyysturvaetuuksista (%)
Tiedon rekisterilähde: Tilastokeskuksen FOLK tulotieto -tutkimusaineisto, muuttujan nimi aineistossa: Asumistuet.
Sisältää eri asumistuen muodot kuten yleisen asumistuen ja eläkeläisen asumistuen.
Asumistukiin on laskettu yhteen saatujen eri asumistukimuotojen summa vuonna 2020.
Asumistukea saaneiden osuus (%)
Asumistukien kokonaissumma (€)
Osuus alueella maksetuista asumistuista (%)
Palkka- ja yrittäjätulojen lähde on Tilastokeskuksen FOLK tulotieto -tutkimusaineisto, Palkkatuloja koskevan muuttujan nimi tässä rekisteriaineistossa on Palkkatulot ja yrittäjätulojen puolestaan Yrittäjätulot.
Palkka- ja yrittäjätulot -tieto on muodostettu laskemalla yhteen palkkatulot ja yrittäjätulot koko vuoden 2020 aikana.
Palkka- ja yrittäjätuloja koskevat tilastotiedot on koskettu rajaamaan 25–60-vuotiaita. Syy tähän on, että yleisesti koko väestössä alle 25-vuotiaiden palkka- ja yrittäjätulot ovat keskimäärin pieniä, joten alle 25-vuotiaiden mukaan ottaminen saisi näyttämään monen maahanmuuttajaväestön, joissa on suhteessa enemmän alle 25-vuotiaita kuin kantaväestöt, tulokset suhteessa heikommilta verrattuna kantaväestöön.
Palkka- ja yrittäjätulojen keskiarvo (€)
Palkka- ja yrittäjätulojen mediaani (€)
Työllisyysaste (%)
Työllisyysasteita koskevan tiedon rekisterilähde: Tilastokeskuksen FOLK perustieto -tutkimusaineisto, muuttujan nimi aineistossa: Pääasialllinen toiminta (TVM).
Työllisyysaste on laskettu sinä osuutena väestöstä, jolla pääasiallinen toiminta oli työllinen (vuoden 2020 lopussa).
Työllisyysaste kertoo tarkasteltavan väestön 18–64-vuotiaiden työllisyysasteen kunnassa vuoden 2020 lopussa.
Maksettuja kunnallisveroja koskevan tiedon rekisterilähde: Tilastokeskuksen FOLK tulotieto -tutkimusaineisto, muuttujan nimi aineistossa: Kunnallisvero.
Maksettujen kunnallisverojen keskiarvoja koskevat tiedot esitetään 18–64-vuotiaille vuoden 2020 osalta.
Kunnallisveroihin on laskettu yhteen henkilöiden maksamien kunnallisverojen yhteenlaskettu summa vuoden 2020 aikana.
Tieto koskee henkilöiden todellisuudessa maksamien kunnallisverojen summaa (sisältäen siten esimerkiksi erilaiset kunnallisveroja koskevat vähennykset).
Kunnallisverojen keskiarvo koko kaupungin kantaväestön keskiarvosta (%)
Osuus, jolla on 2. asteen tutkinto (%)
Koulutusasteita koskevan tiedon rekisterilähde: Tilastokeskuksen FOLK perustieto -tutkimusaineisto, muuttujan nimi aineistossa: Korkeimman tutkinnon suoritusaste.
Vähintään 2. asteen koulutuksen suorittaneiden osuus on laskettu sinä osuutena väestöstä, jolla korkeimman tutkinnon suoritusaste on vähintään toinen aste.
Ikärajaus koulutusastetta koskevien tulosten osalta on 25–60-vuotiaat. Erityisesti alaikärajalla (25-vuotiaat) varmistetaan se, että henkilöillä on ollut ikänsä puolestaa aikaa suorittaa vähintään 2. asteen tutkinto.