michalbcz / cetnost-jmen-a-prijmeni

Archiv dat četnosti jmen a příjmení jak byl zveřejňován ministerstvem vnitra do roku 2017 (před GDPR)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Úvod

Do roku 2017 Ministerstvo Vnitra ČR zveřejňovala statistiku četnosti jmen a příjmení. Zřejmě kvuli GDPR už to nedělají a od roku je 2018 je i původní stránka se soubory nedostupná.

Na původní stránce: https://www.mvcr.cz/clanek/cetnost-jmen-a-prijmeni.aspx je nyní (7.2.2024) toto:

Ministerstvo vnitra není oprávněno ke zveřejňování statistik / přehledů s charakterem statistik. 

Proto bylo zveřejňování těchto přehledů zrušeno.

Díky archive.org se k původním stránkám, včetně dat dostanete. (Doporučuji jim jednou za čas přispět nějakou drobnou finanční částkou na provoz.)

Toto je archiv s originálnimi daty. Jednotlivé soubory jsou v tomto adresáři a soubory jsou popsány tak jak bylo uvedeno na webu MVČR níže.

Použití data

Existuje řada zajímavých webu postavených na těchto datech.

Data

Autor: Odbor centrálních informačních systémů, 5. září 2017

Zdroj: https://web.archive.org/web/20180210214901/https://www.mvcr.cz/clanek/cetnost-jmen-a-prijmeni.aspx

Soubory s informativními údaji

Přehled jmen a lokalit (zip, 2,6 MB) cetnost-jmena-obec.zip

Přehled jmen a roků narození (zip, 1,8 MB) cetnost-jmena-dnar.zip

Přehled příjmení a lokalit (zip, 13,9 MB) cetnost-prijmeni-obec.zip

Přehled příjmení a roků narození (zip, 10,8 MB) cetnost-prijmeni-dnar.zip

Přehled lokalit a roků narození (zip, 55 kB) cetnost-obec-dnar.zip

Přehled četnosti všech příjmení (zip, 2 MB) (aktualizováno k 9/2017) zcpr.zip

Číselníky

Číselníky (xls, 827 kB, ke dni 1. 1. 2011) - cisloc.xls

Obsahují kódy pro všechny lokality; tyto kódy jsou pak použity ve vlastních souborech přehledů. Kód je jednoznačný. Naopak podle pouhého názvu obce Lhota nelze zjistit, o kterou Lhotu z celkem 25 se přesně jedná.

Popis tabulek

Kódy pověřených obcí (viz číselníky) jsou použity ve sloupcích i řádcích jednotlivých tabulek. Za skupinou kódů pověřených obcí jednoho kraje (v případě Prahy správních obvodů) následuje kódem uvedený součet za příslušný kraj (resp. Prahu). Závěrem jsou ve sloupci „0“ uvedeny počty osob, ke kterým nelze určit kód pověřené obce a ve sloupci „3000“ je republikový součet za příslušný řádek nebo sloupec. Poslední řádek každé tabulky je rovněž součtový, takže v jeho posledním součtovém sloupci je celkový počet obyvatel za ČR, kteří byli do přehledů zahrnuti.

Přehledy podle roku narození mají rok uvedený v hlavičce a jsou vytvořeny vždy pro 120 roků podle následujícího pravidla. Předposlední sloupec obsahuje aktuální rok zpracování a poslední sloupec označený “3000“ je součtový za řádek tabulky. 1. konkrétní rok je ve 2. sloupci tabulky a jeho hodnota je dána výpočtem: 1. rok = aktuální rok–118. Nyní v roce 2013 je to 1895 = 2013-118. V 1. sloupci tabulky označeném „0“ jsou pak zahrnuty všechny roky menší než 1. konkrétní rok ve 2. sloupci. V dalších sloupcích následují roky až po rok aktuální.

Pokud tabulka překračuje rozsah 65000 řádků je rozdělena právě po 65000 řádcích z důvodu bezproblémového zpracování v EXCELu do listů.

About

Archiv dat četnosti jmen a příjmení jak byl zveřejňován ministerstvem vnitra do roku 2017 (před GDPR)