这里收集了从1980年到当前的行政区编码数据,数据来源为民政部官网。创建这个仓库主要有下面两个目的:
- 备份数据。
- 因为民政部每次更新数据都历史编码会丢失,这会导致历史编码的身份证解码出错,为了避免这个问题,这里用一个简单的脚本进行合并去重,提供给github.com/sleagon/chinaid这个包使用。
city.raw.txt 是原始数据 city.fmt.txt 是去重并格式化以后的数据
cat city.raw.txt| egrep '^[0-9]+\s+.*' | awk -F '[ \t]+' '{print $1,$2}' | sort -n -k 1 -u | awk '{ printf ("%d:\"%s\",\n", $1, $2) }' > city.fmt.txt
每次更新过程很简单,分为下面三步:
- 去民政部官网下载最新的需要插入的文本,比如2019年的:http://www.mca.gov.cn/article/sj/xzqh/2019/201901-06/201905271021.html ,把复制的文本直接插入到city.raw.txt的最前面即可。
- 执行
bash fmt.sh
。 - 提交代码。