第四次全国经济普查个体经营户
抽样调查方案
为做好第四次全国经济普查个体经营户抽样调查工作,根据《第四全国经济普查方案》,制定本方案。
一、调查目的
在第四次全国经济普查中,以各省(自治区、直辖市)为总体,抽取一定数量的个体经营户作为样本对其主要经济指标进行调查,用于推算全国和省级总体个体经营户主要经济指标总量数据,同时兼顾省内推算分主要行业门类和分市(地、州、盟,以下简称地市)个体经营户主要经济指标总量数据的需要。
二、总体单位及抽样框
总体单位是各省(自治区、直辖市)范围内所有从事第二产业或第三产业生产经营活动的个体经营户,包括个体工商户和其他个体经营户。其中,个体工商户是指按照《个体工商户条例》规定,依法在市场监管部门登记注册、开展经营活动的个人或家庭;其他个体经营户是指未在市场监管部门登记注册,但有相对固定场所、实际从事二、三产业经营活动且一年内累计经营三个月以上的个人和家庭户,但不包括农民家庭以辅助劳力或利用农闲时间进行的一些兼营性的工业、商业及其他活动。符合上述定义的所有个体经营户构成抽样总体。
利用个体经营户于清查摸底阶段开展的“地毯式”清查数
- 3 -
据1,从中去除从业人员人数在一定规模以上及纳入税务部门一般纳税人管理的个体经营户(纳入全面调查),然后将个体经营户的户数、从业人员人数等信息加工汇总到每个普查小区的层级,构建以普查小区为地域范围的抽样单元,形成省级总体的整群抽样框。
三、调查内容和时间
调查内容包括个体经营户主要经济指标。具体内容包括:个体经营户全年雇用雇员的总支出、缴纳税费、缴纳房租、经营总支出、营业收入、固定资产投资支出等经济指标,以及个体运输户拥有的营业性货运车辆数、全年货运量。调查表式参见《个体经营户抽样调查表》(612表)。
调查时点数据为2018年12月31日,调查时期数据为2018年1月1日-12月31日。
四、抽样方法
以省(自治区、直辖市,以下简称省)为总体,综合考虑抽样设计效率和调查组织方式,采用划分全面调查层和抽样调查层的抽样设计,将单位清查资料中从业人员数达到一定规模以上或者纳入税务部门一般纳税人管理的个体经营户(以下简称规模以上个体经营户)作为全面调查层进行全面调查,将从业人员数在规模线以下且未纳入税务部门一般纳税人管理的个体经营户(以下简称规模以下个体经营户)作为抽样调查层进行整群抽样调查。
1
其中个体运输户名录来自交通运输部门有关行政记录。
- 4 -
具体整群抽样方法是:将每个县作为一层2,每层内按照与普查小区从业人员数的规模成比例的概率抽样方法(即PPS系统抽样方法)抽取普查小区,再对抽中的普查小区内所有规模以下个体经营户进行调查。
层内PPS系统抽样实施办法:首先对层内普查小区采用一定的标识进行降序或升序排列,然后按照以下两个步骤进行样本普查小区的抽选。
1.计算入样概率i。抽样设计变量是每个普查小区的从业人员人数即“规模度量”,令层内普查小区样本量为n,层内第i个普查小区的“规模度量”的大小为Li(i1,2,L,N),层内“规模度量”从业人员人数总和为L0普查小区的入样概率i为:
NL,定义zL/L,第i个
iii0i1Liinzin (公式1)
L02.样本抽选。对层内排序后第1个普查小区赋以1L1共L1个代码;对第2个普查小区赋以L11L1L2共L2个代码,……,对第i(i1)个普查小区赋以Lj1Lj共Li个代码。令
j1j1i1iL0PPS系统抽样间隔k取最接近于的整数。从1~k范围内随
n机地产生一个整数r作为抽样起点,则代码
2
对于没有下辖县级行政区划的地级市,将其视与县级单位相平行的一层。
- 5 -
r,rk,L,r(n1)k所在代码区间的普查小区被抽中,总
共抽出n个样本普查小区。
五、样本量的测算与分配 (一)抽样精度
以省为总体控制核心指标(营业收入)的抽样精度,要求在95%置信度下,全省个体经营户营业收入的相对标准误控制在5%以内。
(二)省级样本量的测算
省级总体普查小区样本量n的测算可根据清查摸底得到的个体经营户总体辅助信息,先按照简单随机抽样方法计算普查小区初始样本量n0,再按分层PPS系统抽样相对于简单随机抽样的设计效应3Deff进行放大。
1.简单随机抽样的样本量
*Ns2n0 (公式2) 22N(Cvx)s其中,N为省级总体的普查小区总数,s是省级总体普查小区个体经营户从业人员数的方差,x是普查小区从业人员数平均数,Cv为95%置信度下的相对标准误控制要求。
3
2设计效应指备选抽样设计估计量的方差除以相同样本量下简单随机抽样估计量的方差。
- 6 -
2.分层PPS系统抽样的样本量
省级总体样本量按照分层PPS系统抽样的设计效应Deff等于0.8~1对样本量进行测算,考虑到从业人员的变异程度与营业收入的变异程度之间存在一定差异,实际调查的样本量要适当大一些,因此取Deff上限作为省级总体样本量测算的依据,于是省级总体需要抽选普查小区的样本量n为:
*n*n01 (公式3)
(三)最终样本量的确定
省级总体中各层的普查小区样本量,原则上应按照摸底清查中掌握的各层个体经营户从业人员总数占省级总体个体经营户总的从业人员数量的比例进行分配。实际工作中,考虑到各层包含的普查小区总数存在差异,在测算得到的省级样本量基础上,还需要结合一些经验做法对按比例分配到的各层样本量进行适当调整,使各层样本量分配结果更适合实地调查工作的组织实施,经过调整的各层样本量汇总既可得到各省的最终样本量。
1.分层样本量的比例分配
假定某省经测算后的省级样本量为n,其中第m个层个体经营户从业人员总数为Lm,该省个体经营户总的从业人员数为
- 7 -
*L。于是,该省每个层的样本量分配方式如下:
Lmnmn (m1,2,3L,k) (公式4)
L*2.分层样本量的调整
结合前期测算经验数据和试点数据,并考虑到各县的调查工作量的相对均衡,各县的普查小区样本量应当控制在4到10个之间,即经过初次分配的县级样本普查小区数不足4个时,该县要按4个抽取;经过初次调整后的县级样本普查小区数大于10个时,该县要按10个抽取。
对于没有下辖县级行政区划的地级市层,考虑到数据推算需要,建议其普查小区样本量按县级最低样本量的3至4倍进行把握,即在12到16个之间。
六、样本抽选及调查
在实施PPS系统抽样前,对总体单元即普查小区按行业特征及从业人员数进行排序,以达到按主要行业进行潜在分层的目的。具体方法例示如下:
利用摸底清查资料对某省规模以下个体经营户分户数据进行统计,选择出该省个体户户数最多的9个主要行业(门类)(比如批发和零售业,交通运输、仓储和邮政业,住宿和餐饮业,制造业,居民服务、修理和其他服务业,租赁和商务服务业,建筑业,文化、体育和娱乐业,卫生和社会工作),用于各县内普查小区的进一步排序。
- 8 -
省级总体抽样框中各普查小区先以所在县的行政区划代码由小到大进行排列,各县内的普查小区排序方式如下:(1)按本省个体经营户所从事的9个最主要行业以及其他行业(其余各行业合并),计算以普查小区为单元的上述各主要行业的从业人员占本普查小区总从业人数的比例,把普查小区为单元的从业人员占比最高的那个行业选出来,作为这个普查小区的优势行业;(2)在每一个县内,将所有普查小区按照该普查小区的优势行业归类,同一优势行业的普查小区排列在一起形成一个行业区块,结果每个县由10个行业区块组成;(3)行业区块内普查小区的排序,按照每个普查小区从业人员数由多到少进行降序排列。在完成上述以普查小区为单元的省级总体抽样框排序基础上,就可以进行PPS系统抽样了。
各省样本普查小区的抽选,由国务院第四次全国经济普查领导小组办公室(以下简称国务院经普办)开发的抽样程序自动实现。
实地调查分为两部分:一是对于全面调查层的“规模以上个体经营户”,在全省范围内,对每个普查小区内符合条件的个体经营户都进行访问登记;二是对于抽样调查层的“规模以下个体经营户”,在被抽中的样本普查小区内对普查时点所有规模以下个体经营户进行访问登记4。
实地调查由普查员使用手持移动终端(PAD)进行现场数据采集。
4
调查对象包含营运证照注册地在抽中普查小区的个体运输户。
- 9 -
七、样本权数与调整 (一)抽样设计权数
若省级总体共有k个县,第m个县的样本普查小区个数为
Lminm,第m个县第i个样本普查小区入样概率minm,
Lm0m1,2,Lk, i1,2,Lnm则第m个县第i个样本普查小区的抽样
设计权数为
1Lm0wmi = (公式5) minmLmi整群抽样中同一样本普查小区内的每个个体经营户具有相同的设计权数wmi则第m个县第i个样本普查小区第j个个体经营户的设计权数wmijwmi。
(二)样本权数的调整 1.抽样框辅助信息调整
实地调查时,样本普查小区内个体经营户的从业人员数一般会与摸底清查时该个体经营户的从业人员数不一样,即存在普查登记时点较清查时点个体经营户从业人员数发生变化的情况。在假定每个县内的个体经营户从业人员数从摸底清查到普
- 10 -
查登记期间近似不变的情况下,用清查摸底时点的从业人员数与普查登记时点的从业人员数之比构建a类加权调整系数Aa。
LmiAa* , m1,2,Lk (公式6)
LmiLmi是第m个县第i个样本普查小区在摸底清查时点上式中,
mL*的从业人员数,mi是第个县第i个样本普查小区在普查登记时
点的从业人员数。利用调整系数Aa对设计权数wmij调整后的权: 数为wmijwmijAa (公式7) wmij 2.单位无回答调整
实际调查中,抽中普查小区中的个体经营户会存在一定的不配合或无法取得调查数据即单位无回答的情况,这时在省级层面可利用全省调查数据对设计权数进行无回答调整。无回答调整通常按照调整类别进行修正,调整类别是对总体按照一定的无回答模式进行的分类,比如按照个体经营户的行业类别对无回答情况进行分类,按每一分类计算无回答的b类加权调整系数Ab。
Ab(Iwx)(bIwx) (公式8)
mijmijmijmijmijmijmijmijmij- 11 -
上式中,bmij表示第m个县第i个样本普查小区第j个个体经营户现场调查阶段是否取得调查数据,如有回答则等于1,否则等于0。Imij表示第m个县第i个样本普查小区第j个个体经营户是否属于某一无回答调整分类,属于则等于1,否则等于0。xmij表示第m个县第i个样本普查小区第j个个体经营户清查时是经过a类加权调整后的权数。 点从业人员数。wmij: 经过a类和b类加权调整后的权数为wmij
wmijAbwmijAaAb (公式9)wmij
3.样本结构调整
由于采用分层系统PPS设计抽取样本普查小区,最终个体经营户从业人员的样本结构加权分布与总体结构分布可能会不一致。根据省级总体抽样设计对分主要行业和分地市目标量的推断需求,采用省级总体从业人员数按主要行业和地市的交叉分组数据,对个体经营户样本权数结构进行c类加权调整。引入
c类加权调整系数Ac,定义如下:
ˆX/(cxw) (公式10) /XAcXcccmijmijmijm1i1jknm上式中,cmij表示第m个县第i个样本普查小区第j个个体经营户是否属于某个主要行业与地市交叉分组(如第c个主要行
业与第d个地市交叉分组),若属于则等于1,否则等于0。Xc- 12 -
是抽样框中第c个主要行业与第d个地市交叉分组的从业人员
ˆ是采用c类加权调整前的权数推算得到的第c个主要总数,Xc行业与第d个地市交叉分组的从业人员数估计值。xmij表示第m个县第i个样本普查小区第j个个体经营户清查时点从业人员数。
:经过a类、b类和c类加权调整,得到样本最终权数为wmij wmijAcwmijAbAcwmijAaAbAc (公式11) wmij 八、总量与方差估计 (一)总量估计
对个体经营户营业收入、经营总支出等主要经济指标总量的推算,一是用于满足全国及省级总体的总量估计,二是满足全国及省级总体各主要行业的总量估计,三是满足省级总体各地市的总量估计。对以上各类总量估计均等于“规模以下个体经营户”抽样部分与“规模以上个体经营户”全面调查部分之和,其中,“规模以下个体经营户”抽样部分,采用由整群调查取得的个体经营户分户数据通过最终权数加权求和进行推算;对于“规模以上个体经营户”全面调查部分,只需要进行逐户
- 13 -
调查数据的汇总即可5。
1.抽样部分总量估计
各层(县)的抽样部分总量估计为:
ˆyw , (m1,2,L,k) (公式12) Ymmijmiji1jnm省级总体的抽样部分总量估计为:
ˆYˆ= yw (公式13) Ymmijmijm1m1i1jkknm省内分主要行业子总体的抽样部分总量估计为: ˆyCw (公式14) Ycmijmijmijm1i1jknmCmij表示第m个县第i个样本普查小区第j个个体经上式中,
营户是否属于第c个主要行业,若属于则等于1,否则等于0。
省内分地市子总体的抽样部分总量估计为:
ˆyDw (公式15) Ydmijmijmijm1i1jknm上式中,Dmij表示第m个县第i个样本普查小区第j个个体经营户是否属于第d个地市,若属于则等于1,否则等于0。
5
对全面调查的“规模以上个体经营户”中“无回答”个体经营户的处理,可采用该个体经营户的税务资料或者省内相同行业规模相近的个体经营户资料进行弥补。
- 14 -
2.完整总量估计
各层(县)的完整总量估计为:
% (公式16) ˆYˆYYmmm%表示第mˆ表示第m个县抽样部分的总量估计,YY上式中,mm个县“规模以上个体经营户”全面调查部分的汇总数。
省级总体的完整总量估计为:
ˆYˆ (公式17) Ymm1k同理,省内分主要行业子总体的完整总量估计为:
% (公式18) ˆYˆYYccc省内分地市子总体的完整总量估计为:
% (公式19) ˆYˆYYddd(二)方差估计
由于“规模以上个体经营户”全面调查部分不存在抽样误差,上述总量估计的方差仅来自于抽样调查部分。下面以省级总体总量的方差估计说明计算过程。
1.层(县)内总量估计量的方差估计
按照层内PPS系统抽样方法对本层(县)的总量进行方差
- 15 -
估计,对第m个县的总量估计的方差估计量为:
ˆ)(1v(Ymi1nmminm1)(nm(nm1)i1nmnm (ymij)jmiˆ)2Ym
(公式20)
ˆ是公式12已给出的估计量,nm是第m个县抽上式中,Ymymij是第m个县第i个样本普查小区第j个选的普查小区样本量,
个体经营户的调查指标值,mi是第m个县第i个样本普查小区的入样概率。
在上述对设计权数wmij进行调整的情况下,普查小区的入样
1wmi所取概率仅考虑在普查小区层面的调整,因此mi由mi代(调整后权数参见公式7)。
2.省级总体总量估计量的方差估计
由于各层(县)是独立的,因此各层方差估计之和即为总体总量的方差估计。
mˆ)v(Yˆ) (公式21) v(Ym在实际工作中,方差估计一般使用统计软件(如SAS、
STATA等)采用复杂样本的方差估计技术(如“自助法”或“刀
- 16 -
切法”等)进行方差估计。
3.估计量的精度评价
采用计算相对标准误的方式对总量估计进行精度评价。省级总体完整总量估计的相对标准误Cv的计算方法如下: ˆ)v(Yˆ)Cv(Y100% (公式22) ˆYˆ为省级总体完整总量估计,其估计量的方差为上式中,Yˆ)。 v(Y对于分主要行业子总体和分地市子总体的有关指标总量估计的方差估计和相对标准误计算过程,与上述计算过程完全类同。
九、组织实施
第四次全国经济普查个体经营户抽样调查方案由国务院经普办统一设计、统一布置和培训,在全国个体经营户摸底清查工作完成并按要求上报数据后,由国务院经普办统一组织各省级普查机构开展“规模以上个体经营户”的确认和样本普查小区的抽选工作。各地普查机构负责组织开展“规模以上个体经营户”和样本普查小区内的“规模以下个体经营户”的数据采集和上报工作。各级普查机构应当严格执行《普查全面质量管理办法》的有关规定,确保调查数据真实准确。
- 17 -
因篇幅问题不能全部显示,请点此查看更多更全内容