中心邮箱: 用户名 密码
用户登录 用户注册 设为主页 添加收藏
首页 | 社会现象 | 学科·学界 | 文章·争鸣 | 读书 | 文献服务 | 数据服务 | 中心网刊 | 网上调查 | Blog | 社会论坛
  | 频道首页基础数据 | 普查数据 | 专题数据 | 调查数据 | 
当前位置:社会学人类学中国网 >> 数据服务 >> 第五部分 调查方法 >> 正文
数据搜索
使用方法

  • 您在使用该数据的时候,既可以点击”数据内容“菜单浏览文字版的数据内容或者数据介绍,也可以通过点击”附件浏览“按钮浏览、阅读、下载数据附件内容。

  • 浏览附件时,建议您首先下载到本地硬盘,然后再用相关工具进行阅读。系统不建议在浏览器中直接打开阅读。

  • 如果附件无法阅读,请向系统管理员反映,以便本站查询与修正有关问题。
  • 版权声明

  • 本站所提供的所有数据资源等,除非特别声明,均受到版权法等相关法律保护,您应该合法使用这些数据,尊重所有者的相关权益,特别严禁商业使用。

  • 本站所提供的数据资源,来自于多种渠道,仅为学习与研究之用,本站不负责任何版权事宜,数据所有权利均归原所有者所有。如果需要用于其它用途,请直接与该数据所有人联系。

  • 如果您发现我们提供的数据资源侵犯了您的相关权利,请与我们联系,我们将在核实后即刻删除。
  • 第五部分 调查方法

    基本信息  
    所属数据项目:第16次《中国互联网络发展状况统计报告》
    数据来源:中国互连网络信息中心(CNNIC)
    数据提交时间:2005年12月31日 03:49

    数据内容  

        依据统计学理论和国际惯例,在前15次调查工作基础之上,本次调查采用了计算机网上自动搜寻、网上联机、网下抽样、相关单位上报数据等调查方法。

        一、域名数、网站数调查

        (一)我国的通用顶级域名对应的网站数:

        通过各通用顶级域名注册单位协助提供。这些数据包括:所有有网站(即有WWW服务)的通用顶级域名(gTLD)总数、所有有网站的通用顶级域名(gTLD)按.com、.net、.org分类的数目、所有有网站的通用顶级域名(gTLD)按注册单位所在省份分类的数目。

        (二)我国的CN域名数及对应网站数:

        采用计算机网上自动搜索可得到如下数据:CN下的域名数及地域分布情况;CN下网站数及其地域分布情况。

        (三)我国网站总数、CN域名总数:

        将以上(一)、(二)两部分的相关数据分别相加,即可得到我国的网站总数、分类及其地域分布,CN域名总数、分类及其地域分布。

        二、网上联机调查

        网上联机调查重在了解网民对网络的使用情况、行为习惯以及对热点问题的看法和倾向。具体方法是将问卷放置在中国互联网络信息中心的网站上,同时在全国各省的信息港与较大ICP/ISP上设置问卷链接,由互联网用户主动参与填写问卷的方式来获取信息。

        中国互联网络信息中心在2005年6月10日~6月30日进行了网上联机调查。调查得到了国内众多知名网站、媒体的大力支持,国内许多知名网站均在主页为本次联机调查问卷放置了链接。本次网上联机调查共收到调查问卷20501份,经过有效性检查处理得到有效答卷18136份。    

        三、网下抽样调查

        网下抽样调查侧重于了解中国网民的总量、相关的特征及行为特点等。

        (一)调查总体

        本调查的目标总体有两个,一是全国有住宅电话的6岁以上的人群(总体A);另一个总体是全国所有高等院校中的住校学生(总体B)。目标总体采用电话调查的方式。在对全国结果进行推断时,将两个子样本的统计量应用加权公式进行汇总。

        (二)总体A抽样方法

        按照科学性和可操作性相结合的原则,我们对总体A按省(含省、直辖市、自治区)进行分层。

        ◇ 抽样指标的确定

        从全国的情况来看,各省的城市住宅电话与乡村住宅电话的比例差异很大,由于城市与农村家庭的平均人口数差异很大,所以在确定各省样本量以及用各省数据推断全国时,我们考虑的指标是"拥有住宅电话的人数(或称住宅电话覆盖的人数)";在确定各省中地市的样本量时,我们采用地市的"家庭户数"作为抽样指标。

        ◇ 样本量

        本次调查样本量为5000个。满足在置信度95%,设计效应为2.5的情况下,最大允许绝对误差小于3%。各省的样本量按各省"住宅电话覆盖的6岁以上的人口数占全国的比例"分配。

        ◇ 省内各地市的抽样方法

        采用分层抽样、PPS抽样方法相结合的方法。

        第一步:每省中,省会城市和副省级城市为一层,其他城市为另一层。省会和副省级城市层中所有城市都被抽中,另一层中按抽样指标运用PPS抽样方法抽取5~6个地市(此处的地市包括地级市和地区行署,每个地市下都包含城镇和乡村,为不引起歧义,以下简称为地市)。不同层间按照该层家庭户数占该省家庭户数的比例分配样本量,省会和副省级城市层内按照该城市家庭户数占该层家庭户数的比例分配样本量,另一层在每个被抽中的地市间平均分配样本量。

        抽取地市的方法:在各省中抽取地市,省会和副省级城市层中所有城市都被抽中,另一层按照PPS抽样方法进行抽样,抽样指标为"家庭户数",每个地市被抽中的概率等于该地市"家庭户数"与该层"家庭户数"之比。利用EXCEL软件产生0~1之间的均匀分布的随机数,根据随机数落在各地市对应累计百分比的范围,抽取5~6个地市。如果一个地市被抽到两次以上,则该地市样本量相应加倍。例如:某地市被抽中一次,样本量为N个,如果该地市被抽中两次,则样本量为2N个。

        第二步:获得抽中地市的所有电话局号,根据该地市的局号生成电话号码库。电话号码中除局号外的后4位或后3位数字,由随机数生成。

        第三步:确定调查对象,在电话拨通后,把接听电话的人作为被访对象,先询问家庭基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料和家庭其他成员的最简要资料。如果他(她)不上网,但家中有人上网,则再随机抽取一名上网的成员来接听电话,回答有关上网的问题以及自己的个人基本资料。

        ◇ 全国加权方法

        对全国的推断采用对各省的调查结果进行事后加权处理的方法。

        (三)总体B抽样方法

        按照科学性和可操作性相结合的原则,我们对总体B按省和学校(本科、专科)进行分层。

        ◇ 抽样指标的确定

        总体B为全国所有高等院校中的住校学生,我们就用"在校大学生人数"作为抽样指标。在校学生包括:普通本科生;普通专科生*;硕士研究生;博士研究生。

        *注:专科层次的高校,只有普通专科生

        ◇ 样本量

        本次调查抽取全国200所学校,学生样本量为4000个,并按各省"在校大学生数占全国在校大学生总数的比例×200"分配各省的学校样本量。

        ◇ 省内学校的抽样方法

        采用分层抽样、PPS抽样方法相结合的方法。

        第一步:确定每层应抽取的学校数、学校及宿舍数。按照分层抽样,每层应抽取的学校数目=该层学生数占全国学生总数的比例×200。按照PPS抽样方法,确定每层中抽取的学校,抽样指标为在校学生人数。每所学校抽取20个宿舍。

        第二步:获得抽中学校的所有宿舍电话局号,根据该学校的所有宿舍电话局号生成电话号码库。电话号码中除宿舍局号外的后四位或后三位数字,由随机数生成。利用每个学校的宿舍电话抽样框,随机抽取宿舍电话进行拨打,每个宿舍电话只访问一人,直到调查了20个宿舍为止。

        第三步:确定调查对象,在电话拨通后,只要接听电话者为本校学生(排除在大学生宿舍居住的社会人员),即可询问宿舍基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料。

        通过以上方法确定了调查对象后,分别对有住宅电话的住户和在校大学生进行电话访问,经过事后加权得出总体A和总体B,最后将这两部分调查结果综合加权计算以后即得到中国网民的总量、相关特征、行为特点等数据。

        (四)抽样调查成功率

        按美国舆论研究协会(AAPOR)的成功率公式三计算,本次抽样调查的成功率为38%。

        (五)数据预处理

        在数据处理之前,对数据中变量的取值、变量之间的逻辑关系等进行检查,对其中的不合格样本进行了核对、删除和补充,并对部分变量进行了事后编码。

        在统计报告中有一些平均数(比如每周上网小时数、每周上网天数、邮件账号数、收发电子邮件数等),在计算这些平均数前,首先采用以大于或小于平均数的三个标准差和检查观测量的各变量之间的逻辑关系等方法对数据中的异常值进行排除。


    【字体:

    附件下载  

    | 中心简介 | 网站介绍 | 版权声明 | 服务条款 | 站点导航 | 请您留言 | 网站地图 | RSS聚合资讯