为进一步完善名录库动态维护更新机制,加强基本单位名录管理,自治区统计局派员参加国家统计局组织的首批五经普数据建模,完成全区企业活跃度模型构建工作,为提高名录库数据质量奠定坚实基础。
一、聚焦“组织引领”,为建模工作强保障
构建企业活跃度模型是名录库动态维护更新机制改革重要内容,为高质量做好企业活跃度模型构建工作,有效解决基层调查人员力量与巨量调查单位不匹配问题,自治区统计局强化组织领导、高位推动,全力保障建模工作稳步推进。一是认真学习《名录库动态维护更新机制应用业务方案》,研究模型训练集合并规则、特征值筛选等关键内容,确保模型构建工作质量;二是紧盯责任分工,迅速安排部署,抽调业务骨干赴国家统计局参与建模,确保如期完成模型构建工作;三是紧抓任务落实,夯实工作基础,围绕数据准备、数据质量审核、参数调整以及阈值确定等多环节,确保基础工作扎实有效。
二、聚焦“行动破题”,为精准模型求实效
为充分利用行政资料和各类统计资料精准测算规模较小企业的活跃状态,代替开展调查,自治区统计局破解难题出实效,一是通过大数据统计分析方法对五经普时点数据进行全面机器学习,利用模型预测企业活跃度,并对疑似不活跃单位开展抽样调查,从而提高名录库维护更新的工作效率与数据质量;二是选取市场监管部门登记和年报信息的特征值,依据数据分布情况确定分桶点来建立模型,反复调整模型指标内容、类型、分桶策略、缺失值策略、奇异值和异常单位处理策略、模型参数等配置,显著提升了模型准确率、精确率、召回率、真负率及ROC表现;三是结合2023年度税务部门提供的纳税信息,确定符合全区实际的活跃阈值和不活跃阈值,划定了基层开展核实的范围,为精准开展统计调查提供了有力支撑。
三、聚焦“思维共振”,为测算质量出实招
为提高企业活跃度模型的科学性和准确率,自治区统计局集智聚力谋实招,一是积极向国家统计局专业人员请教,掌握建模关键要领,明确重点环节,为快速熟悉和掌握模型训练方法奠定良好基础;二是加强与其他省份的沟通联系,就模型数据集和特征值的选取、分类器和深度的设置、分桶点优化等内容进行多细致探讨,进一步提高模型测算质量;三是坚持问题导向,根据不同指标、参数测试38次,全面梳理总结训练集模型测算结果,最终内蒙古企业活跃度模型测算准确率高于全国平均水平,为全国各省建模提供可借鉴经验。