News
Conference

趣赢平台 @ 2021年联合统计会议(JSM)

July 30, 2021

联合统计会议(JSM), 将于8月8日至12日举行, 2021, 是世界上最大的统计事件之一吗. 超过13个专业协会参加, 这次会议汇集了6个国家,来自52个国家的500多名与会者, 80+ exhibitors, 1,000+ student attendees, 75多家雇主招聘200多个职位. 无论是虚拟的还是面对面的,韦斯特都会继续为这次活动提供前沿的研究.

“Each year, JSM为所有人提供了一个绝佳的机会,让我们与来自全国和全球的同事们聚在一起,建立联系,趣赢平台副总裁杰里·穆洛(Jeri Mulrow)说, 统计和评估科学主任. “面对2020年前所未有的挑战, 韦斯特的统计学家和数据科学家正在分享创新的想法和方法,这些想法和方法帮助我们推动了这一领域的发展, 满足客户研究需求, 加强全民统计研究.”

了解更多我们如何帮助您应对项目挑战. 查阅专家指引(PDF), 这说明了我们的多模式能力和创新方法来推进数据收集科学. 

This year, 本着本次活动“统计”主题的精神, Data, and the Stories They Tell, 我们在下面分享一些统计数据和数据故事. (注:*表示主讲人.)

Sunday, August 8, 2021: 3:30-5:20 pm(美国东部时间):纵向调查微数据中重新识别风险的估计方法[j] .李建柱*, Lin Li, Tom Krenzke

保护调查对象的机密数据至关重要. 统计数据产品发布前, 需要进行风险评估,以确保披露风险处于可接受的低水平. In longitudinal surveys, 因为同样的受访者参与了不止一波的调查, 重新识别的风险通常高于横断面数据的风险. 不随时间变化或模式变化的公共变量可能允许用户将单个文件中的记录连接起来,形成纵向记录. Here, 我们分享一个调查示例来演示使用对数线性建模方法来测量重新识别风险,同时结合数据的纵向性质, 相对于横向风险,哪一种方法可以衡量纵向风险的增加.

Tuesday, August 10, 2021: 10-11:50 am(美国东部时间):利用行政数据提高儿童乘客安全:Elizabeth Petraglia*

Administrative, or “found,” data (tax records, sensor data, 交易收据)已成为研究的共同资源. 但是,其他数据来源可以帮助研究人员在提高统计效率和降低成本的同时,经常得出更详细的结论. We introduce, for example, 国家数字汽车座椅检查表(NDCF), 在一次典型的汽车座椅检查过程中,收集有关儿童乘客安全的详细和方便用户的行政数据. 在这里,我们探讨了NDCF的数据提供和一些创新方法, 比如基于可视化和个性化的仪表板, 用于将NDCF数据分发给具有不同数据素养的用户. 我们将NDCF与选定的cps相关调查和观察性研究进行比较, 根据覆盖范围评估每个来源的优势和局限性, detail, data quality, and sample size. 最后,我们将为该领域的实际应用提供建议, 包括将基于调查的数据与国家发展基金相结合的探索性工作.

Wednesday, August 11, 2021:下午1:30-3:20(美国东部时间):当采样后合格框架信息可用时,为PPS样本创建基本权重和复制权重,并添加补充样本:陈建茹*, Ismael Flores Cervantes, Mike Kwanisai

当回复率低或不合格率高时,在调查中使用补充样本来增加样本量. 在选择了主样本之后,没有直接的方法来绘制与大小成比例的系统概率(PPS)样本设计的补充样本. 我们研究了一种情况,即在主样本选择之后,但在绘制补充样本之前,在已知的采样框架中存在大量不合格的情况. 通过随机偏移主样本区间的随机起点,绘制一个不重叠的补充样本. 我们探索和评估了几种创建基本和复制权重的方法,这些方法正确地反映了该设计的方差估计. 最后,我们用蒙特卡罗模拟比较了这些方法的经验偏差和方差.

Wednesday, August 11, 2021: 1:30-3:20 pm(美国东部时间):两种CHAID软件包在调查非响应建模中的比较:林天焕*, Carlos Arieira, Ismael Flores Cervantes, Mike Kwanisai

当涉及到单元无响应时, 通常的做法是通过建模反应倾向和调整权重来减少偏差,以解释不同的反应倾向. CHAID(卡方自动交互检测器)算法通常用于为此目的生成权重类, 这让我们分析了两个流行的实现CHAID算法的软件包:SI-CHAID和HPSPLIT. 我们将通过使用复杂调查样本设计的模拟来检查包装的互换性,根据加权估计的结果偏差和方差来描述两种包装的优点和缺点.

Wednesday, August 11, 2021:下午1:30-3:20(美国东部时间):区域样本设计中从人口普查块中形成分段的方法的评估:Jennifer Kali*, Tom Krenzke, Ying Chen, Jianru Chen, Jim Green

亲自调查通常采用多阶段抽样设计,在称为分段的地理区域内对家庭进行抽样, 通过限制数据收集器的地理范围来提高成本效率. 通常,区段是由相邻的人口普查块分组形成的. 合并相邻人口普查块的一个简单方法是按人口普查块ID对人口普查块文件进行排序, 这通常会创建不连续的段, 不完整(含孔), and not compact. 在确定样本框架中包含哪些住房单元时,连续性和完整性问题给数据收集人员带来了挑战. 不紧凑的部分增加了面试官的旅行成本. 我们将回顾形成分段的其他方法, 根据邻近度对每一种排序方法所形成的片段进行评价, completeness, compactness, 段间方差, 并将介绍使用所有4种排序方法的分段形成算法.

Wednesday, August 11, 2021:下午1:30-3:20(美国东部时间):聚类样本设计下的调查无响应建模:分类和回归树方法比较:Michael Jones*, William Everett Cecere, Tien-Huan Lin, Jennifer Kali, Ismael Flores Cervantes

计算调查权值,用于分析复杂的抽样调查数据, 通常对无响应进行调整以减少估计的偏差. 您可以使用许多算法和方法对这些调整的调查非响应进行建模. What’s the best approach? 在处理复杂的聚类样本设计时,我们深入研究并比较选择的算法. 我们还评估了基于分类树的方法在高响应和低响应设置中减少非响应偏差的效果, 并研究了这些方法在调整调查权重时的性能. 在使用聚类样本的调查中,使用这些方法来估计反应倾向的好处和局限性是什么? We discuss them, too.

Capabilities

Statistical Methods

News

与我们的专家深入探讨

view all news

How can we help?

我们欢迎来自求职者、合作者、潜在客户和合作伙伴的信息.

Get in Contact

Want to work with us?

You’ll be in great company.

Explore Careers
Back to Top