five

การประมาณขนาดประชากรโดยใช้ตัวแบบปัวซงนัยทั่วไป

收藏
DataCite Commons2023-01-20 更新2025-04-16 收录
下载链接:
http://doi.nrct.go.th/?page=resolve_doi&resolve_doi=10.14457/TU.the.2022.52
下载链接
链接失效反馈
官方服务:
资源简介:
วิธีจับ-จับใหม่ เป็นวิธีที่ใช้ในการประมาณขนาดประชากรที่หน่วยตัวอย่างมีลักษณะยากต่อการพบเจอ โดยข้อมูลที่ศึกษาด้วยวิธีจับ-จับใหม่ เป็นข้อมูลนับที่แทนจำนวนครั้งที่หน่วยตัวอย่างถูกสำรวจพบในช่วงระยะเวลาที่ทำการศึกษา จึงนิยมใช้การแจกแจงปัวซงที่มีพารามิเตอร์ lambda ในการอธิบายความน่าจะเป็นของข้อมูล แต่อย่างไรก็ตามการแจกแจงปัวซงอาจจะไม่เหมาะสมในกรณีที่ข้อมูลนับมีค่าเฉลี่ยที่ไม่เท่ากับความแปรปรวน เราเรียกกรณีนี้ว่า ข้อมูลนับมีกการกระจายเกินเกณฑ์หรือต่ำกว่าเกณฑ์ ซึ่งเราจะพิจารณาการแจกแจงปัวซงนัยทั่วไปที่มีพารามิเตอร์ lambda และ k เพื่อใช้อธิบายข้อมูลนับที่มีการกระจายเกินเกณฑ์หรือต่ำกว่าเกณฑ์ โดยงานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาตัวประมาณขนาดประชากรด้วยวิธีภาวะน่าจะเป็นสูงสุด และหาค่าประมาณความแปรปรวนของตัวประมาณที่นำเสนอโดยใช้เทคนิคแบบมีเงื่อนไข จากนั้นสร้างช่วงเชื่อมั่นของขนาดประชากรที่นำเสนอโดยวิธีของวัลด์ วิธีของ Burnham และวิธี Log-transformation เพื่อศึกษาประสิทธิภาพของตัวประมาณขนาดประชากรและช่วงเชื่อมั่นของขนาดประชากรโดยวิธีที่นำเสนอ ซึ่งเปรียบเทียบกับตัวประมาณขนาดประชากรด้วยวิธีภาวะน่าจะเป็นสูงสุด (MLE) ภายใต้การแจกแจงปัวซง ตัวประมาณขนาดประชากรของ Turing ตัวประมาณขนาดประชากรของ Chao และตัวประมาณขนาดประชากรของ Zelterman โดยที่ประสิทธิภาพของตัวประมาณขนาดประชากรพิจารณาจากค่าความเอนเอียงสัมพัทธ์ (RBias) และค่าความคลาดเคลื่อนกำลังสองเฉลี่ยสัมพัทธ์ (RMSE) ส่วนประสิทธิภาพของช่วงเชื่อมั่นของขนาดประชากรพิจารณาจากค่าความน่าจะเป็นคุ้มรวมและค่าความกว้างเฉลี่ยของช่วงเชื่อมั่น โดยผลลัพธ์จากการจำลองสถานการณ์ภายใต้การแจกแจงปัวซงนัยทั่วไป ในกรณีที่พารามิเตอร์การกระจายมีค่าเพิ่มขึ้น N.hat_GP ให้ค่า RBias และค่า RMSE ต่ำที่สุด และช่วงเชื่อมั่นของขนาดประชากรโดย N.hat_GP จะให้ค่าความน่าจะเป็นคุ้มรวมใกล้เคียงค่าสัมประสิทธิ์ความเชื่อมั่นที่กำหนด สำหรับทุกขนาดประชากร ซึ่ง N.hat_GP พัฒนาขึ้นภายใต้การแจกแจงปัวซงนัยทั่วไปที่ใช้อธิบายข้อมูลนับที่มีการแจกแจงปัวซงและมีการกระจายเกินเกณฑ์ ดังนั้น N.hat_GP จึงเป็นตัวประมาณที่มีประสิทธิภาพสูงที่สุด โดยเราจะพิจารณาการแจกแจงคอนเวย์แมกซ์เวลล์ปัวซงที่มีพารามิเตอร์ lambda และ nu ซึ่งการแจกแจงนี้สามารถใช้ได้กับข้อมูลนับที่มีการกระจายเกินเกณฑ์ได้ ผลลัพธ์จากการจำลองสถานการณ์ พบว่า N.hat_GP ให้ค่า RBias และค่า RMSE ต่ำที่สุด เมื่อพารามิเตอร์ lambda และ nu มีค่าน้อย สำหรับขนาดประชากร N = 500, 1,000 ส่วนช่วงเชื่อมั่นของขนาดประชากรโดย N.hat_GP จะให้ค่าประมาณสัมประสิทธิ์ความเชื่อมั่นสูงเป็นอันดับที่สอง สำหรับขนาดประชากร N = 50, 100 และจากการจำลองสถานการณ์ พบว่า ช่วงเชื่อมั่นของขนาดประชากรโดยวิธีของวัลด์ให้ค่าความน่าจะเป็นคุ้มรวมต่ำกว่าช่วงเชื่อมั่นของขนาดประชากรโดยวิธีของ Burnham และวิธี Log-transformation สำหรับประชากรขนาดเล็ก นอกจากนี้ผู้วิจัยได้นำตัวประมาณขนาดประชากรและช่วงเชื่อมั่นของขนาดประชากรที่นำเสนอกับข้อมูลจำนวนผู้เสพเฮโรอีนที่ติดต่อเข้ารับการบำบัดรักษาในจังหวัดเชียงใหม่

标记重捕法(Mark-Recapture)是一类用于估算难以被直接观测的种群规模的方法。采用该方法开展研究时所获取的数据为计数数据,其表征研究时段内被观测到的样本单元的出现频次,因此学界常以参数为λ的泊松(Poisson)分布描述该类数据的概率分布。然而当计数数据的均值与方差不相等时,泊松分布往往不再适用,此种情形被称为计数数据存在过离散或欠离散现象。为此本研究采用参数为λ和k的广义泊松(Generalized Poisson)分布,以适配存在过/欠离散的计数数据。本研究旨在基于极大似然法(Maximum Likelihood Estimation, MLE)开发种群规模估计量,并通过条件技术推导所提估计量的方差估计值;随后基于Wald法、Burnham法与对数变换法构建所提种群规模估计量的置信区间,以评估其性能,并与泊松分布框架下的极大似然种群规模估计量、Turing种群规模估计量、Chao种群规模估计量及Zelterman种群规模估计量进行对比。其中,种群规模估计量的性能通过相对偏差(Relative Bias, RBias)与相对均方根误差(Root Mean Squared Error, RMSE)进行评估;种群规模置信区间的性能则通过覆盖率均值与区间平均宽度进行评定。基于广义泊松分布的仿真实验结果显示:当离散参数取值增大时,所提出的N.hat_GP估计量的RBias与RMSE均为最低;且针对所有种群规模,基于N.hat_GP的置信区间覆盖率均与预设置信水平高度接近。由于N.hat_GP是基于可同时适配泊松分布与过离散计数数据的广义泊松分布开发的,因此其为性能最优的种群规模估计量。本研究同时考虑参数为λ和ν的康威-马克斯韦尔-泊松(Conway-Maxwell-Poisson, CMP)分布,该分布可用于建模过离散计数数据。仿真实验结果表明:当种群规模N=500、1000且λ与ν取值较小时,N.hat_GP的RBias与RMSE仍为最低;而当种群规模为50、100时,基于N.hat_GP的置信区间覆盖率位列第二。此外,针对小型种群,Wald法构建的置信区间覆盖率低于Burnham法与对数变换法构建的置信区间。最后本研究将所提种群规模估计量与置信区间应用于清迈省收治的海洛因成瘾者接触人数的真实数据集。
提供机构:
มหาวิทยาลัยธรรมศาสตร์
创建时间:
2023-01-20
二维码
社区交流群
二维码
科研交流群
商业服务