数据驱动的农作物遥感分类地面样本点布设.
- Resource Type
- Article
- Authors
- 吴清滢; 余强毅; 段玉林; 吴文斌
- Source
- Transactions of the Chinese Society of Agricultural Engineering. 2023, Vol. 39 Issue 6, p214-223. 10p.
- Subject
- *STATISTICAL sampling
*IMAGE recognition (Computer vision)
*SUPPORT vector machines
*SAMPLE size (Statistics)
*K-means clustering
- Language
- Chinese
- ISSN
- 1002-6819
地面样本点是农作物遥感分类模型训练的基础,样本点数量和质量是影响模型分类精度的 2 个主要因素。该研 究构建了数据驱动的样本点布设方法,利用待分类影像的光谱、植被指数等特征构造分层抽样底图,结合分层随机抽样 方法进行地面样本点布设,并分析不同抽样策略对农作物遥感分类结果的影响。采取基于 k-means 聚类分析的数据驱动 方法,考虑 6 景哨兵 2 号影像提取的共 78 个分类特征,生成同一个最优 k 的聚类结果图;设计等量分配和按面积比分配 2 种样本量分配方式,样本点数量为 25、49、100、169、225 的 5 个总样本量;基于不同抽样策略获取地面样本点信息, 利用同一个支持向量机模型对待分类影像进行监督分类,并通过与 139 个样本点的理论总样本量和 400 个样本点的传统 方式总样本量对比分析,定量解析不同抽样策略对分类精度的影响。结果表明:1)在数据驱动非监督聚类生成的底图上 进行抽样(按面积比分层抽样法、等量分层抽样法)获得的样本点质量和分类精度明显优于没有该底图的抽样策略(简 单随机抽样法、系统抽样法);2)当总样本量低于理论总样本量时,等量分层抽样法能获取比按面积比分层抽样法更高 的分类精度。例如,当理论样本量为 139 时,总样本量为 25、49 和 100 时等量分层抽样法的分类精度均值(75.5%、80.5% 和 86.0%)均明显高于按面积比分层抽样法的分类精度均值(48.4%、69.0%和 83.0%),而当总样本量为 169 和 225 时, 两种分层抽样的分类精度均值都在 90.0%左右;3)当满足总体精度需求时,分层抽样法所需的实际总样本量小于理论样 本量,可极大提高抽样效率。例如,等量分层抽样法的实际样本量为理论样本量的约 70%便可满足 85.0%的总体精度需 求;当分类精度与人工选取方式分类精度相同时(97.5%),等量分层抽样法的实际样本量仅为传统方式样本量的约 90%。 研究结果印证了分类精度及稳定性随着总样本量的增加而增加这一普遍认识,但当总样本量超过一定值时,精度增长速 度变慢。该方法可以获取类间均衡、类内多样化的样本集,为农作物遥感地面样本点布设、快速高效分类提供参考。 [ABSTRACT FROM AUTHOR]