报告题目:RegCGAN:面向非平衡大数据问题的正则化条件生成对抗网络重采样方法
报告时间:2026年5月10日上午10点
报告地点:北区四号教学楼209室
报告摘要:非平衡数据分类问题广泛存在于大数据分析、风险识别、医学诊断、故障检测和智能感知等实际应用场景中。针对传统分类模型在类别分布不均衡条件下容易偏向多数类,进而导致少数类识别能力不足的问题,我们研究了一类基于重采样思想的深度生成分类模型。该类模型以条件生成对抗网络为基础,通过引入熵正则化机制,构建了正则化条件生成对抗网络模型,即RegCGAN,用于实现非平衡数据条件下的有效学习与分类。我们将首先介绍RegCGAN的基本模型框架,包括生成器、判别器和分类器之间的协同博弈机制;随后从理论角度分析该模型在非参数假设下均衡点的存在性与唯一性,说明RegCGAN能够在理论上保证生成分布、真实分布与分类分布之间的一致性。在此基础上,进一步结合随机模拟实验和真实非平衡数据实验,验证RegCGAN在少数类样本生成、类别分布补偿和分类性能提升方面的有效性。研究结果表明,RegCGAN不仅能够充分利用原始非平衡数据中的整体信息,而且能够通过生成式重采样增强少数类样本表达能力,从而显著提高少数类预测精度和整体分类性能。该方法为非平衡大数据分类问题提供了一种具有理论支撑和实践应用价值的深度学习解决方案。
报告人简介:徐礼文,教授,博士生导师,北方工业大学学术委员会委员、统计学科责任教授。现任中国现场统计研究会理事、数字孪生与不确定性量化分会理事。曾任全国工业统计教学研究会理事、青年统计学家常务理事,清华大学博士后、助理研究员,中国人民大学博士后,美国佐治亚大学统计系/大数据实验室访问学者。主要从事大数据统计分析、深度学习、强化学习、因果机器学习、AI for Science等方向的研究,主持国家自然科学基金、国家社会科学基金、中国博士后科学基金、北京市自然科学基金、国家电网科技项目等10余项科研项目,获北京市博士后杰出英才奖、北京市公司产品成果一等奖,发表学术论文60余篇,其中SCI期刊40余篇,科学出版社等出版著作4部。
本文未经允许,禁止转载、摘编