发表《Multiset Feature Learning for Highly Imbalanced Data Classification 》作者:荆晓远等
简介:数据类别不平衡是广泛存在的情况,而且随着大数据时代的到来,这种情况越来越多,很多场合是严重不平衡,这样容易导致学习算法分类性能显著下降。论文首先利用随机划分策略和生成对抗网络对原始不平衡数据集构造出多个平衡数据子集,然后提出了一种新的深度度量学习方法即深度多集特征学习。该方法设计了邻域鉴别项和加权不相关约束,并引入代价敏感因子,增强了算法的分类能力。