摘要: 乳腺癌的早期诊断可显著提高其治愈的可能性。近年来,大数据与人工智能技术的蓬勃兴起为乳腺癌在内的多种疾病早期诊断提供技术支持。为提升乳腺癌诊断的准确度,构建基于曲线下面积(area under curve, AUC)改进的Stacking集成模型。首先,构建基于$v$-SVM的AdaBoost集成模型,并将其作为Stacking的元学习器。其次,利用各基学习器的总体AUC值对各基学习器的训练结果进行加权,将加权后的结果作为元学习器的训练集对元学习器进行训练。最后,在WDBC和WBC数据集上进行实证分析。结果表明,基于AUC改进的Stacking集成模型在两个数据集上分别取得较高准确率,可为医生提供更为精细、个性化的诊断依据,进而实现更早介入、更高效治疗的目标。