深入解读与分析凯斯西储大学轴承数据集,本文首先概述了该数据集的结构和分类,介绍了使用WDCNN方法进行模式识别和故障诊断分类的基本原理与实现。然而,实验发现,当数据集从12kHz采样频率调整至48kHz时,模型准确率显著下降,仅达到可怜的2%左右,即使对数据进行缩放以匹配时间尺度,准确率也只有约10%。问题的根源在于数据集的原始分类过于细致,导致在不同工况下的特征提取与模型适配存在挑战。为解决这一问题,文章提出了简化分类策略,聚焦故障部位和等级,同时对外圈故障点进行区分,构建了更实用的分类体系。
针对数据集中包含的不同工况,文章进一步探讨了如何根据转速、负载等条件对数据进行有效划分,提出了一种基于不同工况的映射文件,并提供了代码示例,以方便读者根据需求进行数据提取。同时,对数据的原始波形进行了对比分析,通过将12kHz与48kHz采样频率下的同一故障类型数据进行比对,揭示了采样频率对振动幅值和时间轴的影响,以及对算法模型适配的挑战。
文章接着深入探讨了通过WDCNN网络提取数据特征的分布和漂移情况,对不同故障部位、负载条件、故障点位和故障等级进行了细致分析。研究发现,尽管在部分分类任务中模型表现良好,但48kHz数据在特征提取后表现出明显的特征漂移,影响模型在不同工况下的泛化能力。同时,文章也指出了同一故障部位在不同负载下的数据分类问题,以及同一故障部位、负载不同故障等级的数据分类挑战,提出了针对空负载数据训练的有效泛化策略。
此外,文章对比了驱动端与风扇端在内圈、载荷0、故障等级1条件下的数据特征,通过WDCNN提取特征分析,指出振动传感器的布设位置对于模型性能的影响,但同时也强调了传感器位置差异在数据集内部的聚类效果不佳的问题。最后,文章总结了凯斯西储大学轴承数据集的复杂性及其对模型训练的挑战,并强调了构建适应多种工况的模型的重要性。
为了帮助读者进一步理解和可视化数据特征,文章还分享了t-SNE降维可视化方法的简单代码示例,该方法常用于展示模型聚类性能,读者可据此调整和优化模型。