数据实验楼基于卷积神经网络的岩相分类项目正式发布,欢迎大家体验!为支持广大院校的大数据和人工智能实训教学,需要使用平台的老师请尽快与我们联系,便于我们提前准备云服务器等资源。联系电话和微信:136-9329-0406
数据实验楼面向全国高校师生提供服务,如未加入所在院校,请先加入院校方可获得服务。
点击菜单栏“申请院校码”,在弹框里填写信息。
信息填写完整后提交。
岩相分析是以岩石薄片的微观描述和分类为基础的研究工作,也是沉积和成岩研究的一项重要技术,对于油气勘探开发的工程实践具有基础性指导地位。通过薄片分析矿物的比例、分布、质地、孔隙空间、胶结成分等因素,给后续的油气田开发方案设计作为保障提供了更好、更准确的手段。
本项目利用三大类(沉积岩、火成岩和变质岩)岩石薄片显微图像数据集构建岩相智能识别模型,辅助专家进行岩相判断,提高研究效率。通过本项目的实训,大家可以对不同类型岩石的微观情况有一个基本了解,并且掌握图像增强技术以及学会利用深度学习框架构建多分类图像识别模型的方法。
pillow; pytorch; torchkeras; torchmetrics; bottleneck-transformer-pytorch
本项目使用的数据是岩石显微薄片数据集,包括28种不同的沉积岩、39种火成岩和38种变质岩(3大类,105种小类)。
本项目共分为六个章节,第一章对岩石显微照片数据集进行探究,首先提取图片的一级和二级标签,然后可视化三种类型的岩石进行进一步了解,最后对一级和二级进行统计分析,为后续模型构建打下基础;
第二章进行Baseline模型构建、训练和评估,首先进行标签编码,接着按照8:2的比例将数据集划分为训练集和验证集,然后利用torchkeras框架构建ResNet18模型,基于随机初始权重和预训练权重分别进行训练,在训练过程中使用多分类正确率和F1值对模型进行综合评估;
第三章将图像数据增强技术加入模型的训练,丰富训练集样本多样,继续基于预训练权重训练ResNet18模型,对比Baseline模型的效果;
第四章进行错分样本分析,首先计算一级类别标签的分类正确率、F1分数、混淆矩阵和分类报告,然后计算二级类别标签的混淆矩阵和分类报告,并提取出错分样本数较多的类别,最后对错分样本数较多的类别进行可能的错分原因分析;
第五章根据上一章错分样本的分析,进一步改进模型,将Self-Attention机制引入ResNet18(BoTNet模型),基于预训练权重重新训练模型并进行评估;
第六章对BoTNet模型进行错分样本分析,对比加入图像增强的ResNet18模型的错分样本的预测是否有所改进,最后继续提取出错分样本数较多的类别进行可能的错分原因分析。