您现在的位置是:首页 >人工智能 > 2022-05-23 15:29:51 来源:

机器学习从根本上减少了用于疾病诊断的细胞计数工作量

导读 使用机器学习来执行血细胞计数来诊断疾病,而不是昂贵且通常不太准确的细胞分析仪机器仍然非常耗费人力,因为在机器学习的训练中需要人类进

使用机器学习来执行血细胞计数来诊断疾病,而不是昂贵且通常不太准确的细胞分析仪机器仍然非常耗费人力,因为在机器学习的训练中需要人类进行大量的手动注释工作模型。然而,北京航空航天大学的研究人员开发了一种新的训练方法,可以使大部分活动自动化。

他们的新培训计划在4月9日发表在CyborgandBionicSystems杂志上的一篇论文中进行了描述。

血液中细胞的数量和类型通常在疾病诊断中起着至关重要的作用,但通常用于执行这种血细胞计数的细胞分析技术——包括检测和测量悬浮在液体中的细胞的物理和化学特性——是昂贵且需要复杂的准备工作。更糟糕的是,由于温度、pH、电压和磁场等各种影响会混淆设备,因此细胞分析仪的准确度只有90%左右。

为了提高准确性、降低复杂性和降低成本,最近对替代品的许多研究都集中在使用计算机程序对连接到显微镜的高清相机拍摄的血液照片进行“分割”。分割涉及对照片中出现的内容执行逐像素标记的算法,在这种情况下,图像的哪些部分是细胞,哪些不是——本质上是计算图像中的细胞数量。

对于只出现一种类型细胞的图像,这些方法可以达到相当高的准确度,但在面对具有多种类型细胞的图像时,它们的表现很差。因此,近年来,为了解决这个问题,研究人员转向了卷积神经网络(CNN)——一种反映人类视觉皮层连接结构的机器学习。

CNN要执行这项任务,首先必须对其进行“训练”,以了解人类手动标记的数千张细胞图像中什么是细胞,什么不是细胞。然后,当输入一个新的、未标记的图像时,它会识别并计算其中的细胞。

“但这种手工标注既费力又昂贵,即使在专家的协助下完成,”该论文的合著者、北京航空航天大学机械工程与自动化系教授詹粤说,“这违背了初衷一种比细胞分析仪更简单、更便宜的替代品。”

因此,北航的研究人员开发了一种新的CNN训练方案,在本例中为U-Net,这是一种全卷积网络分割模型,自2015年首次开发以来已广泛应用于医学图像分割。

在新的训练方案中,CNN首先在一组数千张图像上进行训练,其中只有一种细胞(取自小鼠血液)。

这些单细胞类型图像由传统算法自动“预处理”,这些算法可以减少图像中的噪声、提高其质量并检测图像中对象的轮廓。然后他们执行自适应图像分割。后一种算法计算黑白图像中的各种灰度级别,如果图像的一部分超出某个灰度阈值,则该算法将其分割为不同的对象。使该过程具有自适应性的原因在于,它不是根据固定的灰度阈值来分割图像片段的一部分,而是根据图像的局部特征进行分割。

将单细胞类型的训练集呈现给U-Net模型后,使用一小组手动标注的多种细胞类型的图像对模型进行微调。相比之下,仍然存在一定数量的人工标注,需要人工标注的图像数量从以前的数千张减少到仅600张。

为了测试他们的训练计划,研究人员首先使用传统的细胞分析仪对相同的小鼠血液样本进行独立的细胞计数,并以此比较他们的新方法。他们发现他们的训练方案对多细胞类型图像分割的准确率为94.85%,这与使用手动注释的多细胞类型图像进行训练所达到的水平相同。

该技术还可以应用于更高级的模型,以考虑更复杂的分割问题。

由于新的训练技术仍涉及一定程度的手动注释,研究人员希望继续开发一种用于注释和训练模型的全自动算法。