基于脸部视频图像的早期老年痴呆诊断技术综述
1 摘要
老年痴呆症是一种起病隐匿、呈进展性发展的神经系统退行性疾病。随着人口老龄化加剧,早期诊断老年痴呆对于阻止疾病发展至关重要。其中,基于脸部视频图像的老年痴呆诊断技术通过捕捉和分析患者的面部表情、动作等信息,为非侵入性诊断提供了新途径。综述近些年使用计算机视觉来进行面部识别进而诊断老年痴呆症相关的研究,尽管面临患者间面部特征差异大、诊断模型普适性不足等挑战,但该技术仍展现出巨大潜力,有望为老年痴呆症的早期诊断和防治工作带来新突破。
2 引言
老年痴呆症作为一种随着全球人口老龄化趋势日益严峻而愈发普遍的神经退行性疾病,已成为全球主要的致残和致死原因之一。据统计,全球约有5500万人受到痴呆症的影响,其中最常见的类型包括阿尔茨海默病$^{\mathrm{[1]}}$(AD)、血管性痴呆、路易体痴呆(LBD)和额颞叶痴呆(FTD)。这类疾病不仅给患者本人的生活质量带来严重影响,也给家庭和社会带来了沉重的负担。然而,由于早期阶段的准确诊断方法匮乏,许多患者在症状明显时才得以确诊,从而错过了早期干预和治疗的最佳时机。
在老年痴呆症的复杂病程中,其发病过程呈现为一个高度渐进、持续恶化的动态演变,在这一过程中患者的认知功能、行为模式及日常生活自理能力逐渐衰退。研究通常将这一过程细分为几个关键阶段,包括正常对照组(NC),即未表现出认知功能下降的健康个体;主观记忆抱怨组(SMC),个体主观上报告记忆减退但客观测试未见显著异常;轻度认知功能障碍(MCI),进一步细分为早期(EMCI)和晚期(LMCI),前者标志着认知功能轻度损害的初现,后者则更接近于阿尔茨海默病(AD)的临床诊断标准;最终发展为AD,即认知功能全面衰退的终末阶段。需要注意在MCI阶段,特别是其早期阶段(EMCI),可以进行早期识别,有助于延缓并阻止病情向AD发展。据统计,在65岁及以上的老年人群中,近40%的MCI患者在未来五年内会进展为AD。因此,科学研究正致力于探索MCI早期的生物标志物、深入剖析其病理机制,并开发有效的干预策略,以期实现老年痴呆症的早期预防与干预,从而延缓或阻止疾病的进展。
传统的老年痴呆症诊断方法主要依赖于临床表现、病史询问、智力评估和脑部影像学检查$^{\mathrm{[2]}}$等,但这些方法存在主观性强$^{\mathrm{[3]}}$、侵入性高、费用昂贵且耗时较长等局限性。因此,寻找一种更为准确、便捷且无创的早期诊断方法,对于改善痴呆症患者的临床管理和开发更有效的治疗策略具有重大意义。
近年来,随着医学技术$^{\mathrm{[4-5]}}$尤其是人工智能$^{\mathrm{[6]}}$和计算机视觉$^{\mathrm{[7]}}$技术的飞速发展,基于脸部视频图像的早期老年痴呆诊断技术逐渐成为研究的热点。脸部视频图像$^{\mathrm{[8]}}$作为一种非侵入性的数据源,包含了丰富的表情、动态信息和面部特征,这些特征与人脑的认知功能和神经系统状态密切相关。通过分析脸部视频图像中的微妙变化,如面部表情、眼球运动以及面部肌肉活动的细微差异,可以间接反映大脑的认知状态和潜在病变,从而为痴呆症的早期诊断提供新的思路和方法。
基于脸部视频图像$^{\mathrm{[9-10]}}$的早期老年痴呆诊断技术不仅有望突破传统诊断方法的局限性,提高诊断的准确性和便捷性,还为痴呆症的早期干预和治疗提供了新的可能性。
3 研究方法
脸部视频图像技术已成为评估个体认知功能及神经系统状态的重要工具,该技术深度融合了图像处理、计算机视觉以及前沿的人工智能技术,实现了对复杂面部信息的精细捕捉与智能分析。在老年痴呆症的早期筛查与诊断中,该技术更是展现出独特优势,能够敏锐捕捉患者面部表情的微妙差异及眼球运动$^{\mathrm{[11]}}$的细微变化,为疾病的早期诊断提供了坚实而客观的依据。
深度学习通过构建深度神经网络架构,从海量数据中自动挖掘并提取高维抽象特征,其在处理复杂模式识别任务时展现出了非凡的效能。在计算机视觉领域,深度学习技术,尤其是卷积神经网络(CNN),凭借其强大的特征提取与学习能力,能够精准地从脸部视频图像中解构出与认知功能衰退密切相关的局部特征与空间布局,广泛应用于图像分类、目标检测及图像语义分割等前沿领域。
3.1 OpenFace面部识别工具包
随着人工智能与计算机视觉技术的飞速发展,面部识别与情绪分析在多个领域展现出了巨大的应用潜力。其中,OpenFace$^{\mathrm{[12]}}$作为一款由卡内基梅隆大学研发的开源工具包,凭借其先进的深度学习模型和高效的算法设计,成为了该领域内的佼佼者。
OpenFace的核心是深度神经网络模型,这些模型经过大量面部图像数据的训练,能够高精度地识别出人脸的关键点,并实时追踪面部肌肉的细微变化。特别是其采用的卷积神经网络(CNN)和Active Appearance Models(AAMs)技术,使得OpenFace在处理光照变化、遮挡等复杂场景时,仍能保持较高的准确性和鲁棒性。此外,OpenFace的多元化功能为其在多个领域的应用提供了可能。在人机交互领域,OpenFace能够捕捉并分析用户的面部表情,从而提供更加自然、直观的用户界面;在市场研究与广告领域,通过分析消费者情绪,OpenFace能够为市场营销策略的制定提供有力的数据支持;在教育与健康领域,OpenFace能够监测学生的注意力和情绪状态,辅助诊断心理或神经系统疾病;在生物识别安全系统领域,OpenFace则能够提供高精度的身份验证解决方案,增强系统的安全性。
3.2 国内研究现状
在国内,基于脸部视频图像技术的老年痴呆早期诊断研究正蓬勃兴起,吸引了众多科研团队的关注与投入。Ching-Fang Chien等$^{\mathrm{[13]}}$(2023)的研究便是这一领域的杰出代表。他们创新性地提出了一种基于面部不对称性的评估方法来区分阿尔茨海默病患者与健康人群。该研究利用先进的三维相机技术,精准捕捉面部图像,并借助OpenFace这一强大的开源机器学习算法,实现了对面部68个关键标志点的自动识别与追踪。通过细致比较这29对面部地标的不对称性,研究人员深入剖析了AD患者与对照组在面部特征上的差异。
AD患者群体在面部边缘、眉毛、眼睛、鼻孔及嘴巴等多个区域展现出显著的不对称性,这一发现与未患痴呆的对照组存在明显差异。这一成果不仅揭示了面部不对称性在AD诊断中的潜在价值,为基于脸部视频图像的老年痴呆早期诊断技术开辟了新的思路。
国内研究团队还开发了基于人工智能的老年痴呆症辅助诊断系统。例如,暨南大学的研究团队$^{\mathrm{[14]}}$提出了一种基于视频数据的老年痴呆症辅助诊断系统,该系统通过采集受试者泡茶任务操作过程的视频,利用神经网络进行人物交互识别及患病健康状态诊断。这种非侵入式的诊断方式不仅提高了诊断的便捷性,还减轻了医生的工作负担。
3.3 国外研究现状
2020年,Uiseo Nam等人$^{\mathrm{[15]}}$发现面部和眼球运动的客观和准确测量可用于快速诊断阿尔茨海默病。通过比较AD患者和认知正常人群患者的面部和眼球运动模式,以分析痴呆的神经体征。在检测面部标志后,使用Spearman相关系数来检查水平和垂直面部和眼球运动之间的关联。
为了获取阿尔茨海默氏症患者的眼睛和面部运动数据,如图3.2所示,首先从参与者的视频中提取面部和眼睛坐标值。研究发现阿尔茨海默病组的凝视方差在所有方向上都明显大于正常组。认知能力下降的症状之一是注意力下降,这会导致频繁的眼球运动和面部运动。当认知能力恶化时,一旦检测到目标物体,集中注意力的能力就会降低,眼球运动量也会增加。
研究人员认为,阿尔茨海默氏症患者凝视的这些变化是由于额叶和顶叶的损伤造成的;已知这些区域的缺陷与阿尔茨海默病过程中注意力不集中有关,导致扫视和平稳追踪的启动和抑制缺陷,因此患者可能会有更高程度的面部运动,以克服这些问题。所以,测量的异常眼球运动可以作为筛查阿尔茨海默病的标志。由此可见,基于相机的测试早期发现显示神经退行性变迹象的患者会促进了痴呆症的早期诊断技术的发展。
2021年,Yumi Umeda-Kameyama等人$^{\mathrm{[16]}}$现使用Xception等深度学习程序能够区分轻度痴呆症患者和非痴呆症患者的面部。即面部AI评分与MMSE和实际年龄之间存在显著相关性,其中,MMSE评分与面部AI评分的相关性明显强于实际年龄。
这项研究的结果为开发一种使用人工智能的非侵入性、廉价和快速的认知障碍筛查工具奠定了基础,为未来开发痴呆症面部生物标志物的研究铺平了道路。
此外,考纳斯理工大学(KTU)的研究人员$^{\mathrm{[17]}}$电图仪数据,分析了阿尔茨海默病患者与健康人在处理面部背景信息时的差异。研究发现,阿尔茨海默病患者的大脑信号比健康人更为嘈杂,这与他们更难集中注意力和处理视觉信息有关。这一发现揭示了面部表情与认知功能之间的密切关系,为基于脸部视频图像的诊断技术提供了新的视角。
4 展望与未来的挑战
经对近年来的文献进行深入研究,可以发现基于脸部视频图像技术的早期老年痴呆病诊断是此领域的主要研究方向。这一领域取得的显著进步,源于深度学习方法的持续创新和应用。这些方法不仅在数量上呈增长趋势,同时在精度和效率上也实现了显著的提升。然而,仍然存在一些问题和挑战有待解决。例如,为了进一步提高模型的准确率,需要解决模型对于面部表情多样性的适应问题。此外,此项技术还需得到更广泛的应用和推广,以便让更多潜在的老年痴呆症患者从中受益。
此外,当前公开可用的、专门用于早期老年痴呆症诊断的脸部视频图像数据集极为有限。数据标注的困难也是导致数据集缺乏的重要原因之一。基于脸部视频图像的早期老年疾病诊断依赖于对细微面部变化的准确捕捉和分析,这需要高度专业的医学知识和丰富的临床经验。在收集和使用脸部视频图像数据时,必须严格遵守相关法律法规和伦理规范,确保患者的隐私权益得到充分保护。
在未来的研究中,可以融合各种生物特征进行综合分析,旨在探索并确定不同生物标记物的最优组合。同时应将研究重心放在提升这些技术在临床诊断中的可行性与实用性上,不仅要追求技术上的先进性,更要确保这些技术能够真正服务于患者,提高阿尔茨海默症等老年痴呆疾病的早期诊断准确率,从而在临床实践中发挥更大的综合价值。通过这样的努力,基于脸部视频图像技术的早期老年痴呆诊断技术将在老年疾病研究领域展现出更加广阔的应用前景和深远的社会意义。
5 参考文献
- Dubois, B.; Feldman, H.H.; Jacova, C.; DeKosky, S.T.; Barberger-Gateau, P.; Cummings, J.; Delacourte, A.; Galasko, D.; Gauthier, S.; Jicha, G.; et al. Research criteria for the diagnosis of Alzheimer’s disease: Revising the NINCDS-ADRDA criteria. Lancet Neurol. 2007, 6, 734–746.
- CHOULIARAS L, O’BRIEN J. The use of neuroimaging techniques in the early and differential diagnosis of dementia[J].
- DOWNS M G. THE ROLE OF GENERAL PRACTICE AND THE PRIMARY CARE TEAM IN DEMENTIA DIAGNOSIS AND MANAGEMENT[J/OL]. International Journal of Geriatric Psychiatry, 1996, 11(11): 937-942.
- SO A, HOOSHYAR D, PARK K, et al. Early Diagnosis of Dementia from Clinical Data by Machine Learning Techniques[J/OL]. Applied Sciences, 2017: 651.
- SCHÖNECKER S, BRENDEL M, HUBER M, et al. Applied multimodal diagnostics in a case of presenile dementia[J/OL]. BMC Neurology, 2016.
- HOSNY A, PARMAR C, QUACKENBUSH J, et al. Artificial intelligence in radiology[J/OL]. Nature Reviews Cancer, 2018: 500-510.
- KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet Classification with Deep Convolutional Neural Networks[J/OL]. Communications of the ACM, 2017: 84-90.
- ZHANG C, XU X, TU D. Face Detection Using Improved Faster RCNN.[J]. Cornell University - arXiv,Cornell University - arXiv, 2018.
- 严严, 章毓晋. 基于视频的人脸识别研究进展[J].
- 白子轶, 毛懿荣, 王瑞平. 视频人脸识别进展综述[J]. 计算机科学, 2021, 48(03): 50-59.
- NAM U, LEE K, KO H, et al. Analyzing Facial and Eye Movements to Screen for Alzheimer’s Disease[J/OL]. Sensors, 2020: 5349.
- BALTRUSAITIS T, ZADEH A, LIM Y C, et al. OpenFace 2.0: Facial Behavior Analysis Toolkit[C/OL]//2018 13th IEEE International Conference on Automatic Face & Gesture Recognition (FG 2018), Xi’an. 2018.
- Chien, C.-F.; Sung, J.-L.; Wang, C.-P.; Yen, C.-W.; Yang, Y.-H. Analyzing Facial Asymmetry in Alzheimer’s Dementia Using Image-Based Technology. Biomedicines 2023, 11, 2802.
- 陶倩, 雷小林. (2023). 基于视频数据的老年痴呆症辅助诊断系统及其方法. 发明专利申请公布号CN 116580832. 公布日期, 2023年8月11日.
- NAM U, LEE K, KO H, et al. Analyzing Facial and Eye Movements to Screen for Alzheimer’s Disease[J/OL]. Sensors, 2020: 5349.
- UMEDA-KAMEYAMA Y, KAMEYAMA M, TANAKA T, et al. Screening of Alzheimer’s disease by facial complexion using artificial intelligence[J/OL]. Aging, 2021: 1765-1772.
- KOMOLOVAITĖ D, MASKELIŪNAS R, DAMAŠEVIČIUS R. Deep Convolutional Neural Network-Based Visual Stimuli Classification Using Electroencephalography Signals of Healthy and Alzheimer’s Disease Subjects[J/OL]. Life, 2022: 374.