人类声音的微妙差异,长期以来被视为沟通和情感表达的重要工具,如今正成为诊断信息的意外丰富来源。随着人工智能(AI)和机器学习的进步,一个新兴的研究领域正在展示,仅通过分析一个人如何说话,就能检测呼吸道疾病,甚至心理健康问题的潜力。这种创新方法为多种健康问题提供了非侵入性、可及性和潜在的早期预警系统,超越了依赖于身体症状或实验室检测的传统诊断方法。这种研究的推动力源于COVID-19大流行期间面临的挑战,当时有限的检测资源凸显了快速、便捷筛查工具的需求。
宾夕法尼亚州立大学的研究团队开发了TalkingSick,这是一个利用AI驱动的模式识别系统,能够识别个体声音基线偏离健康状态的变化。这意味着系统会学习一个人“正常”的声音特征,并标记任何可能表明疾病开始的变化,甚至在明显症状出现之前。类似地,总部位于波士顿的健康科技公司Sonde Health,由PureTech Health孵化,正在开发一种基于生物标志物的系统,类似于可穿戴设备,用于监测声音模式以早期检测呼吸道和心理健康问题。这种研究的初始动力源于安迪斯·瓦尔德兹在大流行期间的经历,当时可用的COVID检测资源有限,促使他寻找替代诊断途径。这种对可及性诊断的需求也体现在VoiceMed的开发中,该系统旨在通过AI驱动的声音分析区分健康人群和感染者。
这种技术的核心依赖于对各种声音特征的复杂分析。研究人员正在使用梅尔频谱分析等技术,识别功率、变化和随时间变化的音量等特征,以指示疾病。除了这些广泛的特征,AI模型能够识别更细粒度的生物标志物——如声带强度、情感、肺和呼吸功能,甚至肌肉退化,这在最初专注于阿尔茨海默病的研究中得到了证明,但后来被证明也适用于COVID-19检测。此外,分析不仅限于语音;咳嗽声和鼻息声也被研究为潜在的诊断指标。一个利用Formosa呼吸声档案(FABS)数据库的研究,包含近2,000名参与者的录音,展示了利用大量历史数据训练AI系统以准确检测呼吸问题的潜力。卷积神经网络(CNNs)在音频信号分析中的应用也证明了在识别哮喘、慢性阻塞性肺病(COPD)和肺炎等疾病方面的有效性。该领域也正在朝着可解释AI(XAI)方向发展,旨在理解AI为何做出某些诊断,从而增强技术的透明度和可信度。
这种技术的应用不仅限于急性呼吸道感染。研究人员正在探索利用声音分析来监测慢性呼吸道疾病如COPD,评估COVID-19的长期影响(长期COVID),甚至检测呼吸衰竭。ARIA-TRE项目,由威尔士呼吸创新和WIDI合作,旨在创建一个受信任的研究环境,用于分析声音数据以检测呼吸道疾病。此外,该技术并非局限于特定地理位置;研究人员正在开发训练于多样化数据集的系统,包括过去50年在巴西收集的录音,以确保更广泛的适用性。通过可穿戴麦克风获取的呼吸音频估计呼吸频率的能力,如苹果机器学习研究团队所展示的,进一步扩展了持续、远程监测的可能性。超声技术,虽然与声音分析不同,但在检测呼吸异常方面也展现出潜力,补充了音频基础诊断的进展。
AI、声音生物标志物研究以及音频数据可及性的结合,正在为呼吸健康监测开辟新时代。从TalkingSick和Sonde Health等初创公司到利用大型数据库的学术机构,该领域正在迅速发展。通过一个人声音的声音检测疾病的能力,提供了非侵入性、可及性和潜在的早期诊断工具,可能显著改善患者结果和公共卫生准备。尽管在数据多样性、算法完善和临床验证方面仍面临挑战,但这种技术的潜在益处是不可否认的,承诺未来一个简单的声音录音可能为我们的呼吸健康提供有价值的见解。
发表回复