精神分裂症 作为严重慢性精神疾病,患者平均住院周期长达73±42天,医疗资源消耗巨大。若能在入院时提早获知患者的长住院风险,便可以显著优化资源分配并为风险患者提供更精准的治疗。传统预测方法受限于多模态数据整合能力不足、非结构化病历信息提取效率低下等瓶颈,难以实现精准的长住院风险评估。
近日,上海交通大学医学院附属精神卫生中心/生物医学工程学院林关宁教授团队联合上海交通大学医学院附属精神卫生中心禹顺英教授团队合作在NPJ Schizophrenia发表题为:“Leveraging deep neural network and language models for predicting long-term hospitalization risk in schizophrenia”的最新研究,成功构建首个整合语言模型与深度神经网络的多维度精神分裂症患者长住院风险预测模型。
该模型通过本地化部署的语言模型,在确保数据隐私安全前提下实现94%行为特征提取准确率。本研究创新性地融合多维度异构入院特征(包括年龄、病程、炎症指标NLR/MLR、攻击行为等)构建住院队列预测模型,AUC达0.9,长住院识别准确率较传统方法提升37%。这一研究为精神分裂症长住院风险的评估提供了更高精度、更广泛适用性的预测方案,为临床决策和资源分配带来了更具实用价值的辅助支持。博士研究生包亦航与硕士研究生王婉莹为本文共同第一作者,林关宁教授与禹顺英主任担任通讯作者。

研究团队通过模型的可解释性分析,成功识别了与精神分裂症患者长期住院风险相关的关键风险因子。这些风险因子包括入院年龄、疾病持续时间、婚姻状况等人口学变量,以及中性粒细胞/淋巴细胞比值(NLR)、淋巴细胞百分比和白蛋白等血液检测指标。此外,行为变量如自我伤害也被证明与长住院风险显著相关。这些发现不仅验证了模型的有效性,还为理解SCZ患者的住院风险提供了新的视角。
研究团队进一步评估了基于语言模型的信息提取范式在消除歧视和减少错误依赖方面的能力。通过在种族和性别偏差场景下的测试,结果表明传统监督学习方法在存在偏差时性能显著下降(Wilcoxon检验,p = 4.5e-3),而语言模型提取范式的性能保持稳定,准确率维持在94.2%。此外,在依赖错误测试中,传统方法错误地将年龄作为自我伤害行为的预测特征,而语言模型提取范式能够有效避免这种错误依赖,准确率保持在95%。这些结果表明,语言模型提取范式在减少潜在歧视和错误依赖方面具有显著优势,为医疗相关问题的公平性和可靠性提供了保障。

研究团队在未来还将探索更多前沿深度学习范式在精神分裂症临床诊疗领域的潜力,为精准精神疾病临床诊疗提供更多支持。本研究得到了国家重大科技专项基金和上海交通大学医工交叉基金等项目的资助。
课题组介绍
上海交通大学生物医学工程学院林关宁课题组(Biomedical Informatics Lab, https://bmi.sjtu.edu.cn/)主要从事生物信息学辅助疾病机制解读、人工智能赋能脑疾病诊疗等前沿研究,致力于开发分析与计算工具帮助解决生物与临床问题(AI for Biology & Medicine),具体包括:
1.多组学联合分析挖掘精神类疾病生物标志物,构建机器学习模型,实现精准诊断和治疗干预;
2.开发突变效应预测系列工具,揭示突变效应与疾病机制的关联,为疾病早筛及临床用药提供指导;
3.开发基于Foundation model的精神疾病电子病历表征方法,提供服务于临床诊疗的算法新范式;
4.开发脑电神经解码系统,实现睡眠障碍的跨周期动态评估与精准量化分析,为构建智能化睡眠健康评估体系提供可解释性计算框架。


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有