经过一段时间的封闭式开发,HRA智能体检项目终于完成。

RMHRA项目,全称是:RealMED AI Health Risk Assessment, 健康风险AI智能评测系统,RealMed人工智能身体疾病预警系统。
简单来说,就是通过人体最基础的五项数据:身高、体重、性别、心率、血压,预测人体的体检指标。
项目研发过程,咨询了大量医学和保险行业专家学者,参考了《The Lancet》(柳叶刀)等多种专业学术杂志文献。
RMHRA系统,采用最新的DL深度学习架构,通过神经网络AI模型,分为第一部分:快速综合风险评测部分,第二部分:身体指标当前可能风险提示和未来1-3年预测风险。
第一部分通过输入高度简化:性别、年龄、身高、体重、等基础数据,通过AI神经网络模型,自动评测用户综合健康等级,目前系统准确度达80%,相当于3-5年一线专业经验健康评估师的专业分析能力。
从IT-AI角度而言,这个项目属于目前AI领域最前沿的课题:Tabular结构化数据+DL深度学习。
AI人工智能领域,最成功的两个商业化领域是:NLP语义分析、CV图像分析。
结构化数据,也称为Tabular表格数据,是目前DL深度学习的前沿焦点课题之一,也是第三个可能获得重大突破的AI工程领域。
RMHRA项目采用的Tabular模型,属于第三代DL深度学习模型,相对传统的古典机器学习决策树模型,虽然在开发阶段,对研发团队素质、硬件设备算力要求较高,但在模型效果,数据适用范围等方面,特别是后期服务器部署,APP、手机小程序分发环节,存在数量级的工程优势。
这个项目的难点其实很多,与RF-DNA随机森林的淋巴基因生物芯片案例类似。
淋巴基因生物芯片案例,是统计学领域的经典案例,类似AI神经网络当中的iris花朵分类,mnist手写数字识别案例。
RF随机森林案例,采用的淋巴瘤基因表达芯片数据集,通常包含77个样品,2个分组和7070个变量。
最早的案例其实是81个样本,分析4682个变量。



RMHRA项目,其实难度比这个RF-DNA随机森林的项目大的多,主要是输入数据太少,就身高体重心率血压等不到十项输入数据,分析人体近百个体检医学指标,而且最终结果,准确度超过90%
RMHRA项目,目前虽然只是v1版本,最终结论,很多人的意料,包括我们自己。
通过最简单的身高体重心率血压等数项基础输入数据,居然能够预测白血球,红细胞这些微观生理指标,而且AI模型的预测准确度,高达90%以上,部分指标在95%以上。(宽容度10%)。
这个模型,单从AI技术角度而言,可能成为AI-中医-西医几个领域的融合课题,揭示中医底层学理,破解中医、中药的微观“DNA”基因obj指标。
RMHRA项目的难点很多:
- Tabular结构化数据,是目前AI-DL深度学习的瓶颈,通常精度在70-80%左右。RMHRA项目的基础模型,精度也是70%左右,最终,采用了:参数优化,模型群组,数据混合等多种工程手段,把最终模型指标提高到90-95%。
- 通过简单数个input输入指标,预测分析上百个潜在y目标数据,参见RF-DNA淋巴生物芯片案例。
- 通过简单的宏观数据,分析众多的微观生理指标,为中医的传统问诊,与西医的监测体系,通过AI-DL人工智能、深度学习,摸索出一条融合之道,RMHRA项目,已经搭建好第一块砖石。
- 在GPT-3等超大模型的风潮下,为中小企业采用mini-AI微模型,小数据理轮,成功把AI-DL深度学习,结合行业实际应用,创建了一个成功案例。
- 。。。。。。



请大家关注TOP极宽量化公众号:TOP极宽量化,浏览,TopQuant.vip极宽网站,大量原创量化资料和课件、案例源码。关注公众号,即可获得最新网盘下载地址。TQ极宽·相关网络QQ社群如下:
- QQ群号:124134140,TOP极宽金融量化总群,面向专业金融实盘用户,三千人大群。
- QQ群号:1057170501,zwPython.com学习群,面向py初学者和大众小白用户,两千人大群。
- QQ群号:699266891,TFB极宽足球大数据,TFB=TopFootBall
- QQ群号:790548107,FASTAI智能量化
- QQ群号:663952322,PytorchLightning智能框架
- QQ群号:655402626,CBF中华大字库,ziwang.com字王网站,已升级为元字库: metafont.vip