在全世界范围内,有超越3亿人患有抑郁症。其间的60%的人都没有承受任何医治。
咱们时有听到名人患抑郁症乃至严重到自杀的音讯,却不知周围一些普通人身在病中不知病。
面临这一病症,AI能做些什么?
从前说过“AI没有国界,AI的福祉亦无鸿沟”的李飞飞教师这次要为那些置疑自己患抑郁症的人发明福祉了,这次她和团队瞄准了AI确诊抑郁症这个方向:
结合语音辨认、计算机视觉和自然言语处理技能,经过表情和言语确诊一个人是否患了抑郁症。
现在,这项研讨初见成效,确诊抑郁症的机器学习模型现在precision到达83.3%,recall到达82.6%。
而且,这个模型能够布置到手机上,让更多人能便利的确诊抑郁症,不再受困于“没钱”、“没时刻”、“他人知道我去查抑郁症会怎样谈论我”的阻遏之中。
别的,这项研讨成果还当选了 NIPS NeurIPS 2018医疗健康机器学习(ML4H)Workshop。
下面,量子位为咱们具体介绍李飞飞这篇新著作的具体内容。
为什么用表情和言语能确诊抑郁症?由于医师便是这么干的。
在现在的抑郁症确诊过程中,医师需求和患者面临面谈天,来判别对方是否患病。
需求医师来查询的要素包含:
对方是否语调单一,完全不波澜起伏;
说话音量是否比较低;
说话时手势是不是比正常人少;
是不是总爱垂头向下看;
……
别的,还需求经过患者健康问卷(PHQ, Patient Health Questionnaire)来查询来了解更具体的信息。
用AI来确诊抑郁症,就相当于用机器学习模型来替代那个和患者对话的医师,把患者在医师面前的体现变成数据,输入机器学习模型中。
因而,李飞飞团队选用的计划是先模型中输入3D面部要害点视频、患者说话的音频和转成文字的访谈录音三种数据,别离对应下图中的abc三行。
之后,输出PHQ评分或抑郁症分类标签,就能得出此人是否患了抑郁症。
练习模型全过程练习这个模型用到的是DAIC-WOZ数据集,包含142名患者的PHQ评分和189次临床访谈、一共50小时的数据。
整个模型由两个部分组成。
第一个部分叫语句级嵌入(Sentence-Level Embeddings)。
以往的嵌入方法都是嵌入一个音节或单词,只能捕捉几百毫秒的时刻。李飞飞团队用的是整个语句多模态嵌入,能够完成捕捉更长时刻的声响、视觉和言语元素。
下图便是多模态语句级嵌入的示例:
第二个部分叫因果卷积网络(C-CNN, Causal Convolutional Networks)。
之所以用因果卷积网络,是由于抑郁症患者说话慢。
比较普通人,抑郁症患者说话的时分会在不同的字词之间中止更长时刻,因而整个语句的音视频也就比较长。处理这种长语句的时分,因果卷积网络要比RNN强。
作用怎么咱们来看一下试验成果。
其间,A是指输入数据为音频,V是指输入数据为视频,L是指输入数据为文本。
比照前人的试验成果,李飞飞的这项新研讨数据上相对较高。不过,与前人不同的是,这项新研讨并不依靠一些预先做好的访谈记载,所以来的布景材料更少。而且,这项新研讨无需特征工程,能够直接用输入原始数据。
这张试验成果表格比照了运用不同嵌入方法的成果。其间,前两行是手艺嵌入,第3~6行是预练习嵌入,最终两行是咱们用到的语句级嵌入,输入的是log-mel光谱图、3D面部要害点视频和Word2Vecs的序列。
传送门论文:
Measuring Depression Symptom Severity from Spoken Language and 3D Facial Expressions
Albert Haque, Michelle Guo, Adam S Miner, Li Fei-Fei
https://arxiv.org/abs/1811.08592
— 完 —
诚挚招聘
量子位正在招募修改/记者,工作地点在北京中关村。等待有才华、有热心的同学参加咱们!相关细节,请在量子位大众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
?'?' ? 追寻AI技能和产品新动态