加拿大的Klick科研人員在頂級(jí)健康雜志《梅奧診所文集:數(shù)字健康》上發(fā)布了一個(gè)AI大模型,只需要聽(tīng)一段6—10秒的語(yǔ)音,就能診斷是否患有2型糖尿病(T2DM)。
目前糖尿病的主要檢測(cè)方式依賴于血糖測(cè)量,但這種方法需要獲取血液樣本對(duì)患者會(huì)造成創(chuàng)傷,同時(shí)還需要專業(yè)設(shè)備成本非常高。為了解決這一檢測(cè)痛點(diǎn),加拿大知名健康科技公司Klick科研人員提出了AI模型檢測(cè)方法。
研究人員收集了267名志愿者的語(yǔ)音樣本,然后通過(guò)AI模型了進(jìn)行了詳細(xì)檢測(cè),結(jié)果顯示,AI準(zhǔn)確地識(shí)別出了2型糖尿病,其中,女性準(zhǔn)確率89%,男性準(zhǔn)確率86%。還發(fā)現(xiàn),“音調(diào)”和“音調(diào)標(biāo)準(zhǔn)差”是診斷2型糖尿病的主要特征之一。
這個(gè)研究與前段時(shí)間Meta提出的使用MEG(腦磁圖)重構(gòu)人類大腦成像過(guò)程類似,都是借助人類的生物體特征,來(lái)觀察其抖動(dòng)數(shù)據(jù)變化確定結(jié)果。
論文地址:https://www.mcpdigitalhealth.org/article/S2949-7612(23)00073-1/fulltext
構(gòu)建數(shù)據(jù)集
研究人員共招募了267名自愿者,其中79名女性和113名男性是非糖尿病患者,18名女性和57名男性被診斷為2型糖尿病患者。
參與者的糖尿病診斷是基于美國(guó)糖尿病學(xué)會(huì)的診斷標(biāo)準(zhǔn),由醫(yī)生確認(rèn)。同時(shí)沒(méi)有神經(jīng)系統(tǒng)或語(yǔ)言障礙史,也沒(méi)有吸煙歷史。
?參與者使用智能手機(jī)應(yīng)用程序錄制固定語(yǔ)句“你好,你好嗎?我現(xiàn)在的血糖水平是多少”,錄制時(shí)間為2周,每天最多6次,總共收集了18,465段語(yǔ)音樣本。
數(shù)據(jù)分割,提取特征
由于年齡和體重指數(shù)等因素會(huì)對(duì)語(yǔ)音數(shù)據(jù)產(chǎn)生影響,研究人員根據(jù)參與者ID將數(shù)據(jù)分割成年齡和體重指數(shù)匹配的數(shù)據(jù)集,用于模型訓(xùn)練和統(tǒng)計(jì)分析,這有助于AI模型能夠?qū)W習(xí)到糖尿病語(yǔ)音的真實(shí)變化。
訓(xùn)練集占所有2型糖尿病患者的50%男性和61%女性。剩余數(shù)據(jù)作為測(cè)試集,用于測(cè)試訓(xùn)練好的AI模型。
接著研究人員從每個(gè)語(yǔ)音樣本中提取了14個(gè)聲學(xué)特征,包括音高、音強(qiáng)、諧波噪聲比、聲響、聲抖等。特徵提取使用的是Parselmouth,這是Praat語(yǔ)音分析軟件的Python接口。
可從原始語(yǔ)音信號(hào)中提取能反映語(yǔ)音變化的數(shù)值特征,為后續(xù)的模型訓(xùn)練和預(yù)測(cè)提供輸入。
選擇模型
考慮到相關(guān)工作中使用的模型,研究人員選擇了邏輯回歸、樸素貝葉斯和支持向量機(jī)等模型。通過(guò)5折交叉驗(yàn)證在訓(xùn)練集上評(píng)估了這些模型的性能,從而找到最佳模型。
?對(duì)女性而言,含3個(gè)特征的邏輯回歸模型效果最好;男性,含2個(gè)特征的樸素貝葉斯模型效果最好。
邏輯回歸模型可以估計(jì)不同特征對(duì)結(jié)果的貢獻(xiàn)程度;樸素貝葉斯模型在小樣本場(chǎng)景下效果較好。然后使用最佳模型,在構(gòu)建的訓(xùn)練集上進(jìn)行預(yù)訓(xùn)練。
模型測(cè)試數(shù)據(jù)
使用訓(xùn)練好的AI模型對(duì)測(cè)試集的數(shù)據(jù)進(jìn)行預(yù)測(cè), 得到每個(gè)樣本屬于2型糖尿病的概率。根據(jù)預(yù)先確定的概率閾值,將樣本預(yù)測(cè)為2型糖尿病或非糖尿病。
同時(shí)使用測(cè)試集的數(shù)據(jù)計(jì)算模型的精確度、敏感度和特異度等評(píng)價(jià)指標(biāo),還可以繪制ROC曲線等來(lái)全面的評(píng)估模型的預(yù)測(cè)性能。
此外,研究人員還將年齡、體重指數(shù)等信息融合到預(yù)測(cè)結(jié)果中,可以提高模型的準(zhǔn)確度。
例如,對(duì)女性平均語(yǔ)音預(yù)測(cè)結(jié)果和體重指數(shù)患病率,對(duì)男性平均語(yǔ)音結(jié)果與年齡、體重指數(shù)患病率。這種集成模塊通過(guò)組合多個(gè)信息源,可以彌補(bǔ)單一模型的缺陷,增強(qiáng)模型的預(yù)測(cè)能力。
測(cè)試結(jié)果顯示,對(duì)女性,語(yǔ)音結(jié)果與體重指數(shù)的2型糖尿病患病率相結(jié)合,在測(cè)試集上達(dá)到了0.89的準(zhǔn)確率、0.91的特異度和0.71的敏感度。
對(duì)男性,語(yǔ)音結(jié)果與年齡和體重指數(shù)的2型糖尿病患病率相結(jié)合,在測(cè)試集上達(dá)到了0.86的準(zhǔn)確率、0.89的特異度和0.75的敏感度。
研究負(fù)責(zé)人Jaycee Kaufman表示,我們?cè)谘芯窟^(guò)程中確定了2型糖尿病患者語(yǔ)音的變化, 這對(duì)于AI大模型檢測(cè)、篩選2型糖尿病有非常高的應(yīng)用價(jià)值。
語(yǔ)音評(píng)估的方法有助于2型糖尿病的早期干預(yù)和管理,同時(shí)減輕疾病的負(fù)擔(dān)改善醫(yī)療效果。
關(guān)于Klick Health
Klick成立于1997年,總部位于加拿大多倫多,是全球領(lǐng)先的健康營(yíng)銷公司。Klick Health使用數(shù)據(jù)驅(qū)動(dòng)的方法來(lái)開(kāi)發(fā)和實(shí)施各種健康和醫(yī)療相關(guān)的營(yíng)銷策略。
Klick提供一系列服務(wù),包括數(shù)字戰(zhàn)略、品牌策略、創(chuàng)新與設(shè)計(jì)、數(shù)據(jù)洞察、內(nèi)容開(kāi)發(fā)和技術(shù)解決方案等。
關(guān)于2型糖尿病
2型糖尿病是一種慢性疾病,主要特征是胰島素抵抗和胰島素分泌功能障礙。身體不能有效地使用胰島素,這種情況被稱為胰島素抵抗。胰島素是一種荷爾蒙,可以幫助我們的身體將血糖轉(zhuǎn)化為能量。
當(dāng)胰島素抵抗發(fā)生時(shí),血糖水平開(kāi)始上升,這可能會(huì)導(dǎo)致各種健康問(wèn)題,包括心臟病、腎病、視力損失和神經(jīng)損傷。
本文素材來(lái)源加拿大Klick論文,如有侵權(quán)請(qǐng)聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國(guó) | RPA全球生態(tài) | 數(shù)字化勞動(dòng)力 | RPA新聞 | 推動(dòng)中國(guó)RPA生態(tài)發(fā)展 | 流 > 聽(tīng)10秒語(yǔ)音就能判斷糖尿病,這個(gè)AI大模型太硬核了!
熱門(mén)信息
閱讀 (14728)
1 2023第三屆中國(guó)RPA+AI開(kāi)發(fā)者大賽圓滿收官&獲獎(jiǎng)名單公示閱讀 (13753)
2 《Market Insight:中國(guó)RPA市場(chǎng)發(fā)展洞察(2022)》報(bào)告正式發(fā)布 | RPA中國(guó)閱讀 (13055)
3 「RPA中國(guó)杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎(jiǎng)名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國(guó)產(chǎn)業(yè)智能大會(huì)成功召開(kāi)閱讀 (11567)
5 《2022年中國(guó)流程挖掘行業(yè)研究報(bào)告》正式發(fā)布 | RPA中國(guó)