利用申康實(shí)際數(shù)據(jù),用計(jì)算機(jī)模擬專家思維方式的標(biāo)準(zhǔn)化分型,實(shí)現(xiàn)所有申康病例的病例分型。
模型應(yīng)用:先判斷病例為手術(shù)組還是非手術(shù)組,再將病例其他特征值代入所屬組的函數(shù)方程,計(jì)算出4個(gè)P值,哪個(gè)P值最大,就屬于哪種分型。
主要缺點(diǎn):與專家“四型三線”分型的思維方式不完全符合,對病情是單純型,還是復(fù)合型未作考慮,仍有較大分型誤差
算法選擇:進(jìn)行訓(xùn)練數(shù)據(jù)分布特征的描述,根據(jù)數(shù)據(jù)分布選擇合適的回歸方法(線性回歸、嶺回歸、主成因回歸、Logistic回歸?)。
模擬檢驗(yàn):根據(jù)專家確定的病例分型、篩選的關(guān)鍵變量X,利用訓(xùn)練數(shù)據(jù)和選定的回歸分析方法,進(jìn)行12個(gè)函數(shù)方程的模擬,并進(jìn)行檢驗(yàn)。
回歸診斷:為提高模型擬合優(yōu)度,避免參數(shù)估計(jì)偏差,進(jìn)行回歸診斷,包括檢測異常點(diǎn)(嚴(yán)重偏離既定模型,即殘差較其他各點(diǎn)大得多的點(diǎn))、高扛桿點(diǎn)(遠(yuǎn)離設(shè)計(jì)中心的點(diǎn))和強(qiáng)影響點(diǎn)(對既定模型有較大影響的點(diǎn))。
|
|