Predic'ng ¡ALS ¡Progression ¡with ¡ Bayesian ¡Addi've ¡Regression ¡Trees ¡
RECOMB ¡Conference ¡on ¡Regulatory ¡and ¡Systems ¡Genomics ¡
Predic'ng ALS Progression with Bayesian Addi've Regression - - PowerPoint PPT Presentation
Predic'ng ALS Progression with Bayesian Addi've Regression Trees Lilly Fang and Lester Mackey November 13, 2012 RECOMB Conference on Regulatory and Systems
RECOMB ¡Conference ¡on ¡Regulatory ¡and ¡Systems ¡Genomics ¡
§ 12 ¡months ¡of ¡data ¡(demographic, ¡ALSFRS, ¡vital ¡sta's'cs, ¡lab ¡tests) ¡ § Time ¡series: ¡roughly ¡monthly ¡measurements ¡
§ Given ¡first ¡3 ¡months ¡of ¡data ¡
¡
¡
ALS ¡History ¡ ¡Time ¡from ¡onset, ¡ ¡Site ¡of ¡onset ¡ ¡ Family ¡History ¡Mother, ¡Father, ¡Grandmother, ¡Uncle… ¡ ¡ …………………… ¡ ¡ …………………… ¡ ¡
Categorical ¡variables ¡encoded ¡as ¡binary ¡indicators ¡
¡ Demographics ¡ ¡Age, ¡ ¡Race, ¡ ¡Sex ¡ ¡
§ ALSFRS ¡ques'on ¡scores ¡ § Alterna've ¡ALS ¡measures ¡(forced ¡and ¡slow ¡vital ¡capacity) ¡ § Vital ¡signs ¡(weight, ¡height, ¡blood ¡pressure, ¡respiratory ¡rate) ¡ § Lab ¡tests ¡(blood ¡chemistry, ¡hematology, ¡urinalysis) ¡
§ Mean ¡value, ¡standard ¡devia'on, ¡slope, ¡last ¡recorded ¡value, ¡ maximum ¡value… ¡
§ Induces ¡a ¡deriva've ¡'me ¡series ¡ § Extract ¡same ¡summary ¡sta's'cs ¡ ¡
36 ¡ 37 ¡ 38 ¡ 39 ¡ 40 ¡ 0 ¡ 0.5 ¡ 1 ¡ 1.5 ¡ 2 ¡ 2.5 ¡ 3 ¡ 3.5 ¡ ALSFRS ¡ ¡ Score ¡ Months ¡
36 ¡ 37 ¡ 38 ¡ 39 ¡ 40 ¡ 0 ¡ 0.5 ¡ 1 ¡ 1.5 ¡ 2 ¡ 2.5 ¡ 3 ¡ 3.5 ¡ ALSFRS ¡ ¡ Score ¡ Months ¡
¡
36 ¡ 37 ¡ 38 ¡ 39 ¡ 40 ¡ 0 ¡ 0.5 ¡ 1 ¡ 1.5 ¡ 2 ¡ 2.5 ¡ 3 ¡ 3.5 ¡ ALSFRS ¡ ¡ Score ¡ Months ¡
¡
36 ¡ 37 ¡ 38 ¡ 39 ¡ 40 ¡ 0 ¡ 0.5 ¡ 1 ¡ 1.5 ¡ 2 ¡ 2.5 ¡ 3 ¡ 3.5 ¡ ALSFRS ¡ ¡ Score ¡ Months ¡ slope ¡ ¡ ¡-‑1 ¡ slope ¡ ¡ ¡0 ¡ slope ¡ ¡ ¡-‑2 ¡
0 ¡ 36 ¡ 37 ¡ 38 ¡ 39 ¡ 40 ¡ 0 ¡ 0.5 ¡ 1 ¡ 1.5 ¡ 2 ¡ 2.5 ¡ 3 ¡ 3.5 ¡ ALSFRS ¡ ¡ Score ¡ Months ¡ ALSFRS ¡ ¡ Slope ¡ slope ¡ ¡ ¡-‑1 ¡ slope ¡ ¡ ¡0 ¡ slope ¡ ¡ ¡-‑2 ¡
0 ¡ 36 ¡ 37 ¡ 38 ¡ 39 ¡ 40 ¡ 0 ¡ 0.5 ¡ 1 ¡ 1.5 ¡ 2 ¡ 2.5 ¡ 3 ¡ 3.5 ¡ ALSFRS ¡ ¡ Score ¡ Months ¡ ALSFRS ¡ ¡ Slope ¡ slope ¡ ¡ ¡0 ¡ slope ¡ ¡ ¡-‑1 ¡ slope ¡ ¡ ¡-‑2 ¡
0 ¡ 36 ¡ 37 ¡ 38 ¡ 39 ¡ 40 ¡ 0 ¡ 0.5 ¡ 1 ¡ 1.5 ¡ 2 ¡ 2.5 ¡ 3 ¡ 3.5 ¡ ALSFRS ¡ ¡ Score ¡ Months ¡ ALSFRS ¡ ¡ Slope ¡ Features ¡ extracted ¡ Mean ¡= ¡-‑1 ¡ SD ¡= ¡1 ¡ Max ¡= ¡0 ¡ Min ¡= ¡-‑2 ¡ Last ¡= ¡-‑2 ¡ Slope ¡= ¡-‑0.5 ¡
¡
§ Treated ¡as ¡missing ¡if ¡> ¡4 ¡standard ¡devia'ons ¡from ¡mean ¡ ¡
§ Avoid ¡restric've ¡assump'ons ¡about ¡func'onal ¡form ¡
§ Avoid ¡overfijng ¡to ¡irrelevant ¡features ¡
§ Irrelevant ¡features ¡seldom ¡selected ¡
§ Boosted ¡decision ¡trees, ¡random ¡forests ¡
*Chipman, ¡George, ¡and ¡McCulloch ¡(2010) ¡
Days ¡since ¡
Past ¡ALSFRS ¡ slope ¡> ¡-‑0.6 ¡ 0.06 ¡
^ ¡
¡ ^ ¡ ^ ¡ ^ ¡
^ ¡
^ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡^ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡^ ¡ ¡ ¡
¡
2000 4000 6000 8000 10000 0.510 0.520 0.530 0.540 Number of BART Samples Validation RMSD
¡
Top Ten Features Ordered by BART Usage
Average usage 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 Mean ALSFRS Min Turning Score Last ALSFRS Last Weight Slope Last FVC Slope Mean Weight Slope Last Systolic Blood Pressure Slope ALSFRS Slope Max Dressing Score Onset Delta
All 484 Features Ordered by Usage
Average usage 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
5 10 15 20 25 0.515 0.520 0.525 0.530 Effect of Adding Each Feature in Order of BART Usage Features Added in Order of Usage Validation RMSD Onset.Delta max.dressing alsfrs.score.slope last.slope.bp.systolic mean.slope.weight last.slope.fvc.liters last.alsfrs.score last.speech last.handwriting meansquares.speech
1 ¡feature: ¡0.5291 ¡ 3 ¡features: ¡0.5246 ¡ 21 ¡features: ¡0.5113 ¡ 6 ¡features: ¡0.5190 ¡ 14 ¡features: ¡0.5157 ¡
1
Onset.Delta versus ALSFRS Slope on Train and Test Data
Onset.Delta Future ALSFRS Slope
2 4
1
alsfrs.score.slope versus ALSFRS Slope on Train and Test Data
alsfrs.score.slope Future ALSFRS Slope
50
1
last.slope.bp.systolic versus ALSFRS Slope on Train and Test Data
last.slope.bp.systolic Future ALSFRS Slope
1 2 3 4
1
max.dressing versus ALSFRS Slope on Train and Test Data
max.dressing Future ALSFRS Slope
5
1
mean.slope.weight versus ALSFRS Slope on Train and Test Data
mean.slope.weight Future ALSFRS Slope