Machine ¡Learning ¡
Jay ¡Urbain, ¡PhD ¡
Credits: ¡Tom ¡Mitchell, ¡Andrew ¡Ng, ¡Trevor ¡HasAe, ¡ Robert ¡Tibshirani ¡
Machine Learning Jay Urbain, PhD Credits: Tom Mitchell, - - PowerPoint PPT Presentation
Machine Learning Jay Urbain, PhD Credits: Tom Mitchell, Andrew Ng, Trevor HasAe, Robert Tibshirani Machine Learning (ML) Research and development of
Machine ¡Learning ¡
Jay ¡Urbain, ¡PhD ¡
Credits: ¡Tom ¡Mitchell, ¡Andrew ¡Ng, ¡Trevor ¡HasAe, ¡ Robert ¡Tibshirani ¡
Machine ¡Learning ¡(ML) ¡
and ¡make ¡predicAons ¡on ¡data. ¡ ¡
make ¡data-‑driven ¡predicAons ¡or ¡decisions, ¡rather ¡than ¡ following ¡staAc ¡program ¡instrucAons. ¡
hLp://www.wicab.com/ brainport-‑v100 ¡ ¡ General ¡algorithm ¡for ¡learning? ¡
Machine ¡Learning ¡
¡ Examples: ¡ ¡
Large ¡datasets ¡from ¡growth ¡of ¡automaAon/web. ¡ ¡ ¡ E.g., ¡Web ¡click ¡data, ¡medical ¡records, ¡biology, ¡sensor ¡data ¡
E.g., ¡Autonomous ¡helicopter, ¡handwriAng ¡recogniAon, ¡most ¡of ¡Natural ¡ Language ¡Processing ¡(NLP), ¡Image ¡RecogniAon. ¡ ¡
E.g., ¡Amazon, ¡NeXlix ¡product ¡recommendaAons ¡
¡
Machine ¡Learning ¡in ¡the ¡News ¡
– Voice ¡recogniAon ¡ – Extract ¡knowledge ¡from ¡text ¡(i2b2) ¡ – Open ¡domain ¡quesAon/answering ¡
– Maximum ¡likelihood ¡given ¡context ¡(lbp) ¡
– Integrate ¡and ¡rank ¡results ¡from ¡mulAple ¡ learning ¡methods ¡(search) ¡
– Watson ¡becomes ¡smarter ¡as ¡it ¡tries ¡to ¡ answer ¡quesAons ¡— ¡and ¡to ¡learn ¡as ¡it ¡gets ¡ them ¡right ¡or ¡wrong. ¡ "Building ¡Watson: ¡An ¡Overview ¡of ¡the ¡ DeepQA ¡Project," ¡wriLen ¡by ¡the ¡IBM ¡Watson ¡ Research ¡Team, ¡led ¡by ¡David ¡Ferucci. ¡ hLp://www.aaai.org/Magazine/Watson/watson.php ¡ ¡ hLps://www.youtube.com/watch?v=WFR3lOm_xhE ¡ ¡
InformaAon ¡Retrieval, ¡ Natural ¡Language ¡Processing ¡
Learn ¡PredicAve ¡Models ¡from ¡Data ¡
hLp://fivethirtyeight.com/features/how-‑the-‑fivethirtyeight-‑senate-‑forecast-‑model-‑works/ ¡ ¡
Image ¡ClassificaAon ¡
special ¡kind ¡of ¡mulA-‑layer ¡neural ¡
recognize ¡visual ¡paLerns ¡directly ¡from ¡ pixel ¡images ¡with ¡minimal ¡preprocessing. ¡ ¡ ¡
variability ¡(such ¡as ¡handwriLen ¡ characters), ¡and ¡with ¡robustness ¡to ¡ distorAons ¡and ¡simple ¡geometric ¡
hLp://yann.lecun.com/exdb/lenet/ ¡ ¡ ¡
Image ¡ClassificaAon: ¡state ¡of ¡the ¡art ¡
million ¡high-‑resoluAon ¡images ¡using ¡GPUs. ¡
Reinforcement ¡Learning ¡
– Autonomous ¡Helicopter ¡AerobaAcs ¡through ¡ApprenAceship ¡Learning, ¡Pieter ¡Abbeel, ¡ Adam ¡Coates, ¡and ¡Andrew ¡Y. ¡Ng. ¡IJRR, ¡2010. ¡ ¡ – Learning ¡for ¡Control ¡from ¡MulAple ¡DemonstraAons, ¡Adam ¡Coates, ¡Pieter ¡Abbeel, ¡and ¡ Andrew ¡Y. ¡Ng. ¡ICML, ¡2008. ¡
hLps://www.youtube.com/watch?feature=player_embedded&v=VCdxqn0fcnE ¡ ¡ ¡ ¡
Recommender ¡Systems ¡
hLp://www.neXlixprize.com/ ¡ ¡
computers ¡the ¡ability ¡to ¡learn ¡without ¡being ¡explicitly ¡programmed. ¡ ¡
program ¡is ¡said ¡to ¡learn ¡from ¡experience ¡E ¡with ¡respect ¡to ¡some ¡task ¡ T ¡and ¡some ¡performance ¡measure ¡P, ¡if ¡its ¡performance ¡on ¡T, ¡as ¡ measured ¡by ¡P, ¡improves ¡with ¡experience ¡E. ¡ ¡
Machine ¡Learning ¡definiAon ¡
Classifying ¡emails ¡as ¡spam ¡or ¡not ¡spam. ¡ ¡ Watching ¡you ¡label ¡emails ¡as ¡spam ¡or ¡not ¡spam. ¡ ¡ The ¡number ¡(or ¡fracAon) ¡of ¡emails ¡correctly ¡classified ¡as ¡spam/not ¡spam. ¡ ¡ None ¡of ¡the ¡above—this ¡is ¡not ¡a ¡machine ¡learning ¡problem. ¡
Suppose ¡your ¡email ¡program ¡watches ¡which ¡emails ¡you ¡do ¡or ¡do ¡ not ¡mark ¡as ¡spam, ¡and ¡based ¡on ¡that ¡learns ¡how ¡to ¡beLer ¡filter ¡
¡
“A ¡computer ¡program ¡is ¡said ¡to ¡learn ¡from ¡experience ¡E ¡with ¡respect ¡to ¡ some ¡task ¡T ¡and ¡some ¡performance ¡measure ¡P, ¡if ¡its ¡performance ¡on ¡T, ¡ as ¡measured ¡by ¡P, ¡improves ¡with ¡experience ¡E.” ¡
Machine ¡learning ¡algorithms: ¡
Applying ¡learning ¡algorithms. ¡ ¡
0 ¡ 100 ¡ 200 ¡ 300 ¡ 400 ¡ 0 ¡ 500 ¡ 1000 ¡ 1500 ¡ 2000 ¡ 2500 ¡
Housing ¡price ¡predicAon. ¡Regression. ¡ ¡
Price ¡($) ¡ ¡ in ¡1000’s ¡ Size ¡in ¡feet2 ¡ ¡
Regression: ¡Predict ¡conAnuous ¡ valued ¡output ¡(price) ¡ Supervised ¡Learning ¡ “right ¡answers” ¡given ¡
Breast ¡cancer ¡(malignant, ¡benign) ¡
ClassificaAon ¡ Discrete ¡valued ¡
Malignant? ¡
1(Y) ¡ 0(N) ¡
Tumor ¡Size ¡
Tumor ¡Size ¡ Age ¡
… ¡
Treat ¡both ¡as ¡classificaAon ¡problems. ¡ ¡ Treat ¡problem ¡1 ¡as ¡a ¡classificaAon ¡problem, ¡problem ¡2 ¡as ¡a ¡regression ¡problem. ¡ ¡ Treat ¡problem ¡1 ¡as ¡a ¡regression ¡problem, ¡problem ¡2 ¡as ¡a ¡classificaAon ¡problem. ¡ ¡ Treat ¡both ¡as ¡regression ¡problems. ¡ ¡ You’re ¡running ¡a ¡company, ¡and ¡you ¡want ¡to ¡develop ¡learning ¡algorithms ¡to ¡address ¡ each ¡of ¡two ¡problems. ¡ ¡ Problem ¡1: ¡You ¡have ¡a ¡large ¡inventory ¡of ¡idenAcal ¡items. ¡ ¡You ¡want ¡to ¡predict ¡how ¡ many ¡of ¡these ¡items ¡will ¡sell ¡over ¡the ¡next ¡3 ¡months. ¡ Problem ¡2: ¡You’d ¡like ¡somware ¡to ¡examine ¡individual ¡customer ¡accounts, ¡and ¡for ¡each ¡ account ¡decide ¡if ¡it ¡has ¡been ¡hacked. ¡ ¡ Should ¡you ¡treat ¡these ¡as ¡classificaAon ¡or ¡as ¡regression ¡problems? ¡ ¡
x1 ¡ x2 ¡
Supervised ¡Learning ¡
Unsupervised ¡Learning ¡
x1 ¡ x2 ¡
[Source: ¡Daphne ¡Koller] ¡
Genes ¡
Individuals ¡
Organize ¡compuAng ¡clusters ¡ Social ¡network ¡analysis ¡
Image ¡credit: ¡NASA/JPL-‑Caltech/E. ¡Churchwell ¡(Univ. ¡of ¡Wisconsin, ¡Madison) ¡ ¡Astronomical ¡data ¡analysis ¡ Market ¡segmentaAon ¡
Of ¡the ¡following ¡examples, ¡which ¡would ¡you ¡address ¡using ¡an ¡ unsupervised ¡learning ¡algorithm? ¡ ¡(Check ¡all ¡that ¡apply.) ¡ ¡ ¡
Given ¡a ¡database ¡of ¡customer ¡data, ¡automaAcally ¡discover ¡market ¡ segments ¡and ¡group ¡customers ¡into ¡different ¡market ¡segments. ¡ ¡ Given ¡email ¡labeled ¡as ¡spam/not ¡spam, ¡learn ¡a ¡spam ¡filter. ¡ Given ¡a ¡set ¡of ¡news ¡arAcles ¡found ¡on ¡the ¡web, ¡group ¡them ¡into ¡ sets ¡of ¡arAcles ¡about ¡the ¡same ¡story. ¡ ¡ Given ¡a ¡dataset ¡of ¡paAents ¡diagnosed ¡as ¡either ¡having ¡diabetes ¡or ¡ not, ¡learn ¡to ¡classify ¡new ¡paAents ¡as ¡having ¡diabetes ¡or ¡not. ¡ ¡
ObjecAves ¡
On ¡the ¡basis ¡of ¡the ¡training ¡data ¡we ¡would ¡like ¡to: ¡
Philosophy ¡
techniques, ¡in ¡order ¡to ¡know ¡how ¡and ¡when ¡to ¡use ¡them. ¡
grasp ¡the ¡more ¡sophisAcated ¡ones. ¡
method, ¡to ¡know ¡how ¡well ¡or ¡how ¡badly ¡it ¡is ¡working ¡(simpler ¡ methods ¡omen ¡perform ¡as ¡well ¡as ¡complex ¡ones!) ¡
applicaAons ¡in ¡science, ¡medicine, ¡industry ¡and ¡finance. ¡
¡