Machine Learning Jay Urbain, PhD Credits: Tom Mitchell, - - PowerPoint PPT Presentation

machine learning
SMART_READER_LITE
LIVE PREVIEW

Machine Learning Jay Urbain, PhD Credits: Tom Mitchell, - - PowerPoint PPT Presentation

Machine Learning Jay Urbain, PhD Credits: Tom Mitchell, Andrew Ng, Trevor HasAe, Robert Tibshirani Machine Learning (ML) Research and development of


slide-1
SLIDE 1

Machine ¡Learning ¡

Jay ¡Urbain, ¡PhD ¡

Credits: ¡Tom ¡Mitchell, ¡Andrew ¡Ng, ¡Trevor ¡HasAe, ¡ Robert ¡Tibshirani ¡

slide-2
SLIDE 2

Machine ¡Learning ¡(ML) ¡

  • Research ¡and ¡development ¡of ¡algorithms ¡that ¡can ¡learn ¡from ¡

and ¡make ¡predicAons ¡on ¡data. ¡ ¡

  • ML ¡algorithms ¡build ¡a ¡model ¡from ¡example ¡inputs ¡in ¡order ¡to ¡

make ¡data-­‑driven ¡predicAons ¡or ¡decisions, ¡rather ¡than ¡ following ¡staAc ¡program ¡instrucAons. ¡

slide-3
SLIDE 3
slide-4
SLIDE 4

SPAM

slide-5
SLIDE 5

hLp://www.wicab.com/ brainport-­‑v100 ¡ ¡ General ¡algorithm ¡for ¡learning? ¡

slide-6
SLIDE 6

Machine ¡Learning ¡

  • ­‑ ¡Grew ¡out ¡of ¡work ¡in ¡AI ¡and ¡staAsAcal ¡modeling ¡
  • ­‑ ¡New ¡capability ¡for ¡computers ¡ ¡

¡ Examples: ¡ ¡

  • ­‑ ¡Data ¡mining ¡ ¡

Large ¡datasets ¡from ¡growth ¡of ¡automaAon/web. ¡ ¡ ¡ E.g., ¡Web ¡click ¡data, ¡medical ¡records, ¡biology, ¡sensor ¡data ¡

  • ­‑ ¡ApplicaAons ¡that ¡can’t ¡easily ¡be ¡programmed ¡by ¡hand. ¡

E.g., ¡Autonomous ¡helicopter, ¡handwriAng ¡recogniAon, ¡most ¡of ¡Natural ¡ Language ¡Processing ¡(NLP), ¡Image ¡RecogniAon. ¡ ¡

  • ­‑ ¡Self-­‑customizing ¡programs ¡

E.g., ¡Amazon, ¡NeXlix ¡product ¡recommendaAons ¡

  • ­‑ ¡Understanding ¡human ¡learning ¡(brain, ¡real ¡AI). ¡

¡

slide-7
SLIDE 7

Machine ¡Learning ¡in ¡the ¡News ¡

  • Natural ¡language ¡processing ¡

– Voice ¡recogniAon ¡ – Extract ¡knowledge ¡from ¡text ¡(i2b2) ¡ – Open ¡domain ¡quesAon/answering ¡

  • StaAsAcal ¡modeling ¡

– Maximum ¡likelihood ¡given ¡context ¡(lbp) ¡

  • Fusion ¡

– Integrate ¡and ¡rank ¡results ¡from ¡mulAple ¡ learning ¡methods ¡(search) ¡

  • Online ¡Machine ¡Learning ¡

– Watson ¡becomes ¡smarter ¡as ¡it ¡tries ¡to ¡ answer ¡quesAons ¡— ¡and ¡to ¡learn ¡as ¡it ¡gets ¡ them ¡right ¡or ¡wrong. ¡ "Building ¡Watson: ¡An ¡Overview ¡of ¡the ¡ DeepQA ¡Project," ¡wriLen ¡by ¡the ¡IBM ¡Watson ¡ Research ¡Team, ¡led ¡by ¡David ¡Ferucci. ¡ hLp://www.aaai.org/Magazine/Watson/watson.php ¡ ¡ hLps://www.youtube.com/watch?v=WFR3lOm_xhE ¡ ¡

slide-8
SLIDE 8

InformaAon ¡Retrieval, ¡ Natural ¡Language ¡Processing ¡

slide-9
SLIDE 9

Learn ¡PredicAve ¡Models ¡from ¡Data ¡

hLp://fivethirtyeight.com/features/how-­‑the-­‑fivethirtyeight-­‑senate-­‑forecast-­‑model-­‑works/ ¡ ¡

slide-10
SLIDE 10

Image ¡ClassificaAon ¡

  • ConvoluAonal ¡Neural ¡Networks ¡are ¡are ¡a ¡

special ¡kind ¡of ¡mulA-­‑layer ¡neural ¡

  • networks. ¡ ¡
  • Use ¡back-­‑propagaAon ¡algorithm. ¡ ¡
  • Architecture ¡of ¡network ¡designed ¡to ¡

recognize ¡visual ¡paLerns ¡directly ¡from ¡ pixel ¡images ¡with ¡minimal ¡preprocessing. ¡ ¡ ¡

  • Can ¡recognize ¡paLerns ¡with ¡extreme ¡

variability ¡(such ¡as ¡handwriLen ¡ characters), ¡and ¡with ¡robustness ¡to ¡ distorAons ¡and ¡simple ¡geometric ¡

  • transformaAons. ¡ ¡

hLp://yann.lecun.com/exdb/lenet/ ¡ ¡ ¡

slide-11
SLIDE 11

Image ¡ClassificaAon: ¡state ¡of ¡the ¡art ¡

  • Deep ¡learning ¡using ¡convoluAon ¡networks. ¡
  • Trained ¡a ¡large, ¡deep ¡convoluAonal ¡neural ¡network ¡to ¡classify ¡the ¡1.2 ¡

million ¡high-­‑resoluAon ¡images ¡using ¡GPUs. ¡

  • hLp://www.cs.toronto.edu/~fritz/absps/imagenet.pdf ¡ ¡
slide-12
SLIDE 12

Reinforcement ¡Learning ¡

  • hLp://heli.stanford.edu/ ¡ ¡

– Autonomous ¡Helicopter ¡AerobaAcs ¡through ¡ApprenAceship ¡Learning, ¡Pieter ¡Abbeel, ¡ Adam ¡Coates, ¡and ¡Andrew ¡Y. ¡Ng. ¡IJRR, ¡2010. ¡ ¡ – Learning ¡for ¡Control ¡from ¡MulAple ¡DemonstraAons, ¡Adam ¡Coates, ¡Pieter ¡Abbeel, ¡and ¡ Andrew ¡Y. ¡Ng. ¡ICML, ¡2008. ¡

hLps://www.youtube.com/watch?feature=player_embedded&v=VCdxqn0fcnE ¡ ¡ ¡ ¡

slide-13
SLIDE 13

Recommender ¡Systems ¡

  • Content ¡filtering ¡
  • CollaboraAve ¡filtering ¡

hLp://www.neXlixprize.com/ ¡ ¡

slide-14
SLIDE 14
  • Arthur ¡Samuel ¡(1959). ¡Machine ¡Learning: ¡Field ¡of ¡study ¡that ¡gives ¡

computers ¡the ¡ability ¡to ¡learn ¡without ¡being ¡explicitly ¡programmed. ¡ ¡

  • Tom ¡Mitchell ¡(1998) ¡Well-­‑posed ¡Learning ¡Problem: ¡A ¡computer ¡

program ¡is ¡said ¡to ¡learn ¡from ¡experience ¡E ¡with ¡respect ¡to ¡some ¡task ¡ T ¡and ¡some ¡performance ¡measure ¡P, ¡if ¡its ¡performance ¡on ¡T, ¡as ¡ measured ¡by ¡P, ¡improves ¡with ¡experience ¡E. ¡ ¡

Machine ¡Learning ¡definiAon ¡

slide-15
SLIDE 15

Classifying ¡emails ¡as ¡spam ¡or ¡not ¡spam. ¡ ¡ Watching ¡you ¡label ¡emails ¡as ¡spam ¡or ¡not ¡spam. ¡ ¡ The ¡number ¡(or ¡fracAon) ¡of ¡emails ¡correctly ¡classified ¡as ¡spam/not ¡spam. ¡ ¡ None ¡of ¡the ¡above—this ¡is ¡not ¡a ¡machine ¡learning ¡problem. ¡

Suppose ¡your ¡email ¡program ¡watches ¡which ¡emails ¡you ¡do ¡or ¡do ¡ not ¡mark ¡as ¡spam, ¡and ¡based ¡on ¡that ¡learns ¡how ¡to ¡beLer ¡filter ¡

  • spam. ¡ ¡What ¡is ¡the ¡task ¡T ¡in ¡this ¡senng? ¡ ¡

¡

“A ¡computer ¡program ¡is ¡said ¡to ¡learn ¡from ¡experience ¡E ¡with ¡respect ¡to ¡ some ¡task ¡T ¡and ¡some ¡performance ¡measure ¡P, ¡if ¡its ¡performance ¡on ¡T, ¡ as ¡measured ¡by ¡P, ¡improves ¡with ¡experience ¡E.” ¡

slide-16
SLIDE 16

Machine ¡learning ¡algorithms: ¡

  • ­‑ Supervised ¡learning ¡
  • ­‑ Unsupervised ¡learning ¡
  • ­‑ Reinforcement ¡learning ¡
  • ­‑ Semi-­‑supervised ¡
  • ­‑ Etc. ¡

Applying ¡learning ¡algorithms. ¡ ¡

slide-17
SLIDE 17

0 ¡ 100 ¡ 200 ¡ 300 ¡ 400 ¡ 0 ¡ 500 ¡ 1000 ¡ 1500 ¡ 2000 ¡ 2500 ¡

Housing ¡price ¡predicAon. ¡Regression. ¡ ¡

Price ¡($) ¡ ¡ in ¡1000’s ¡ Size ¡in ¡feet2 ¡ ¡

Regression: ¡Predict ¡conAnuous ¡ valued ¡output ¡(price) ¡ Supervised ¡Learning ¡ “right ¡answers” ¡given ¡

slide-18
SLIDE 18

Breast ¡cancer ¡(malignant, ¡benign) ¡

ClassificaAon ¡ Discrete ¡valued ¡

  • utput ¡(0 ¡or ¡1) ¡

Malignant? ¡

1(Y) ¡ 0(N) ¡

Tumor ¡Size ¡

slide-19
SLIDE 19

Tumor ¡Size ¡ Age ¡

  • ­‑ Clump ¡Thickness ¡
  • ­‑ Uniformity ¡of ¡Cell ¡Size ¡
  • ­‑ Uniformity ¡of ¡Cell ¡Shape ¡

… ¡

slide-20
SLIDE 20

Treat ¡both ¡as ¡classificaAon ¡problems. ¡ ¡ Treat ¡problem ¡1 ¡as ¡a ¡classificaAon ¡problem, ¡problem ¡2 ¡as ¡a ¡regression ¡problem. ¡ ¡ Treat ¡problem ¡1 ¡as ¡a ¡regression ¡problem, ¡problem ¡2 ¡as ¡a ¡classificaAon ¡problem. ¡ ¡ Treat ¡both ¡as ¡regression ¡problems. ¡ ¡ You’re ¡running ¡a ¡company, ¡and ¡you ¡want ¡to ¡develop ¡learning ¡algorithms ¡to ¡address ¡ each ¡of ¡two ¡problems. ¡ ¡ Problem ¡1: ¡You ¡have ¡a ¡large ¡inventory ¡of ¡idenAcal ¡items. ¡ ¡You ¡want ¡to ¡predict ¡how ¡ many ¡of ¡these ¡items ¡will ¡sell ¡over ¡the ¡next ¡3 ¡months. ¡ Problem ¡2: ¡You’d ¡like ¡somware ¡to ¡examine ¡individual ¡customer ¡accounts, ¡and ¡for ¡each ¡ account ¡decide ¡if ¡it ¡has ¡been ¡hacked. ¡ ¡ Should ¡you ¡treat ¡these ¡as ¡classificaAon ¡or ¡as ¡regression ¡problems? ¡ ¡

slide-21
SLIDE 21

x1 ¡ x2 ¡

Supervised ¡Learning ¡

slide-22
SLIDE 22

Unsupervised ¡Learning ¡

x1 ¡ x2 ¡

slide-23
SLIDE 23
slide-24
SLIDE 24
slide-25
SLIDE 25

[Source: ¡Daphne ¡Koller] ¡

Genes ¡

Individuals ¡

slide-26
SLIDE 26

Organize ¡compuAng ¡clusters ¡ Social ¡network ¡analysis ¡

Image ¡credit: ¡NASA/JPL-­‑Caltech/E. ¡Churchwell ¡(Univ. ¡of ¡Wisconsin, ¡Madison) ¡ ¡

Astronomical ¡data ¡analysis ¡ Market ¡segmentaAon ¡

slide-27
SLIDE 27

Of ¡the ¡following ¡examples, ¡which ¡would ¡you ¡address ¡using ¡an ¡ unsupervised ¡learning ¡algorithm? ¡ ¡(Check ¡all ¡that ¡apply.) ¡ ¡ ¡

Given ¡a ¡database ¡of ¡customer ¡data, ¡automaAcally ¡discover ¡market ¡ segments ¡and ¡group ¡customers ¡into ¡different ¡market ¡segments. ¡ ¡ Given ¡email ¡labeled ¡as ¡spam/not ¡spam, ¡learn ¡a ¡spam ¡filter. ¡ Given ¡a ¡set ¡of ¡news ¡arAcles ¡found ¡on ¡the ¡web, ¡group ¡them ¡into ¡ sets ¡of ¡arAcles ¡about ¡the ¡same ¡story. ¡ ¡ Given ¡a ¡dataset ¡of ¡paAents ¡diagnosed ¡as ¡either ¡having ¡diabetes ¡or ¡ not, ¡learn ¡to ¡classify ¡new ¡paAents ¡as ¡having ¡diabetes ¡or ¡not. ¡ ¡

slide-28
SLIDE 28

ObjecAves ¡

On ¡the ¡basis ¡of ¡the ¡training ¡data ¡we ¡would ¡like ¡to: ¡

  • Accurately ¡predict ¡unseen ¡test ¡cases. ¡
  • Understand ¡which ¡inputs ¡affect ¡the ¡outcome, ¡and ¡how. ¡
  • Assess ¡the ¡quality ¡of ¡our ¡predicAons ¡and ¡inferences. ¡
slide-29
SLIDE 29

Philosophy ¡

  • It ¡is ¡important ¡to ¡understand ¡the ¡ideas ¡behind ¡the ¡various ¡

techniques, ¡in ¡order ¡to ¡know ¡how ¡and ¡when ¡to ¡use ¡them. ¡

  • One ¡has ¡to ¡understand ¡the ¡simpler ¡methods ¡first, ¡in ¡order ¡to ¡

grasp ¡the ¡more ¡sophisAcated ¡ones. ¡

  • It ¡is ¡important ¡to ¡accurately ¡assess ¡the ¡performance ¡of ¡a ¡

method, ¡to ¡know ¡how ¡well ¡or ¡how ¡badly ¡it ¡is ¡working ¡(simpler ¡ methods ¡omen ¡perform ¡as ¡well ¡as ¡complex ¡ones!) ¡

  • This ¡is ¡an ¡exciAng ¡research ¡area, ¡having ¡important ¡

applicaAons ¡in ¡science, ¡medicine, ¡industry ¡and ¡finance. ¡

¡