Schedule 8:45 Object detec)on 10:15 Spotlights - - PowerPoint PPT Presentation

schedule
SMART_READER_LITE
LIVE PREVIEW

Schedule 8:45 Object detec)on 10:15 Spotlights - - PowerPoint PPT Presentation

Schedule 8:45 Object detec)on 10:15 Spotlights 10:00 9:25 9:10 9:45 11:00 Classifica)on&localiza)on 12:15 Spotlights 11:15 11:30


slide-1
SLIDE 1

8:45 ¡ ¡Object ¡detec)on ¡ ¡ ¡ ¡ ¡ 11:00 ¡Classifica)on&localiza)on ¡ ¡ ¡ ¡ ¡ 14:00 ¡Awards&Discussion ¡ ¡ ¡ 15:00 ¡Poster ¡and ¡live ¡demo ¡session ¡

Schedule ¡

9:25 ¡ 9:45 ¡ 10:00 ¡ 10:15 ¡Spotlights ¡ 11:45 ¡ 12:00 ¡ 11:15 ¡ 11:30 ¡ 9:10 ¡ 12:15 ¡Spotlights ¡ 14:20 ¡ 14:30 ¡ 14:00 ¡ 14:10 ¡ 14:40 ¡Discussion ¡

Awards ¡ Many ¡thanks ¡to: ¡

ILSVRC2014 ¡sponsors ¡ ILSVRC2014 ¡awards ¡sponsor ¡ Volunteer ¡videographer ¡

Koen ¡ van ¡de ¡Sande ¡

slide-2
SLIDE 2

ILSVRC ¡Task ¡2: ¡Classifica)on ¡+ ¡Localiza)on ¡

Steel ¡drum ¡

slide-3
SLIDE 3

✔ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡

Steel ¡drum ¡

ILSVRC ¡Task ¡2: ¡Classifica)on ¡+ ¡Localiza)on ¡

slide-4
SLIDE 4

✔ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡

✗ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡(bad ¡localiza)on) ¡

✗ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡ Picket ¡ fence ¡

King ¡ penguin ¡ Output ¡(bad ¡classifica)on) ¡

Steel ¡drum ¡

ILSVRC ¡Task ¡2: ¡Classifica)on ¡+ ¡Localiza)on ¡

slide-5
SLIDE 5

✔ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡

Steel ¡drum ¡

ILSVRC ¡Task ¡2: ¡Classifica)on ¡+ ¡Localiza)on ¡

Error ¡= ¡ ¡ ¡

Σ ¡

100,000 ¡ images ¡

1[incorrect ¡on ¡image ¡i] ¡

1 ¡ 100,000 ¡

slide-6
SLIDE 6

ILSVRC2014 ¡localiza)on ¡results: ¡ with ¡provided ¡training ¡data ¡only ¡

Team ¡Name ¡ Error ¡(%) ¡ VGG ¡ 25.3 ¡ GoogLeNet ¡ 26.4 ¡ SYSU_Vision ¡ 31.9 ¡ MIL ¡ 33.7 ¡ MSRA ¡Visual ¡compu)ng ¡ 35.5 ¡ ORANGE-­‑BUPT ¡ 42.8 ¡ Cldi-­‑KAIST ¡ 46.9 ¡ TTIC_ECP ¡– ¡Epitomic ¡Vision ¡ 48.3 ¡ Brno ¡University ¡of ¡Technology ¡ 52.0 ¡

Andrew ¡Howard, ¡BDC-­‑I2R-­‑UPMC, ¡BREIL_KAIST, ¡ DeepCNet, ¡DeeperVision, ¡Fengjun ¡Lv, ¡libccv, ¡NUS-­‑BST, ¡ PassBy, ¡SCUT_GLH, ¡UI, ¡UvA-­‑Euvision, ¡XYZ ¡

VGG: ¡

Karen ¡Simonyan, ¡ Andrew ¡Zisserman ¡ University ¡of ¡Oxford ¡

GoogLeNet: ¡

Chris)an ¡Szegedy, ¡Wei ¡Liu, ¡Yangqing ¡ Jia, ¡Pierre ¡Sermanet, ¡Scoo ¡Reed, ¡ Drago ¡Anguelov, ¡Dumitru ¡Erhan, ¡ Andrew ¡Rabinovich ¡ Google ¡

slide-7
SLIDE 7

ILSVRC2014 ¡localiza)on ¡results: ¡ with ¡addi)onal ¡training ¡data ¡

Team ¡Name ¡ Error ¡(%) ¡ Adobe-­‑UIUC ¡ 30.1 ¡ Trimps-­‑Soushen ¡ 42.2 ¡ ORANGE-­‑BUPT ¡ 42.7 ¡ CASIA_CRIPAC_Weak_Supervision ¡ 62.0 ¡ Adobe-­‑UIUC: ¡

Hailin ¡Jin† ¡, ¡Zhaowen ¡Wang‡ ¡, ¡ Jianchao ¡Yang† ¡, ¡Zhe ¡Lin† ¡ † ¡ ¡= ¡Adobe ¡ ‡ ¡= ¡UIUC ¡

Trimps-­‑Soushen: ¡

Jie ¡Shao, ¡Xiaoteng ¡Zhang, ¡JianYing ¡ Zhou, ¡Jian ¡Wang, ¡Jian ¡Chen, ¡Yanfeng ¡ Shang, ¡Wenfei ¡Wang, ¡Lin ¡Mei, ¡ Chuanping ¡Hu ¡ ¡ The ¡Third ¡Research ¡Ins)tute ¡of ¡the ¡ Ministry ¡of ¡Public ¡Security ¡ ¡

slide-8
SLIDE 8

✔ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡(bad ¡localiza)on) ¡

✗ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡ Picket ¡ fence ¡

King ¡ penguin ¡ Output ¡(bad ¡classifica)on) ¡

Steel ¡drum ¡

ILSVRC ¡Task ¡2a: ¡Classifica)on-­‑only ¡

✔ ¡

slide-9
SLIDE 9

✔ ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡

Folding ¡ chair ¡ Persian ¡ cat ¡ Loud ¡ speaker ¡

Steel ¡ drum ¡

Picket ¡ fence ¡

Output ¡(bad ¡localiza)on) ¡

Steel ¡drum ¡

ILSVRC ¡Task ¡2a: ¡Classifica)on-­‑only ¡

✔ ¡

Error ¡= ¡ ¡ ¡

100,000 ¡ images ¡

1[ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡] ¡

Incorrect ¡

  • n ¡image ¡i ¡

1 ¡ 100,000 ¡Σ ¡

slide-10
SLIDE 10

ILSVRC2014 ¡classifica)on ¡results: ¡ with ¡provided ¡training ¡data ¡only ¡

Team ¡Name ¡ Error ¡(%) ¡ GoogLeNet ¡ 6.7 ¡ VGG ¡ 7.3 ¡ MSRA ¡Visual ¡compu)ng ¡ 8.1 ¡ Andrew ¡Howard ¡ ¡ 8.1 ¡ DeeperVision ¡ 9.5 ¡ NUS-­‑BST ¡ 9.8 ¡ TTIC_ECP ¡– ¡Epitomic ¡Vision ¡ 10.2 ¡ XYZ ¡ 11.2 ¡ BDC-­‑I2R-­‑UPMC ¡ 11.3 ¡

BREIL_KAIST, ¡Brno ¡University ¡of ¡Technology, ¡Cldi-­‑KAIST, ¡ DeepCNet, ¡Fengjun ¡Lv, ¡libccv, ¡MIL, ¡Orange-­‑BUPT, ¡ PassBy, ¡SCUT_GLH, ¡SYSU_Vision, ¡UI, ¡UvA-­‑Euvision ¡

VGG: ¡

Karen ¡Simonyan, ¡ Andrew ¡Zisserman ¡ University ¡of ¡Oxford ¡

GoogLeNet: ¡

Chris)an ¡Szegedy, ¡Wei ¡Liu, ¡Yangqing ¡ Jia, ¡Pierre ¡Sermanet, ¡Scoo ¡Reed, ¡ Drago ¡Anguelov, ¡Dumitru ¡Erhan, ¡ Andrew ¡Rabinovich ¡ Google ¡

slide-11
SLIDE 11

ILSVRC2014 ¡classifica)on ¡results: ¡ with ¡addi)onal ¡training ¡data ¡

Team ¡Name ¡ Error ¡(%) ¡ CASIA_CRIPAC_Weak_Supervision ¡ 11.4 ¡ Trimps-­‑Soushen ¡ 11.5 ¡ Adobe-­‑UIUC ¡ 11.6 ¡ ORANGE-­‑BUPT ¡ 14.8 ¡ CASIA_CRIPAC_Weak_Supervision: ¡

Weiqiang ¡Ren, ¡Chong ¡Wang, ¡Yanhua ¡ Chen, ¡Kaiqi ¡Huang, ¡Tieniu ¡Tan ¡ ¡ CRIPAC, ¡CASIA ¡

Trimps-­‑Soushen: ¡

Jie ¡Shao, ¡Xiaoteng ¡Zhang, ¡JianYing ¡Zhou, ¡ Jian ¡Wang, ¡Jian ¡Chen, ¡Yanfeng ¡Shang, ¡ Wenfei ¡Wang, ¡Lin ¡Mei, ¡Chuanping ¡Hu ¡ ¡ The ¡Third ¡Research ¡Ins)tute ¡of ¡the ¡ Ministry ¡of ¡Public ¡Security ¡ ¡

slide-12
SLIDE 12

Easiest ¡localiza)on ¡ ¡categories ¡

(Highest ¡accuracy ¡in ¡percent ¡achieved ¡by ¡any ¡method ¡in ¡ILSVRC2013 ¡and ¡ILSVRC2014) ¡ ¡

hop://arxiv.org/abs/1409.0575 ¡

slide-13
SLIDE 13

Hardest ¡localiza)on ¡ ¡categories ¡

(Highest ¡accuracy ¡in ¡percent ¡achieved ¡by ¡any ¡method ¡in ¡ILSVRC2013 ¡and ¡ILSVRC2014) ¡ ¡

hop://arxiv.org/abs/1409.0575 ¡

slide-14
SLIDE 14

Easiest ¡classifica)on ¡categories ¡

(Highest ¡accuracy ¡in ¡percent ¡achieved ¡by ¡any ¡method ¡in ¡ILSVRC2013 ¡and ¡ILSVRC2014) ¡ ¡

hop://arxiv.org/abs/1409.0575 ¡ … ¡and ¡111 ¡more ¡categories ¡with ¡100% ¡accuracy! ¡

slide-15
SLIDE 15

Hardest ¡classifica)on ¡categories ¡

(Highest ¡accuracy ¡in ¡percent ¡achieved ¡by ¡any ¡method ¡in ¡ILSVRC2013 ¡and ¡ILSVRC2014) ¡ ¡

hop://arxiv.org/abs/1409.0575 ¡

slide-16
SLIDE 16

Current ¡crowdsourcing ¡annota)on ¡interface ¡

What ¡is ¡human ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on? ¡

hop://arxiv.org/abs/1409.0575 ¡

Andrej ¡Karpathy ¡

Is ¡this ¡a ¡badger? ¡Yes ¡or ¡No ¡

But ¡data ¡is ¡manually ¡annotated, ¡isn’t ¡human ¡accuracy ¡100%? ¡

Very ¡different ¡from ¡ ¡ Which ¡one ¡of ¡1000 ¡classes ¡is ¡this? ¡

slide-17
SLIDE 17

New ¡web-­‑based ¡annota)on ¡interface ¡ with ¡1000 ¡object ¡classes ¡

hop://arxiv.org/abs/1409.0575 ¡

hop://bit.ly/ilsvrclabel ¡

slide-18
SLIDE 18

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

hop://arxiv.org/abs/1409.0575 ¡

  • Compared ¡expert ¡human ¡annotators ¡with ¡winning ¡GoogLeNet ¡entry ¡
  • Annotator ¡1 ¡achieved ¡beoer ¡accuracy ¡than ¡GoogLeNet ¡by ¡1.7% ¡(p ¡= ¡0.022) ¡

Annotator ¡1 ¡ Annotator ¡2 ¡ Total ¡number ¡of ¡images ¡ 1500 ¡ 258 ¡ GoogLeNet ¡classifica)on ¡error ¡ 6.8% ¡ 5.8% ¡ Human ¡classifica)on ¡error ¡ 5.1% ¡ 12.0% ¡

slide-19
SLIDE 19

hop://arxiv.org/abs/1409.0575 ¡

  • Compared ¡expert ¡human ¡annotators ¡with ¡winning ¡GoogLeNet ¡entry ¡
  • Annotator ¡1 ¡achieved ¡beoer ¡accuracy ¡than ¡GoogLeNet ¡by ¡1.7% ¡(p ¡= ¡0.022) ¡
  • Task ¡required ¡significant ¡amount ¡of ¡training ¡for ¡humans ¡

Annotator ¡1 ¡ Annotator ¡2 ¡ Total ¡number ¡of ¡images ¡ 1500 ¡ 258 ¡ GoogLeNet ¡classifica)on ¡error ¡ 6.8% ¡ 5.8% ¡ Human ¡classifica)on ¡error ¡ 5.1% ¡ 12.0% ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

slide-20
SLIDE 20

hop://arxiv.org/abs/1409.0575 ¡

  • Compared ¡expert ¡human ¡annotators ¡with ¡winning ¡GoogLeNet ¡entry ¡
  • Annotator ¡1 ¡achieved ¡beoer ¡accuracy ¡than ¡GoogLeNet ¡by ¡1.7% ¡(p ¡= ¡0.022) ¡
  • Task ¡required ¡significant ¡amount ¡of ¡training ¡for ¡humans ¡

Annotator ¡1 ¡ Annotator ¡2 ¡ Total ¡number ¡of ¡images ¡ 1500 ¡ 258 ¡ GoogLeNet ¡classifica)on ¡error ¡ 6.8% ¡ 5.8% ¡ Human ¡classifica)on ¡error ¡ 5.1% ¡ 12.0% ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

slide-21
SLIDE 21

hop://arxiv.org/abs/1409.0575 ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

GoogLeNet ¡correct ¡ GoogLeNet ¡wrong ¡ Human ¡correct ¡ Human ¡wrong ¡

1352/1500 ¡ 72/1500 ¡ 46/1500 ¡ 30/1500 ¡

slide-22
SLIDE 22

hop://arxiv.org/abs/1409.0575 ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

GoogLeNet ¡correct ¡ GoogLeNet ¡wrong ¡ Human ¡correct ¡ Human ¡wrong ¡

1352/1500 ¡ 72/1500 ¡

  • Objects ¡very ¡small ¡or ¡thin ¡
  • Abstract ¡representa)ons ¡
  • Image ¡filters ¡

46/1500 ¡ 30/1500 ¡

slide-23
SLIDE 23

46/1500 ¡ 30/1500 ¡ hop://arxiv.org/abs/1409.0575 ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

GoogLeNet ¡correct ¡ GoogLeNet ¡wrong ¡ Human ¡correct ¡ Human ¡wrong ¡

1352/1500 ¡ 72/1500 ¡

  • Objects ¡very ¡small ¡or ¡thin ¡
  • Abstract ¡representa)ons ¡
  • Image ¡filters ¡
slide-24
SLIDE 24

30/1500 ¡ hop://arxiv.org/abs/1409.0575 ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

GoogLeNet ¡correct ¡ GoogLeNet ¡wrong ¡ Human ¡correct ¡ Human ¡wrong ¡

1352/1500 ¡ 72/1500 ¡ 46/1500 ¡

  • Fine-­‑grained ¡

recogni)on ¡

  • Class ¡unawareness ¡
  • Insufficient ¡training ¡

data ¡

  • Objects ¡very ¡small ¡or ¡thin ¡
  • Abstract ¡representa)ons ¡
  • Image ¡filters ¡
slide-25
SLIDE 25

30/1500 ¡ hop://arxiv.org/abs/1409.0575 ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

GoogLeNet ¡correct ¡ GoogLeNet ¡wrong ¡ Human ¡correct ¡ Human ¡wrong ¡

1352/1500 ¡ 72/1500 ¡ 46/1500 ¡

  • Fine-­‑grained ¡

recogni)on ¡

  • Class ¡unawareness ¡
  • Insufficient ¡training ¡

data ¡

  • Objects ¡very ¡small ¡or ¡thin ¡
  • Abstract ¡representa)ons ¡
  • Image ¡filters ¡
slide-26
SLIDE 26

hop://arxiv.org/abs/1409.0575 ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

GoogLeNet ¡correct ¡ GoogLeNet ¡wrong ¡ Human ¡correct ¡ Human ¡wrong ¡

1352/1500 ¡ 72/1500 ¡ 46/1500 ¡

  • Fine-­‑grained ¡

recogni)on ¡

  • Class ¡unawareness ¡
  • Insufficient ¡training ¡

data ¡

  • Mul)ple ¡objects ¡
  • Incorrect ¡annota)ons ¡

30/1500 ¡

  • Objects ¡very ¡small ¡or ¡thin ¡
  • Abstract ¡representa)ons ¡
  • Image ¡filters ¡
slide-27
SLIDE 27

hop://arxiv.org/abs/1409.0575 ¡

Human ¡vs ¡computer ¡accuracy ¡on ¡ ILSVRC2014 ¡classifica)on ¡

GoogLeNet ¡correct ¡ GoogLeNet ¡wrong ¡ Human ¡correct ¡ Human ¡wrong ¡

1352/1500 ¡ 72/1500 ¡ 46/1500 ¡

  • Fine-­‑grained ¡

recogni)on ¡

  • Class ¡unawareness ¡
  • Insufficient ¡training ¡

data ¡

  • Mul)ple ¡objects ¡
  • Incorrect ¡annota)ons ¡

30/1500 ¡

  • Objects ¡very ¡small ¡or ¡thin ¡
  • Abstract ¡representa)ons ¡
  • Image ¡filters ¡
slide-28
SLIDE 28

8:45 ¡ ¡Object ¡detec)on ¡ ¡ ¡ ¡ ¡ 11:00 ¡Classifica)on&localiza)on ¡ ¡ ¡ ¡ ¡ 14:00 ¡Awards&Discussion ¡ ¡ ¡ 15:00 ¡Poster ¡and ¡live ¡demo ¡session ¡

Schedule ¡

9:25 ¡ 9:45 ¡ 10:00 ¡ 10:15 ¡Spotlights ¡ 11:45 ¡ 12:00 ¡ 11:15 ¡ 11:30 ¡ 9:10 ¡ 12:15 ¡Spotlights ¡ 14:20 ¡ 14:30 ¡ 14:00 ¡ 14:10 ¡ 14:40 ¡Discussion ¡

Awards ¡ Many ¡thanks ¡to: ¡

ILSVRC2014 ¡sponsors ¡ ILSVRC2014 ¡awards ¡sponsor ¡ Volunteer ¡videographer ¡

Koen ¡ van ¡de ¡Sande ¡