Neural ¡CRF ¡Parsing
Greg ¡Durre2 ¡and ¡Dan ¡Klein ¡
- UC ¡Berkeley
Neural CRF Parsing Greg Durre2 and Dan Klein UC Berkeley - - PowerPoint PPT Presentation
Neural CRF Parsing Greg Durre2 and Dan Klein UC Berkeley Parsing with CKY Parsing with CKY He gave a long speech on foreign
Greg ¡Durre2 ¡and ¡Dan ¡Klein ¡
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score =
PP NP NP
Pr
NP
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Socher ¡et ¡al. ¡(2013)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Socher ¡et ¡al. ¡(2013)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Socher ¡et ¡al. ¡(2013)]
Powerful ¡nonlinear ¡featurizaNon…
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Socher ¡et ¡al. ¡(2013)]
Powerful ¡nonlinear ¡featurizaNon…but ¡inference ¡is ¡now ¡intractable.
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)] 2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)] 2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)] FirstWord=a, ¡… 2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)] FirstWord=a, ¡… 2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)] FirstWord=a, ¡… 2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)] FirstWord=a, ¡… 2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
[Taskar ¡et ¡al. ¡(2004), ¡Finkel ¡et ¡al. ¡(2008), ¡Hall ¡et ¡al. ¡(2014)] FirstWord=a, ¡… 2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
neural ¡network
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
neural ¡network
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
neural ¡network
(Collobert ¡et ¡al., ¡2011)
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
neural ¡network
(Collobert ¡et ¡al., ¡2011)
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
neural ¡network
(Collobert ¡et ¡al., ¡2011)
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
PP NP NP
score
2 5 8
a speech
policy
neural ¡network
(Collobert ¡et ¡al., ¡2011)
[Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
NP PP NP
[Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
NP PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
[Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
NP PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
NP PP NP
2 5 8
score
[Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
w>f
NP PP NP
2 5 8
= NP PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
NP PP NP
2 5 8
score
[Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
w>f
NP PP NP
2 5 8
= NP PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
NP PP NP
2 5 8
score
FirstWord ¡= ¡a ∧ [Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
w>f
NP PP NP
2 5 8
= NP PP NP
NP PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
NP PP NP
2 5 8
score
FirstWord ¡= ¡a ∧ [Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
w>f
NP PP NP
2 5 8
= NP PP NP
NP PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
NP PP NP
2 5 8
score
FirstWord ¡= ¡a ∧ [Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
w>f
NP PP NP
2 5 8
= NP PP NP
NP PP NP
PrevWord ¡= ¡gave∧ NP
PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
NP PP NP
2 5 8
score
FirstWord ¡= ¡a ∧ [Hall, ¡Durre5, ¡Klein ¡(2014)]
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
w>f
NP PP NP
2 5 8
= NP PP NP
NP PP NP
PrevWord ¡= ¡gave∧ NP
PP NP
P(T|x) ∝ Y
r∈T
exp (score(r))
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave Surface ¡feature
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave Surface ¡feature Label ¡feature
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave First ¡= ¡a, Prev ¡= ¡gave,… Surface ¡feature Label ¡feature
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
s
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave First ¡= ¡a, Prev ¡= ¡gave,
NP …
… Surface ¡feature Label ¡feature
NP PP NP
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
`
s
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave First ¡= ¡a, Prev ¡= ¡gave,
NP …
… Surface ¡feature Label ¡feature
NP PP NP
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
`
s
Fi,j = si`j
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave First ¡= ¡a, Prev ¡= ¡gave,
NP …
…
= W
Surface ¡feature Label ¡feature
NP PP NP
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
`
s
Fi,j = si`j
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave First ¡= ¡a, Prev ¡= ¡gave,
NP …
…
= W
Surface ¡feature Label ¡feature
s
X X X
2 5 8 NP PP NP
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
`
s
Fi,j = si`j
NP PP NP
2 5 8
score
FirstWord ¡= ¡a PrevWord ¡= ¡gave First ¡= ¡a, Prev ¡= ¡gave,
NP …
…
= W
Surface ¡feature Label ¡feature
s
X X X
2 5 8 NP PP NP
NP PP NP
`>
w>f
NP PP NP
2 5 8
=
NP PP NP NP PP NP
`
s
Fi,j = si`j
NP PP NP
2 5 8
score
NP PP NP
2 5 8
score
= W s
X X X
2 5 8
NP PP NP
`>
NP PP NP
2 5 8
score
= W s
X X X
2 5 8
NP PP NP
`>
NP PP NP
2 5 8
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
= W s
X X X
2 5 8
NP PP NP
`>
NP PP NP
2 5 8
score
v
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
= W s
X X X
2 5 8
NP PP NP
`>
NP PP NP
2 5 8
score
v
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
= W s
X X X
2 5 8
NP PP NP
`>
s
NP PP NP
2 5 8
score
v
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
= W s
X X X
2 5 8
NP PP NP
`>
s
NP PP NP
2 5 8
score
v
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
100-‑dim ¡vectors ¡ (Bansal ¡et ¡al., ¡2014)
= W s
X X X
2 5 8
NP PP NP
`>
s
NP PP NP
2 5 8
score
v
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
100-‑dim ¡vectors ¡ (Bansal ¡et ¡al., ¡2014) 200-‑dim ¡vector
= W s
X X X
2 5 8
NP PP NP
`>
s
NP PP NP
2 5 8
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
= W s
X X X
2 5 8
NP PP NP
`>
v
s
NP PP NP
2 5 8
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
= W s
X X X
2 5 8
NP PP NP
`>
v
s
NP PP NP
2 5 8
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
= W s
X X X
2 5 8
NP PP NP
`>
v
s
NP PP NP
2 5 8
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
Neural
= W s
X X X
2 5 8
NP PP NP
`>
v
s
NP PP NP
2 5 8
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
Sparse Neural
= W s
X X X
2 5 8
NP PP NP
`>
s
v
s
NP PP NP
2 5 8
score
He ¡ ¡gave ¡ ¡a ¡ ¡long ¡ ¡speech ¡ ¡on ¡ ¡foreign ¡ ¡policy ¡ ¡.
1 2 3 4 5 6 7 8 9
Sparse Neural Neural+Sparse
= W s
X X X
2 5 8
NP PP NP
`>
s s
v
s
… ¡with ¡coarse ¡pruning ¡and ¡caching ¡of ¡neural ¡net ¡opera^ons
(Goodman, ¡1997) (Chen ¡and ¡Manning, ¡2014)
… ¡with ¡coarse ¡pruning ¡and ¡caching ¡of ¡neural ¡net ¡opera^ons
Roughly ¡2x ¡slower ¡than ¡with ¡sparse ¡features ¡alone (Goodman, ¡1997) (Chen ¡and ¡Manning, ¡2014)
… ¡with ¡backpropaga^on ¡through ¡each ¡local ¡neural ¡network
Op^miza^on: ¡Adadelta ¡(Zeiler, ¡2012) ¡worked ¡slightly ¡be5er ¡than ¡ Adagrad ¡(Duchi ¡et ¡al., ¡2011)
… ¡with ¡backpropaga^on ¡through ¡each ¡local ¡neural ¡network
87 88 89 90 91 92
90.1
Sparse
Dev ¡set ¡F1 ¡all ¡lengths
87 88 89 90 91 92
90.4 90.1
Sparse Neural
Dev ¡set ¡F1 ¡all ¡lengths
87 88 89 90 91 92
91.3 90.4 90.1
Sparse+ ¡ Neural Sparse Neural
Dev ¡set ¡F1 ¡all ¡lengths
87 88 89 90 91 92
90.2 91.3 90.4 90.1
Sparse+ ¡ Neural Sparse Neural Sparse+ ¡ Brown
Dev ¡set ¡F1 ¡all ¡lengths
87 88 89 90 91 92
90.2 91.3 90.4 90.1
Sparse+ ¡ Neural Sparse Neural Sparse+ ¡ Brown
Dev ¡set ¡F1 ¡all ¡lengths
87 88 89 90 91 92
90.4
Dev ¡set ¡F1 ¡all ¡lengths Bansal ¡et ¡al.
87 88 89 90 91 92
90.4
Dev ¡set ¡F1 ¡all ¡lengths Bansal ¡et ¡al.
87 88 89 90 91 92
89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths Collobert ¡and ¡ Weston Bansal ¡et ¡al.
87 88 89 90 91 92
89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths Collobert ¡and ¡ Weston Dependency ¡ context 11-‑word ¡ surface ¡context Bansal ¡et ¡al.
87 88 89 90 91 92
89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths Collobert ¡and ¡ Weston
Dependency ¡ context 11-‑word ¡ surface ¡context Bansal ¡et ¡al.
87 88 89 90 91 92
89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths Collobert ¡and ¡ Weston
Bansal ¡et ¡al.
87 88 89 90 91 92
89.0 89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths
Bansal ¡et ¡al. word2vec ¡
Collobert ¡and ¡ Weston
87 88 89 90 91 92
89.0 89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths
Bansal ¡et ¡al. word2vec ¡
Collobert ¡and ¡ Weston
87 88 89 90 91 92
89.0 89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths
Bansal ¡et ¡al. word2vec ¡
Collobert ¡and ¡ Weston 1M ¡tokens 30M ¡tokens
87 88 89 90 91 92
89.0 89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths
Bansal ¡et ¡al. word2vec ¡
Collobert ¡and ¡ Weston
91.3
90.9 Sparse+ Sparse+
87 88 89 90 91 92
89.0 89.6 90.4
Dev ¡set ¡F1 ¡all ¡lengths
Bansal ¡et ¡al. word2vec ¡
Collobert ¡and ¡ Weston
91.3
90.9 Sparse+ Sparse+
87 88 89 90 91 92
91.1
Test ¡set ¡F1 ¡all ¡lengths Neural+ ¡ Sparse
87 88 89 90 91 92
89.2 91.1
Test ¡set ¡F1 ¡all ¡lengths Sparse Neural+ ¡ Sparse
87 88 89 90 91 92
90.1 89.2 91.1
Test ¡set ¡F1 ¡all ¡lengths Sparse Berkeley
Petrov+ ¡06
Neural+ ¡ Sparse
87 88 89 90 91 92
91.1 90.1 89.2 91.1
Test ¡set ¡F1 ¡all ¡lengths Sparse Berkeley CCK
Petrov+ ¡06 Carreras+ ¡08
Neural+ ¡ Sparse
87 88 89 90 91 92
91.3 91.1 90.1 89.2 91.1
Test ¡set ¡F1 ¡all ¡lengths Sparse Berkeley CCK ZPar
Petrov+ ¡06 Carreras+ ¡08 Zhu+ ¡13
Neural+ ¡ Sparse
87 88 89 90 91 92
91.3 91.1 90.1 89.2 91.1
Test ¡set ¡F1 ¡all ¡lengths Sparse Berkeley CCK ZPar
Petrov+ ¡06 Carreras+ ¡08 Zhu+ ¡13
Neural+ ¡ Sparse
87 88 89 90 91 92
90.4 91.3 91.1 90.1 89.2 91.1
Test ¡set ¡F1 ¡all ¡lengths Sparse Berkeley CVG CCK ZPar
Petrov+ ¡06 Socher+ ¡13 Carreras+ ¡08 Zhu+ ¡13
Neural+ ¡ Sparse (reranking ¡ ensemble)
Manning ¡(2014)
Manning ¡(2014)
Manning ¡(2014)
(approximately ¡100M ¡tokens ¡per ¡language)
Test ¡set ¡F1 ¡all ¡lengths
70 75 80 85 90 95
85.1 83.2
Hall ¡et ¡al. ¡(2014) Sparse+Neural
Average
Test ¡set ¡F1 ¡all ¡lengths
70 75 80 85 90 95
85.1 83.2
Hall ¡et ¡al. ¡(2014) Sparse+Neural
Average
Arabic Basque French German Hebrew Hungarian Korean Polish Swedish
Test ¡set ¡F1 ¡all ¡lengths
70 75 80 85 90 95
85.1 83.2
Hall ¡et ¡al. ¡(2014) Sparse+Neural
Average
Arabic Basque French German Hebrew Hungarian Korean Polish Swedish
Test ¡set ¡F1 ¡all ¡lengths
70 75 80 85 90 95
85.1 83.2
Hall ¡et ¡al. ¡(2014) Sparse+Neural
Average
in ¡discrete ¡structured ¡models
s
in ¡discrete ¡structured ¡models
Feedforward
He gave a long speech
foreign policy .
s
in ¡discrete ¡structured ¡models
Convolu^onal
He gave a long speech
foreign policy .
s
in ¡discrete ¡structured ¡models
LSTM
He gave a long speech
foreign policy .
s
in ¡discrete ¡structured ¡models
LSTM
He gave a long speech
foreign policy .
s
in ¡discrete ¡structured ¡models
in ¡discrete ¡structured ¡models
in ¡discrete ¡structured ¡models
in ¡discrete ¡structured ¡models
in ¡discrete ¡structured ¡models
nlp.cs.berkeley.edu/projects/neuralcrf.shtml
in ¡discrete ¡structured ¡models
nlp.cs.berkeley.edu/projects/neuralcrf.shtml