Lecture 9
LVCSR Search Michael Picheny, Bhuvana Ramabhadran, Stanley F . Chen, Markus Nussbaum-Thom
Watson Group IBM T.J. Watson Research Center Yorktown Heights, New York, USA {picheny,bhuvana,stanchen,nussbaum}@us.ibm.com
Lecture 9 LVCSR Search Michael Picheny, Bhuvana Ramabhadran, - - PowerPoint PPT Presentation
Lecture 9 LVCSR Search Michael Picheny, Bhuvana Ramabhadran, Stanley F . Chen, Markus Nussbaum-Thom Watson Group IBM T.J. Watson Research Center Yorktown Heights, New York, USA {picheny,bhuvana,stanchen,nussbaum}@us.ibm.com 23 March 2016
Watson Group IBM T.J. Watson Research Center Yorktown Heights, New York, USA {picheny,bhuvana,stanchen,nussbaum}@us.ibm.com
2 / 139
3 / 139
4 / 139
5 / 139
ω∈vocab∗ (language model) × (acoustic model)
ω∈vocab∗ (prior prob over words) × P(feats|words)
ω∈vocab∗ P(ω)P(x|ω)
6 / 139
7 / 139
8 / 139
9 / 139
10 / 139
ω∈vocab∗ (language model) × (acoustic model)
ω∈vocab∗ P(ω)P(x|ω)
11 / 139
♦♥❡ t✇♦ t❤r❡❡ ❢♦✉r ☞✈❡ s✐① s❡✈❡♥ ❡✐❣❤t ♥✐♥❡ ③❡r♦
12 / 139
13 / 139
ω∈vocab∗ (language model) × (acoustic model)
ω∈vocab∗ P(ω)P(x|ω)
ω
T
ω
T
14 / 139
♦♥❡ t✇♦ t❤r❡❡ ❢♦✉r ☞✈❡ s✐① s❡✈❡♥ ❡✐❣❤t ♥✐♥❡ ③❡r♦
15 / 139
16 / 139
♦♥❡ t✇♦ t❤r❡❡ ✳ ✳ ✳ ✳ ✳ ✳ ✎
❍▼▼♦♥❡ ❍▼▼t✇♦ ❍▼▼t❤r❡❡ ✳ ✳ ✳ ✳ ✳ ✳ ✎
♦♥❡ t✇♦ t❤r❡❡ ❢♦✉r ☞✈❡ s✐① s❡✈❡♥ ❡✐❣❤t ♥✐♥❡ ③❡r♦17 / 139
18 / 139
gAA.1,9 gAA.2,2 gK.1,6 gK.2,7 gAX.1,15 gAX.2,3 gN.1,4 gN.2,1 gAA.1,9 gAA.2,2 gK.1,6 gK.2,7 gAX.1,15 gAX.2,3 gN.1,4 gN.2,1 19 / 139
20 / 139
1
2
3
4
5
21 / 139
gAA.1,9 gAA.2,2 gK.1,6 gK.2,7 gAX.1,15 gAX.2,3 gN.1,4 gN.2,1 gAA.1,9 gAA.2,2 gK.1,6 gK.2,7 gAX.1,15 gAX.2,3 gN.1,4 gN.2,1
22 / 139
23 / 139
24 / 139
25 / 139
26 / 139
27 / 139
28 / 139
29 / 139
30 / 139
31 / 139
32 / 139
33 / 139
1
2
3
4
5
34 / 139
35 / 139
1 2 a 3 b 4 d
1 a:A b:B c:C d:D
1 2 A 3 B 4 D
36 / 139
1 2 c d 6 b 3 a 5 a a 4 b d
1 a:A b:B c:C d:D
1 3 B 2 C D 4 A A 5 A 6 D B
37 / 139
1 2 a 3 b 4 a
1 a:a a:A b:b b:B
1 2 a A 3 b B 4 a A
38 / 139
1 2 a d 6 b 3 a 5 a a 4 b a
1 a:a
1 2 a 3 a 4 a 5 a
39 / 139
1 a:A b:B c:C d:D
✎✿❆❍ ✎✿■❨ ❚❍❊✿❉❍ ❉❖●✿❉ ✎✿● ✎✿❆❖
40 / 139
a a:a b b:b c c:c a:a b:b c:c a:A b:B c:C
41 / 139
42 / 139
1
2
3
4
5
43 / 139
❛ ❜ ❝
❛✿❆ ❜✿❇ ❝✿❈
❆ ❇ ❈
44 / 139
45 / 139
1 2 a 3 b 4 d
1 a:A b:B c:C d:D
1,1 2,1 A 3,1 B 4,1 D
46 / 139
1 2 a 3 b 4 d
1 a:A b:B c:C d:D
1,1 2,1 A 3,1 B 4,1 D
47 / 139
1 2 a 3 b 4 d
1 a:A b:B c:C d:D
1,1 2,1 A 3,1 B 4,1 D
48 / 139
49 / 139
1 2 a 3 b
1 2 a:A 3 b:B
1,1 2,2 A 3,3 B 1,2 1,3 2,1 2,3 3,1 3,2 50 / 139
1 2 a 3 a b b
1 2 a:A b:B a:a b:b
1,1 3,2 A 2,2 A b 3,1 b 1,2 B a 2,1 a B 51 / 139
1 2 <epsilon> A 3 B 1 2 <epsilon>:B A:A 3 B:B
1,1 2,2 A 1,2 B 2,1 eps 3,3 B eps 1,3 2,3 eps B 3,1 3,2 B 52 / 139
53 / 139
1
2
3
4
5
54 / 139
55 / 139
56 / 139
❚❍❊✿❉❍✳❆❍ ❚❍❊✿❉❍✳■❨ ❉❖●✿❉✳❆❖✳● ✎✿❆❍ ✎✿■❨ ❚❍❊✿❉❍ ❉❖●✿❉ ✎✿● ✎✿❆❖
57 / 139
❚❍❊ ❉❖●
✎✿❆❍ ✎✿■❨ ❚❍❊✿❉❍ ❉❖●✿❉ ✎✿● ✎✿❆❖
❆❖ ❆❍ ■❨ ❉
58 / 139
1 2 C 3 A 4 B
1 <epsilon>:~SIL A:A B:B C:C
1 ~SIL 2 C ~SIL 3 A ~SIL 4 B ~SIL
59 / 139
❉ ❆❖
✎✿❣❉✳✷ ✎✿❣❉✳✶ ✎✿❣●✳✷ ✎✿❣●✳✷ ✎✿❣❆❖✳✷ ✎✿❣❆❖✳✷
✎✿❣●✳✶ ✎✿✎ ❆❖✿❣❆❖✳✶ ✎✿✎ ✎✿❣❉✳✷ ❉✿❣❉✳✶ ✎✿✎ ✎✿❣❆❖✳✶
❣❉✳✷ ❣❆❖✳✶ ❣●✳✷ ❣●✳✶ ❣●✳✷ ❣❆❖✳✷ ❣❆❖✳✷ ❣●✳✶ ❣❉✳✷ ❣❉✳✶ ❣❆❖✳✶ ❣❉✳✶
60 / 139
❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞❛❤ ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞❛❤ 61 / 139
❚ ❉ ❆❆ ❆❆ ❚ ❉
✎✿❆❆✲❚✰❥ ❚✿❆❆✲❉✰❚ ✎✿❆❆✲❉✰❥ ❉✿❆❆✲❉✰❉ ❆❆✿❉✲❆❆✰❆❆ ❉✿❆❆✲❚✰❉ ❚✿❆❆✲❚✰❚ ❉✿✎ ❆❆✿❚✲❆❆✰❆❆ ❚✿✎ ❆❆✿❉✲❥✰❆❆ ❆❆✿❚✲❥✰❆❆ ❥ ❥ ❉ ❥ ❚ ❉ ❆❆ ❚ ❆❆ ❆❆ ❉ ❆❆ ❚ ❆❆ ❥
❆❆✲❉✰❥ ❆❆✲❉✰❉ ❉✲❆❆✰❆❆ ❚✲❆❆✰❆❆ ❉✲❥✰❆❆ ❚✲❥✰❆❆ ❆❆✲❚✰❥ ❆❆✲❚✰❉ ❆❆✲❉✰❚ ❆❆✲❚✰❚
62 / 139
❚ ❉ ❆❆ ❆❆ ❚ ❉ ❆❆✲❉✰❥ ❆❆✲❉✰❉ ❉✲❆❆✰❆❆ ❚✲❆❆✰❆❆ ❉✲❥✰❆❆ ❚✲❥✰❆❆ ❆❆✲❚✰❥ ❆❆✲❚✰❉ ❆❆✲❉✰❚ ❆❆✲❚✰❚
63 / 139
D-|+AO AO-D+G G-AO+|
ǫ:gD.2,7 ǫ:gD.1,3 ǫ:gG.2,4 ǫ:gG.2,4 ǫ:gAO.2,3 ǫ:gAO.2,3 G-AO+|:gG.1,8 ǫ:gG.1,8 ǫ:ǫ AO-D+G:gAO.1,5 ǫ:ǫ ǫ:gD.2,7 D-|+AO:gD.1,3 ǫ:ǫ ǫ:gAO.1,5
gD.2,7 gAO.1,5 gG.2,4 gG.1,8 gG.2,4 gAO.2,3 gAO.2,3 gG.1,8 gD.2,7 gD.1,3 gAO.1,5 gD.1,3
64 / 139
65 / 139
1
2
3
4
5
66 / 139
❛✴✵✳✷ ❛✴✵✳✸ ✎✴✵✳✻ ❝✴✵✳✹ ❜✴✶✳✸ ✶ ✸✴✵✳✹ ✷✴✶✳✵
67 / 139
❛✴✵✳✶ ❜✴✶✳✵ ❞✴✵✳✵✶ ✶ ✸ ✷ ✹
❛✴✶ ❜✴✵ ❞✴✷ ✶ ✸ ✷ ✹✴✵
68 / 139
1 2 a/1 3/3 b/2 1 2 a/0 3/6 b/0
69 / 139
1 2 a/1 a/2 b/3 3/0 c/0 1 2 a/1 b/3 3/0 c/0
70 / 139
1 2/1 a/0 1 2/0.5 a/0.5 a/1 1 2 <epsilon>/1 3/0 a/0 1 2/-2 a/3 3 b/1 b/1
71 / 139
❛✴✶ ❜✴✵ ❞✴✷ ✶ ✸ ✷ ✹✴✵
❛✿❆✴✷ ❜✿❇✴✶ ❝✿❈✴✵ ❞✿❉✴✵ ✶✴✶
❆✴✸ ❇✴✶ ❉✴✷ ✶ ✸ ✷ ✹✴✶
72 / 139
ω
ω
73 / 139
74 / 139
75 / 139
1 2 C 3 A 4 B
76 / 139
77 / 139
78 / 139
❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞❛❤ ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞❛❤ 79 / 139
❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞❛❤ ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞❛❤
80 / 139
81 / 139
82 / 139
1
2
3
4
5
83 / 139
❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞❛❤ ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞✐t ❞❛❤ ❞✐t ❞❛❤ ❞✐t ❞❛❤
84 / 139
85 / 139
t❤r❡❡✴P✭t❤r❡❡❥t✇♦✮ ♦♥❡✴P✭♦♥❡❥♦♥❡✮ t✇♦✴P✭t✇♦❥t✇♦✮ ♦♥❡✴P✭♦♥❡❥t✇♦✮ ♦♥❡✴P✭♦♥❡❥t❤r❡❡✮ ✎✴☛✭♦♥❡✮ ✎✴☛✭t❤r❡❡✮ ♦♥❡✴P✭♦♥❡✮ t❤r❡❡✴P✭t❤r❡❡❥t❤r❡❡✮ t✇♦✴P✭t✇♦❥t❤r❡❡✮ t✇♦✴P✭t✇♦❥♦♥❡✮ t✇♦✴P✭t✇♦✮ t❤r❡❡✴P✭t❤r❡❡✮ t❤r❡❡✴P✭t❤r❡❡❥♦♥❡✮ ✎✴☛✭t✇♦✮ ♦♥❡ t❤r❡❡ t✇♦ ✎
86 / 139
87 / 139
88 / 139
89 / 139
1
2
3
4
5
90 / 139
91 / 139
AX AX AX AE AE AE AA B B B B B B B R S Z UW UW Y Y AO ER ER ABU ABU UW UW DD DD DD S Z ABROAD ABSURD ABSURD ABUSE ABUSE 92 / 139
AX AE AA B B B R Y S Z UW UW AO UW ER ER ABU ABU DD S Z DD DD ABROAD ABUSE ABUSE ABSURD ABSURD 93 / 139
AX AE AA B B B R Y S Z UW UW AO UW ER ABU DD S Z DD ABROAD ABUSE ABSURD
94 / 139
A A <epsilon> B B A B 95 / 139
1 2 a 3 a 4 b 1 2,3 a 4 b
96 / 139
1 2 <epsilon> 4 a 3 a b 5 b 1,2 3,4 a 4,5 b b
97 / 139
1 2 A 3 A 5 <epsilon> 4 B B 1 2,3,5 A 4 B 98 / 139
1 2 a 3 a 4 a 5 a a a b b 1 2,3 a 2,3,4,5 a a 4,5 b b
99 / 139
1 2 AX 7 AX 8 AX 3 AE 4 AE 5 AE 6 AA 9 B 14 B 15 B 10 B 11 B 12 B 13 B 16 R 17 S 18 Z 19 UW 20 UW 21 Y 22 Y 23 AO 24 ER 25 ER 26 ABU 27 ABU 28 UW 29 UW 30 DD 31 DD 32 DD 33 S 34 Z 35 ABROAD 36 ABSURD 37 ABSURD 38 ABUSE 39 ABUSE 100 / 139
1 2,7,8 AX 3,4,5 AE 6 AA 9,14,15 B 10,11,12 B 13 B R Y S Z UW UW AO UW ER ER ABU ABU DD S Z DD DD ABROAD ABUSE ABUSE ABSURD ABSURD
101 / 139
102 / 139
103 / 139
104 / 139
1 2 a 6 b 3 a 4 b 7 a 8 b 5 b 9 b 1 2,6 a b 3,5,7,9 a 4,8 b b
105 / 139
1 2 A 6 B 3 B 7 C 8 D 4 C 5 D 1 2 A 3,6 B B 4,5,7,8 C D
106 / 139
1 2 a 6 b 3 a 4 b 7 a 8 b 5 b 9 b 1 2,6 a b 3,5,7,9 a 4,8 b b 107 / 139
1 2 a 6 b 3 a 4 b 7 a 8 b 5 b 9 b 1 2,6 a b 3,5,7,9 a 4,8 b b 108 / 139
1 2 a 4 d c 3 b 5 c c 6 b
1 2,5 a 4 d c 3,6 b c
109 / 139
110 / 139
111 / 139
1
2
3
4
5
112 / 139
113 / 139
114 / 139
ω
ω
115 / 139
116 / 139
AX AE AA B B B R Y S Z UW UW AO UW ER ER ABU ABU DD S Z DD DD ABROAD ABUSE ABUSE ABSURD ABSURD 117 / 139
AX AX AX AE AE AE AA B B B B B B B R S Z UW UW Y Y AO ER ER ABU ABU UW UW DD DD DD S Z ABROAD ABSURD ABSURD ABUSE ABUSE 118 / 139
AX/0 AE/0 AA/0 B/0 B/0 B/0 R/0 Y/0 S/0 Z/0 UW/0 UW/0 AO/0 UW/0 ER/0 ER/0 ABU/7 ABU/7 DD/0 S/0 Z/0 DD/0 DD/0 ABROAD/4.3 ABUSE/3.5 ABUSE/3.5 ABSURD/4.7 ABSURD/4.7
119 / 139
AX/3.5 AE/4.7 AA/7.0 B/0 B/0 B/0 R/0.8 Y/0 S/0 Z/0 UW/2.3 UW/0 AO/0 UW/0 ER/0 ER/0 ABU/0 ABU/0 DD/0 S/0 Z/0 DD/0 DD/0 ABROAD/0 ABUSE/0 ABUSE/0 ABSURD/0 ABSURD/0
120 / 139
1
2
3
4
5
121 / 139
122 / 139
123 / 139
124 / 139
1 2 six 3 five 4
5 two 6 four
125 / 139
1 2 six 3 five 4
5 two 6 four 126 / 139
1 2 THE 9 THIS 11 THUD 3 DIG 4 DOG 10 DOG 5 ATE 6 EIGHT 7 MAY 8 MY
127 / 139
128 / 139
1
2
3
4
5
129 / 139
♦♥❡ t✇♦ t❤r❡❡ ✳ ✳ ✳ ✳ ✳ ✳ ✎
✎✿❆❍ ✎✿■❨ ❚❍❊✿❉❍ ❉❖●✿❉ ✎✿● ✎✿❆❖
130 / 139
131 / 139
132 / 139
THE THIS THUD DIG DOG DOG DOGGY ATE EIGHT MAY MY MAY
133 / 139
134 / 139
135 / 139
136 / 139
137 / 139
138 / 139
139 / 139