word2vec ¡
Tom ¡Kenter ¡ IR ¡Reading ¡Group ¡ September ¡12 ¡2014 ¡
word2vec Tom Kenter IR Reading Group September 12 2014 - - PowerPoint PPT Presentation
word2vec Tom Kenter IR Reading Group September 12 2014 Word2vec: what is it (not)? It is: Neural network-based Word embeddings Mapping
Tom ¡Kenter ¡ IR ¡Reading ¡Group ¡ September ¡12 ¡2014 ¡
Figure ¡from ¡[4] ¡
h[p://radimrehurek.com/2014/02/word2vec-‑tutorial/ ¡
Figure ¡from ¡[5] ¡
Seman&c ¡ 8869 ¡
¡ Syntac&c ¡ 10675 ¡
Table ¡from ¡[4] ¡
Table ¡from ¡[4] ¡
Live ¡demo ¡
Figure ¡from ¡[3] ¡
What ¡if ¡there ¡are ¡two ¡Amsterdams..??? ¡
(but ¡this ¡goes ¡for ¡rankers ¡as ¡well) ¡
There ¡is ¡no ¡such ¡thing ¡as ¡free ¡lunch ¡
But ¡this ¡affects ¡all ¡other ¡word-‑based ¡methods ¡as ¡well ¡
If ¡a ¡word ¡is ¡met ¡at ¡tesHng ¡Hme ¡that ¡was ¡not ¡seen ¡at ¡training ¡Hme, ¡it ¡will ¡ simply ¡be ¡ignored. ¡
Overview ¡and ¡evaluaAon ¡of ¡many ¡different ¡tasks ¡ [1] ¡ ¡M. ¡Baroni, ¡G. ¡Dinu, ¡and ¡G. ¡Kruszewski. ¡Dont ¡count, ¡predict! ¡a ¡systemaHc ¡comparison ¡of ¡context-‑ counHng ¡vs. ¡context-‑predicHng ¡semanHc ¡vectors. ¡In ¡Proceedings ¡of ¡the ¡52nd ¡Annual ¡MeeHng ¡of ¡the ¡ AssociaHon ¡for ¡ComputaHonal ¡LinguisHcs, ¡volume ¡1, ¡2014. ¡ ¡ Sentence ¡classificaAon ¡ ¡ [2] ¡ ¡Y. ¡Kim. ¡ConvoluHonal ¡neural ¡networks ¡for ¡sentence ¡classificaHon. ¡ ¡ ¡ This ¡is ¡where ¡the ¡‘gay’ ¡and ¡‘cell’ ¡example ¡came ¡from ¡ [3] ¡ ¡Y. ¡Kim, ¡Y.-‑I. ¡Chiu, ¡K. ¡Hanaki, ¡D. ¡Hedge, ¡and ¡S. ¡Petrov. ¡Temporal ¡analysis ¡of ¡ ¡ language ¡through ¡neural ¡language ¡models, ¡2014. ¡ ¡ ¡ For ¡more ¡elaborate ¡discussion ¡on ¡the ¡architectures ¡used ¡ [4] ¡ ¡T. ¡Mikolov, ¡K. ¡Chen, ¡G. ¡Corrado, ¡and ¡J. ¡Dean. ¡Efficient ¡esHmaHon ¡of ¡word ¡ ¡ representaHons ¡in ¡vector ¡space. ¡arXiv ¡preprint ¡arXiv:1301.3781, ¡2013. ¡ ¡ ¡ More ¡on ¡Skip-‑gram, ¡negaAve ¡sampling, ¡hierarchical ¡soMmax, ¡and ¡dealing ¡with ¡phrases ¡ [5] ¡ ¡T. ¡Mikolov, ¡I. ¡Sutskever, ¡K. ¡Chen, ¡G. ¡S. ¡Corrado, ¡and ¡J. ¡Dean. ¡Distributed ¡representaHons ¡of ¡words ¡and ¡ phrases ¡and ¡their ¡composiHonality. ¡In ¡Advances ¡in ¡Neural ¡InformaHon ¡Processing ¡Systems, ¡pages ¡3111– 3119, ¡2013. ¡ ¡ ¡ Link ¡to ¡the ¡demo ¡(scroll ¡down ¡a ¡bit ¡to ¡where ¡it ¡says ¡‘Bonus ¡App’) ¡ h[p://radimrehurek.com/2014/02/word2vec-‑tutorial/ ¡ ¡