K-means: - - PowerPoint PPT Presentation

k means means business
SMART_READER_LITE
LIVE PREVIEW

K-means: - - PowerPoint PPT Presentation

K-means: Means Business Jus/n Talbot,Lei Hu K-means


slide-1
SLIDE 1

K-­‑means: ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Means ¡Business ¡

Jus/n ¡Talbot,Lei ¡Hu ¡

slide-2
SLIDE 2

K-­‑means ¡

  • An ¡itera/ve ¡algorithm ¡for ¡clustering ¡
  • An ¡approxima/on ¡to ¡finding ¡the ¡maximum ¡

likelihood ¡es/mates ¡for ¡the ¡means ¡of ¡the ¡ clusters ¡

  • Aims ¡to ¡minimize ¡the ¡within ¡cluster ¡sum ¡of ¡

squares ¡error ¡

  • No ¡ ¡Guarantee ¡of ¡the ¡global ¡op/mum ¡
slide-3
SLIDE 3

Algorithm ¡

  • Pick ¡a ¡number ¡of ¡clusters ¡k, ¡and ¡the ¡central ¡

points ¡of ¡the ¡clusters ¡

  • Assign ¡each ¡point ¡to ¡the ¡cluster ¡with ¡the ¡

closest ¡mean ¡

  • Calculate ¡the ¡new ¡means ¡to ¡be ¡the ¡centroid ¡of ¡

the ¡points ¡in ¡the ¡cluster ¡

  • Repeat ¡un/l ¡convergence ¡
slide-4
SLIDE 4

Example ¡

hMp://cs.joensuu.fi/sipu/ ¡ ¡

slide-5
SLIDE 5

K-­‑means++ ¡ (The ¡advantage ¡of ¡Careful ¡Seeding) ¡

  • By ¡selec/ng ¡the ¡ini/al ¡centers ¡you ¡can ¡

guarantee ¡lower ¡total ¡error ¡

  • ¡ ¡
slide-6
SLIDE 6

Algorithm ¡

  • Choose ¡ini/al ¡center ¡c_1 ¡uniformly ¡at ¡random ¡
  • Choose ¡the ¡next ¡center ¡c_i ¡by ¡seXng ¡c_i ¡= ¡to ¡a ¡

point ¡in ¡the ¡dataset ¡x’ ¡with ¡probability ¡

  • D(x) ¡being ¡the ¡shortest ¡distance ¡from ¡a ¡data ¡

point ¡x ¡to ¡the ¡closest ¡center ¡already ¡chosen ¡

slide-7
SLIDE 7

Fuzzy ¡k-­‑means ¡clustering ¡

slide-8
SLIDE 8

Probability ¡of ¡cluster ¡membership ¡

slide-9
SLIDE 9

Cost ¡func/on ¡

slide-10
SLIDE 10

Minimiza/on ¡of ¡cost ¡func/on ¡

slide-11
SLIDE 11

Solu/on ¡

slide-12
SLIDE 12

Algorithm ¡

slide-13
SLIDE 13

Example ¡

slide-14
SLIDE 14

References ¡

¡ ¡ ¡ ¡Duda, ¡R., ¡Hart, ¡P., ¡and ¡Stork, ¡D. ¡(2001). ¡ ¡ ¡ ¡ ¡PaMern ¡Classica/on. ¡ ¡ ¡ ¡ ¡John ¡Wiley ¡and ¡Sons, ¡2nd ¡edi/on. ¡ ¡ ¡ ¡ ¡Sergios ¡T., ¡Konstan/nos ¡K.(2006) ¡ ¡ ¡ ¡ ¡PaMern ¡Recogni/on. ¡ ¡ ¡ ¡ ¡Elsevier ¡3rd ¡Edi/on. ¡ ¡ ¡ ¡ ¡Arthur ¡D., ¡Vassilvitski ¡S. ¡(2007) ¡ ¡ ¡ ¡ ¡k-­‑means++: ¡the ¡advantages ¡of ¡careful ¡seeding ¡ ¡ ¡ ¡ ¡Proceedings ¡18th ¡Annual ¡ACM-­‑SIAM ¡Symposium ¡on ¡Discrete ¡Algorithms ¡

slide-15
SLIDE 15

Ques/ons ¡