Finding Pa)erns in Complex Social Networks Lennon Ganz - - PowerPoint PPT Presentation

finding pa erns in complex social networks
SMART_READER_LITE
LIVE PREVIEW

Finding Pa)erns in Complex Social Networks Lennon Ganz - - PowerPoint PPT Presentation

Finding Pa)erns in Complex Social Networks Lennon Ganz Santa Barbara City College Computer Science Mentor: Dr. Yinghui Wu Faculty Advisor: Dr. Xifeng Yan Department: Computer Science Funded by: National Science


slide-1
SLIDE 1

Finding ¡Pa)erns ¡in ¡Complex ¡ Social ¡Networks ¡

Lennon Ganz Santa Barbara City College Computer Science Mentor: Dr. Yinghui Wu Faculty Advisor: Dr. Xifeng Yan Department: Computer Science Funded by: National Science Foundation ¡

slide-2
SLIDE 2

Social ¡Network ¡

“A ¡network ¡of ¡social ¡interac<ons” ¡

¡

Simple ¡– ¡Contains ¡one ¡type ¡of ¡en<ty ¡(usually ¡people) ¡and ¡their ¡rela<onships ¡ ¡ ¡

Complex ¡– ¡Contains ¡mul<ple ¡types ¡of ¡en<<es ¡(people, ¡places, ¡events) ¡

and ¡their ¡rela<onships ¡

Shane Zach Danny UCSB Student at Proper<es ¡ Name: ¡Zach ¡Flint ¡ Born: ¡6/22/1991 ¡ … ¡ Classmate Of

Social ¡ Graph ¡ Simple ¡ Complex ¡

slide-3
SLIDE 3

Graph ¡Analy<cs ¡Systems ¡

¡ ¡ ¡Challenges ¡ – Networks ¡are ¡large ¡and ¡complex ¡ – Queries ¡(ques<ons) ¡are ¡difficult ¡ to ¡write ¡ ¡ ¡My ¡Objec9ve ¡ – Design ¡a ¡simple, ¡intui<ve ¡ plaTorm ¡to ¡analyze ¡complex ¡ networks ¡

slide-4
SLIDE 4

Designing ¡a ¡Graph ¡Analysis ¡PlaTorm ¡

¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Approach ¡ – Understand ¡exis<ng ¡graph ¡ databases ¡and ¡systems ¡ – Iden<fy ¡suitable ¡queries ¡and ¡ algorithms ¡for ¡social ¡graphs ¡ – Propose ¡and ¡research ¡

  • p<miza<on ¡techniques ¡

Titan ¡

Algorithm ¡-­‑ ¡a ¡set ¡of ¡ instruc<ons ¡for ¡ answering ¡a ¡query ¡ Query ¡-­‑ ¡ ¡ a ¡ques<on ¡

Ques9on ¡ Answer ¡

slide-5
SLIDE 5

Types ¡of ¡Queries ¡ ¡

Type ¡

Example ¡

Aggrega<on ¡

  • “How ¡many ¡a)acks ¡were ¡there ¡in ¡2005?” ¡
  • “What ¡was ¡the ¡most ¡common ¡type ¡of ¡weapon ¡

used?” ¡ Reachability ¡

  • Have ¡these ¡two ¡terrorist ¡groups ¡ever ¡collaborated ¡on ¡

an ¡a)ack? ¡ Pa)ern ¡Matching ¡

  • “Find ¡instances ¡where ¡a ¡terrorist ¡group ¡targeted ¡a ¡

government ¡official ¡who ¡had ¡also ¡been ¡a)acked ¡by ¡a ¡ different ¡group ¡earlier ¡that ¡year” ¡

slide-6
SLIDE 6

Queries ¡ Graph ¡ Files ¡ Index ¡ Files ¡

Query ¡Execu<on ¡ Engine ¡

Global ¡ Terrorism ¡ Data ¡ Converter ¡ Graphical ¡User ¡Interface ¡(GUI) ¡

Query ¡Parser ¡ ¡

Query ¡Results ¡

System ¡ Overview ¡

(Algorithms) ¡

slide-7
SLIDE 7

Building ¡a ¡Graph ¡

Converter ¡ Read ¡data ¡from ¡cells ¡ Connect! ¡ Add ¡data ¡to ¡new ¡or ¡exis<ng ¡ nodes ¡in ¡graph ¡

Global ¡ Terrorism ¡ Data ¡ Converter ¡

slide-8
SLIDE 8

~500 ¡incidents ¡out ¡

  • f ¡113,000 ¡in ¡

Global ¡Terrorism ¡ Database ¡(GTD) ¡

Graph ¡ Files ¡ Index ¡ Files ¡

Visualiza9on ¡

slide-9
SLIDE 9

Queries ¡ Graph ¡ Files ¡ Index ¡ Files ¡

Query ¡Execu<on ¡ Engine ¡

Global ¡ Terrorism ¡ Data ¡ Converter ¡ Graphical ¡User ¡Interface ¡(GUI) ¡

Query ¡Parser ¡ ¡

Query ¡Results ¡

slide-10
SLIDE 10

Reachability ¡Queries ¡

Start ¡ Node ¡

End ¡ Node ¡

0 ¡ 1 ¡ 3 ¡ 1 ¡ 2 ¡ 2 ¡ 3 ¡ 3 ¡ 2 ¡ 3 ¡ 4 ¡ 2 ¡ 1 ¡ 3 ¡ 3 ¡ 4 ¡

Query ¡Execu9on ¡ Engine ¡

Breadth-­‑First ¡Search ¡ (BFS) ¡

slide-11
SLIDE 11

Bidirec<onal ¡Searching ¡

Almost ¡always ¡faster ¡ than ¡a ¡normal ¡search ¡

Query ¡Execu9on ¡ Engine ¡ Query ¡Execu9on ¡ Engine ¡

How ¡much ¡faster? ¡2X? ¡4X? ¡ ¡

slide-12
SLIDE 12

Bidirec<onal ¡Search ¡Performance ¡

0 ¡ 5 ¡ 10 ¡ 15 ¡ 20 ¡ 25 ¡ 30 ¡ 35 ¡ 0 ¡ 500 ¡ 1000 ¡ 1500 ¡ 2000 ¡ 2500 ¡

Performance ¡ Improvement ¡ (x ¡faster) ¡

Number ¡of ¡Nodes ¡

Performance ¡vs. ¡Graph ¡Size ¡

𝐽𝑛𝑞𝑠𝑝𝑤𝑓𝑛𝑓𝑜𝑢=​𝐶𝐺𝑇 ¡𝑆𝑣𝑜𝑜𝑗𝑜𝑕 ¡𝑈𝑗𝑛𝑓/𝐶𝐽𝐶𝐺𝑇 ¡𝑆𝑣𝑜𝑜𝑗𝑜𝑕 ¡𝑈𝑗𝑛𝑓 ¡ 30x ¡faster ¡and ¡ increasing ¡ Constant ¡Density ¡

slide-13
SLIDE 13

Bidirec<onal ¡Search ¡Performance ¡

0 ¡ 5 ¡ 10 ¡ 15 ¡ 20 ¡ 25 ¡ 0 ¡ 0.1 ¡ 0.2 ¡ 0.3 ¡ 0.4 ¡ 0.5 ¡ 0.6 ¡ Performance ¡ Improvement ¡ (x ¡faster) ¡ p ¡

Performance ¡vs. ¡Edge ¡Probability ¡

Probability ¡that ¡any ¡two ¡nodes ¡ are ¡connected ¡by ¡an ¡edge ¡ 𝐽𝑛𝑞𝑠𝑝𝑤𝑓𝑛𝑓𝑜𝑢=​𝐶𝐺𝑇 ¡𝑆𝑣𝑜𝑜𝑗𝑜𝑕 ¡𝑈𝑗𝑛𝑓/𝐶𝐽𝐶𝐺𝑇 ¡𝑆𝑣𝑜𝑜𝑗𝑜𝑕 ¡𝑈𝑗𝑛𝑓 ¡ Constant ¡# ¡

  • f ¡Nodes ¡
slide-14
SLIDE 14

¡“Search ¡for ¡two ¡dis<nct ¡ incidents ¡that ¡had ¡the ¡ ¡ ¡ same ¡perpetrator ¡and ¡the ¡ same ¡target” ¡

Target ¡ Perpetrator ¡ Incident ¡2 ¡ Incident ¡1 ¡

Query ¡Execu9on ¡ Engine ¡

Pa)ern ¡Matching ¡

slide-15
SLIDE 15

200602050020 ¡ Target: ¡Afghan ¡Na<onal ¡ Police ¡ Date: ¡2/5/06 ¡ Country: ¡Afghanistan ¡ City: ¡Khakrez ¡ Weapon ¡Type: ¡Land ¡Mine ¡ Casual9es: ¡6 ¡ Wounded: ¡2 ¡ Summary: ¡………….. ¡ 200602040010 ¡ Target: ¡Afghan ¡Na<onal ¡ Police ¡ Date: ¡2/4/06 ¡ Country: ¡Afghanistan ¡ City: ¡Kandahar ¡ Weapon ¡Type: ¡IED ¡ Casual9es: ¡2 ¡ Wounded: ¡2 ¡ Summary: ¡………….. ¡

Query ¡Results ¡

Pa)ern ¡Found ¡

slide-16
SLIDE 16

Ongoing ¡ Development ¡

Queries ¡ Graph ¡ Files ¡ Index ¡ Files ¡

Query ¡Execu9on ¡ Engine ¡

Global ¡ Terrorism ¡ Data ¡ Converter ¡ Graphical ¡User ¡Interface ¡(GUI) ¡

Query ¡Parser ¡ ¡

Query ¡Results ¡

Applica<on ¡ Programming ¡ Interface ¡ Geographic ¡ Visualiza<on ¡

slide-17
SLIDE 17

Acknowledgments ¡

¡

  • Dr. ¡Yinghui ¡Wu ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Dr. ¡Xifeng ¡Yan ¡

¡ ¡

Zach, ¡Shane, ¡Danny ¡