FIFA World Cup 2014, the biggest sporting event in four years (sorry Olympics) is starting today. The tournament holds 736 players from 32 countries. When the players are not playing for their national teams, they play in 301 different clubs. Players from different national teams meet in these clubs. For example, Manchester United has players from 9 different national teams. This means that players in the World Cup who play in Manchester United know players from at least eight different national teams. Why is this important? If two players belong to the same team (national or club), they have a social connection. Using social network analysis we can analyze and visualize this connection (examples from UEFA 2012 and World Cup 2010 similar networks). So, here’s the social network of FIFA World Cup 2014:

worldcup_players_all_v3

In the picture above is the player-to player-connections (here’s a pdf with a better resolution). The size of a players name represents the total number of other players he shares a club with. The top players, Antonio Valencia, Javier Hernández, Julian Green, Shinji Kagawa, Robin van Persie, Nani, Arjen Robben, Mario Mandžukić, Patrice Evra, Xherdan Shaqiri, Daniel Van Buyten, Dante and Javi Martínez have all 13 club mates in the tournament. The color of the player is determined by a computer program that detects clusters. Most of the clusters are the same as the national teams, but we notice that in the middle, the line between Spain, France, Brazil etc. start to become blurry. To get a better picture of the most connected players, below is the core of the network: top 10 % of the players.

worldcup_players_coreWe can also visualize the connections between different national teams and the clubs.

worldcup_teams_clubs_v1

A line between a club and team is formed when a player plays in both of them (pdf). The more a national team has players from a specific team, the thicker the line. For example the German team has seven players from Bayern Munich and Spain has seven players from Barcelona. The most diverse teams are Algeria and Nigeria whose players come all from different clubs. To clarify the situation, below is a picture of the teams and clubs that have at least two common players. Four countries have at least two players from Napoli.

worldcup_players_core_v3Most interesting finding for me is that all of the players are connected one way or another. On average, two players have less than three steps between them. It would be interesting to extend this analysis to the players’ previous clubs and see how the social network of past five years would look like.

EDIT: For those that are more of DIY type network analysts, here are the network files (GraphML): player-player network and team-club network.

Twitter: jattipaa

99analytics.com

Data from Wikipedia. Visualizations with Gephi.

The UEFA European Championship 2012 has some interesting statistics. For example its 16 teams have 368 players from 137 clubs. This means that in average each club has almost 3 of its players on the tournament. But averages are a poor tool when you can use social network analysis.

Like in 2010 World Cup the teams, clubs and players form a social network. In short, if a two players belong to the same team (country or club), they have a connection and this connection can be visualized. For similar visualizations, check out this viz from a Finnish newspaper Helsingin Sanomat (I also got the raw data used to do this analysis from the site).

The picture below is all the players, teams and clubs in the same network. The size of the node represents the amount of connections the node has.

Bayern München is the best represented club: it has 13 players in the tournament.

The next picture has only the clubs and teams. They are connected through players. The size of the node represents the “importance” (or eigenvector centrality) of the node. This means that the players from the Netherlands team are best connected throughout the network. Surprisingly Sweden is second. As the number of common players increase, so does the thickness of the line between the club and the team. They also get closer they get on the map. For example Spain and Portugal both have lot of players from Real Madrid and these two countries end up close to each other on the map. From the clubs’ perspective the players from Arsenal, Bayern München and Manchester City are central to the network.

To take the analysis even further here is the network of all the players in the tournament. A connections here means a shared team or a club membership. The size of the node represent the importance (or a good position) of the player. The color represents the “community” of players; a clique of sorts.

Franck Ribéry and Arjen Robben are the most well positioned players in the network. Every player can reach every other player in max 5 steps. A more clearer picture emerges after we remove all the players that play with less than 27 other players (22 from their team + 5 from the club). A sort of crème de la crème of players.


For you SNA enthusiasts here is the .net file of the players, teams and all of the actors. Visualized with Gephi.

twitter: jattipaa

www.verkostoanatomia.fi

facebook: Verkostoanatomia

Verkostoanalyysilla voidaan selvittää paljon monimutkaisia ja piileviä kuvioita. Yksi esimerkki on yritysten hallitusten väliset verkostot. Maailmalla tästä on ihan hienoja sovelluksia kuten They Rule.

Tällaisten verkostojen tekeminen ei välttämättä ole vaikeaa, se on vain työlästä. Tässä on ohjeet siihen, miten itse voit visualisoida esim. hallitusten välisiä verkostoja. Esimerkkinä käytän Kauppalehdessä 26.3.2012 tekemääni analyysiä valtionyhtiöiden hallitusten verkostoista, mutta menetelmää voi käyttää muissakin verkostoissa.

twitter: jattipaa

www.verkostoanatomia.fi

facebook: http://www.facebook.com/pages/Verkostoanatomia/189756439160

Sosiaalisen median merkitystä presidentivaaleissa on ruodittu tarkkaan niin perinteisissä kuin uudemmissakin medioissa. Hyviä kiteytyksiä on esim. Karri Anttilalla ja Harto Pönkällä. Myös jotain huvittavia paniikkireaktioita on ollut havaittavissa.

En mene tässä kirjoituksessa syvemmällä sosiaalisen median vaikutuksiin vaan keskityn siihen mitä sosiaalisesta mediasta saadaan irti. Itselleni Facebookin, Twitterin yms. viehätys tulee niiden tarjoamasta mahdollisuudesta saada ihmisten vuorovaikutuksesta helposti dataa jatkojalostukseen.

Ajatusleikkinä kokeilen voiko Facebook-sivujen aktiivisuustiedoilla ennustaa vaalituloksia? En tarkoita yksinkertaista ja hieman naiivia tykkäysten määrän laskemista vaan sivuilla tapahtuvan vuorovaikutuksen analyysiä.

Hain ehdokkaiden kaikki sellaiset henkilöt, jotka ovat aktivoituneet vain ja ainoastaan kahden ehdokkaan sivuilla. Aktivoituminen tässä tarkoittaa sivun seinälle kirjoittamista/linkkien yms. julkaisua, kommentointia ja näiden tykkäyksiä. Hain Sometrik-palvelulla (maksuton ja avoin beta-versio) presidentivaaliehdokkaiden Facebook-kampanjasivuilta tietoa siitä, miten sivulla ollaan aktivoiduttu.

Ajatusleikissä vain kahden ehdokkaan sivulla aktivoituminen merkitsee tasapainoilua ehdokkaiden välillä, ja jos ensimmäinen ehdokas putoaa, äänestää aidallaseisoja jäljelle jäänyttä. Näin ensimmäisellä kierroksella pudonneiden ehdokkaiden kannattajien äänet jakautuisivat:

Toisella kierroksella Haaviston taakse siirtyisi enemmän väkeä Eva Biaudet’lta (75 %) ja  Paavo Arhinmäeltä (69 %). Niinistön taakse tulisi selkeästi eniten väkeä Sari Essayahilta (65 %). Muilla jakautuisi aktiivisuus miltei tasan molemmille.

Kun pudonneiden äänisaalis jaetaan näiden painokertoimien mukaan ja mukaan lasketaan Niinistön ja Haaviston omat äänisaalit, saamme toisen kierroksen tulokseksi

Niinistö 61 % ja Haavisto 39 %.

Ajanjakso oli kuukausi ennen ensimmäistä kierrosta 19.12.2011-19.1.2012. Halusin saada kaikkien ehdokkaiden vuorovaikutustiedot, ja poliittisilla kampanjasivuilla on tapana hiipua heti kisan päätyttyä. Yleiset aktiivisuustiedot (esim. kuinka suuren osan tykkääjistään sivu on saanut liikkeelle) voi katsoa Sometrikista.

Kuten sanottu, kyseessä on ajatusleikki, mutta odotan mielenkiinnolla toteutuneita tuloksia.

twitter: jattipaa

www.verkostoanatomia.fi

facebook: http://www.facebook.com/pages/Verkostoanatomia/189756439160

*otsikossa on kysymysmerkki kunnianosoituksena iltapäivälehdille. Jos lisää kysymysmerkin, ei varsinaisesti väitä mitään.

Edit: I’ve jumped the gun: the Markkinointiviestinnän viikot #-tag was changed. This is the new version. Note self: check the #-tag beforehand…

Everything seems to happen sporadically . This is also true in Finland as the Mindtrek event in Tampere and – aptly named two day event – Markkinointiviestinnän viikko (Week of marketing communications) in Helsinki coincide in the same week. Luckily one is able to follow both via twitter with the #tags #mindtrek and #2011mvv   (+  #mvv2011). Moreover we can visualize the conversations happening in both. Do they overlap, which event activates more people and conversation and who orchestrates the communication etc? In this picture I have combined the tweets of the two events (at 2.20 PM).

The two events seem to overlap but two distinctive groups are formed: Mindtrek on the left and MVV on the right. There are total 446 tweeters combined.  The size of the node represents the bridgespanning role of the person: the bigger the node the between the two groups tweets the person is. We see that   @vesilola, @pauliinamakela, @mindtrek_ and @arimarjamaki ‘s tweets connect the two events.

Looking at the two events separately we can detect the most mentioned people. The size of the node represents the amount of tweets received and the color of the node the persons activity in mentioning others.

In Mindtrek there are at the moment 187 different tweeters. @mindtrek_@vesilola are the most mentioned while @mindtrek is the most active.

In Markkinointiviestinnän viikot there are at the moment 289 different tweeters. @vesilola, @socialdistrict and @greenpeacesuomi are the most mentioned while @pauliinamakela and @eisoma the most active. The overall structure seems more dense than Mindtrek’s so there seems to be more going on in Helsinki.

This is a a snapshot of the situations. If you want to do similar analysis yourself instructions can be found in these slides. The tweets were gathered with NodeXL and visualized with Gephi.

twitter/jattipaa

www.verkostoanatomia.fi

Visualizing Twitter networks can make sense in the constant stream of tweets. We can detect different communities or active Tweeters. I have made a quick hands on guide for twitter hashtag visualization using Gephi and NodeXL:

 

twitter: jattipaa

www.verkostoanatomia.fi

facebook: http://www.facebook.com/pages/Verkostoanatomia/189756439160

Eduskuntavaaleista on jo kaksi kuukautta, eikä Suomella ole kirjoitushetkellä hallitusta. Haasteita on riittänyt, eikä vieläkään ministereitä ole nimitetty. Eräässä aikaisemmassa kirjoituksessani ennustin harhaan, ettei Vihreitä ja Kristillisdemokraatteja tulla samassa hallituksessa näkemään (samaan aikaan totesin että “Hallitusneuvotteluista tullee mielenkiintoiset”). Hallituksen muodostamisessa on omassa mielessäni jotain samaa kuin eräissä toisissa neuvotteluissa yli vuosikymmen sitten.

Hallitus tullaan kuitenkin muodostamaan, mutta keitä siihen tulee ja miten eri puolueiden mielipiteet osuvat yhteen?

Käyttäen samaa Ylen vaalikoneaineistoa, joka julkaistiin sittemmin myös avoimena datana, tein kartan hallituksen ja opposition kansanedustajien mielipiteiden samankaltaisuudesta. Datassa on 192 ehdokasta 200:ta (Hemmilä Pertti,  Holmlund Anne,  Jurva Johanna,  Kalli Timo,  Kettunen Pentti,  Kärnä Jukka,  Oinonen Pentti ja  Tuomioja Erkki puuttuvat)

Kuvassa on yhteys kahden edustajan välillä, jos heillä oli sama mielipide vähintään 14 eri asiassa. Kuvassa on korostettu sen ehdokkaan nimen kokoa, jonka mielipiteet ovat muiden mielipiteiden välissä; “mielipidevälittäjiä”. Esim. Henna Virkkunen (kok), Petteri Orpo(kok),  Johanna Karimäki (vihr), Jouko Jääskeläinen (kd) sekä Kristiina Salonen (sdp) ja Eeva-Johanna Eloranta (sdp) toimivat konsensuksen rakentajina. SPD tuntuu muutenkin toimivan Vasemmistoliiton puskurina. Ryhmät ova yhtenäisiä Vihreitä ja RKP:tä lukuun ottamatta.

Oppositiossa on hieman enemmän yhtenäisyyttä: kuvassa on yhteys kahden edustajan välillä, jos heillä on sama mielipide vähintään 15 eri asiassa. Kahtiajako on kuitenkin näkyvää, vaikka “mielipidesoluttautujia” näkyy molemmin puolin: Ville Vähämäki (ps), Inkeri Kerola (kesk) ja Jari Leppä (kesk) ovat ehkä enemmän kotonaan toisessa oppositiopuolueessa.

Hallituksen sisälle näyttää syntyvän kokoomus-rkp-kd sekä vihreät-sdp-vasemmistoblokit. Six-packissa löytyy siis selkeästi kahta eri juomalaatua (mitähän sitä nuorena varoiteltiinkaan eri juomalaatujen ristiinjuomisesta). Veikkauksena tulevalle hallituskaudelle näiden tulosten pohjalta on, että tulevassa hallituksessa tarvitaan sillanrakentajia ja paljon kärsivällisyyttä.

www.verkostoanatomia.fi

facebook: http://www.facebook.com/pages/Verkostoanatomia/189756439160

twitter: jattipaa

SomeTime 2011 -tapahtuma kokoaa 10.6.-11.6.2011 yhteen suomalaisia sosiaalisesta mediasta kiinnostuneita. Itse en paikalle päässyt ja seuraankin tapahtumaa twitterissä tägillä #sometime2011. Saman tägin pohjalta voimme myös koota tweettejä ja visualisoida niistä verkostoja.

Oma panokseni tälle perjantaille onkin keräillä näitä tweettejä ja julkaista lyhyitä raportteja siitä, kuka mainitsee kenet. Tästä seuraa kuitenkin ongelma, jonka Heisenbergikin on todennut: jos seuraavat kartat ovat suosittuja, alan itse olla keskeinen toimija verkostossa. Miten te hanskaisitte asian?

Kuitenkin, itse asiaan. Kerään siis tweetit neljä kertaa tunnissa, ja pyrin julkaisemaan tunnin-puolentoista välein sekä k.o. ajanvälin tweetit sekä kokonaiskertymätweetit (alin kuva muodostaa kuvan siihen saakka kertyneistä tweeteistä). Pallon koko vastaa saatujen mainintojen lukumäärää ja värin tummuus aktiivisuutta mainita muita.

EDIT: mukana myös #someback, #someengine, #somemeeting, #somestage, #somestudio, #someyard haettuina puolen tunnin välein klo 11.45 alkaen.

EDIT: Verkostoanatomia kiittää ja kuittaa. Alla video kaikista tweeteistä ajalla 8.30-18.00. Videon alapuolella tuntikatsaukset ja kuva kaikista tweeteistä. Kaikkiaan jonkun #-tägeistä mainitsi 272 tweettaajaa, 591 kertaa mainittiin joku muu. Päivän tweetatuin henkilö oli @tuija (33 mainintaa) ja aktiivisin tweettaaja @pauliinamakela, joka mainitsi 13 kertaa jonkun muun (myös minut, kiitos!). Enjoy!

8.30-10.00

10.00-11.00

11.00-12.00

12.00-13.00

13.00-14.00

14.00-15.00

15.00-16.00

16.00-17.00

17.00-18.00

Kokonaistilanne (päivittyy jatkuvasti):

twitter: jattipaa

www.verkostoanatomia.fi

facebook: http://www.facebook.com/pages/Verkostoanatomia/189756439160

Tiedot kerätty NodeXL:n kätevällä skriptillä ja visualisoitu Gephillä.

Paljon Suomessa on twitterin käyttäjiä? Toni Nummelan Google-analyysi  tuotti 105502 käyttäjää, jotka ovat sijoittaneet itsensä Suomeen (itseäni en ole sijoittanut minnekään). Pelkkiä tililukumääriä tuijottelemalla ei pääse kuitenkaan kovinkaan pitkälle, sillä sosiaalisessa mediassa aktiivisuus ratkaisee. Twitter-tilin luominen on helppoa, ja moni on sen luonutkin katsoakseen mikä eläin twitter oikeastaan on. Maailmalla aktiivisten twitter-käyttäjien lukumäärä vaihtelee n. 15 % ja 20 % välillä.

Miten sitten aktiivisuus määritellään? Itse määrittelen sen tässä johonkin suureen twitter-tapahtumaan osallistumisena. Alla olevassa kuvassa on yhdistetty kaikki  tweettaajaat, jotka ovat osallistuneet suuriin (ja joihinkin pieniin) suomalaisiin twitter-tapahtumiin: #linnanjuhlat, #vaalit2011, #suorayhteys ja #euroviisut sekä muutama pienempi tapahtuma, joissa pääsääntöinen kieli on ollut suomi.

Kaiken kaikkiaan edellämainituissa tapahtumissa on tweetannut 2894 eri tweettaajaa. Viiva kahden tweettaajan välillä tarkoittaa @mainintaa joissain näistä tapahtumissa. Jos käytämme 15-20 % laskutapaa,  Suomessa olisi noin 15000-20000 twitter-käyttäjää. Tässä pdf kuvasta.

Samansuuntaisia tuloksia tulee, jos katsoo eduskuntavaalien tulosillan (Yle 1 ja MTV3 yhteensä 1 885 000 katsojaa => 40 % väestöstä) ja euroviisujen finaalin (1 323 000 katsojaa => 28% väestöstä) katsojalukuja (Finnpanelin tuloksia). Jos sama prosentti aktiivisesta twitter-väestä osallistui tweettauksiin, saamme aktiivisen twitter-väen lukumääräksi (#vaalit2011: 0,4*x = 1808 tweettaajaa => 4520 aktiivitweettaajaa ; #euroviisut: 0,28*x= 840 tweettaajaa => 3000 aktiivitweettaajaa) 3000 ja 4500 aktiivisen välillä. Näin suomalaisia twitter-tilejä olisi 15000 ja 23000 välillä.

Laskelmat siis pohjautuvat aika karkeisiin arvioihin ja oletuksiin, että edustava otos on osallistunut edellämainittuihin twitter-tapahtumiin. Tiedän aktiivisia suomalaisia twitter-käyttäjiä, jotka eivät osallistu kuin englanninkieliseen keskusteluun, eivätkä kaikki suuriin keskusteluihin osallistuneet ole suomalaisia.

EDIT: Pdf:stä voi ctrl-f:tä omaa nimeään. Ja en siis väitä, että kuvassa on kaikki Suomen aktiiviset tweettaajat (taitaa se lukea jossain tekstin seassa) vaan sellaiset, joiden nimi on mainittu näissä tapahtumissa. Tarkoituksenani on antaa jonkinlainen arvio tweettaajien kokonaislukumäärästä.

twitter: jattipaa

www.verkostoanatomia.fi

facebook: http://www.facebook.com/pages/Verkostoanatomia/189756439160

Kuvat visualisoitu Gephillä.

Eurovision song contest is a great example of networks: people tend to vote their neighboring country. In twitter one could follow and comment the pan-European event using the hashtags #eurovision, #esc, #esc2011 and in Finland #euroviisut. To a network analyst the @-mentions are the most interesting: who mentions whom. A tweet using one of the #-tags and an @name means a connection between two tweeters. Using NodeXL to retrieve the tweets (script here) from 1 hour before the final to the end of the voting and Gephi to visualize the dynamic structure of the network I came up with the following picture:

The size of the node represents received mentions and the darkness of the node represents activity of mentioning other tweeters (detailed picture here, see if you can find yourself with ctrl-f). Tweeters that didn’t mention anyone else are not shown here. @queen_uk (343 mentions received), @malena_ernman (81 mentions) and @bbceurovision (73) were the most popular tweeters. The most active tweeter was @davis3xm. Overall 64187 tweeters used the hashtag during the 4,5 hour period and 6378 mentioned someone else.

If we focus in the biggest connected network (2094 nodes with 3618 mentions) we get a clearer picture. This time the color represents the “community” of tweeters:

Pdf here.

twitter: jattipaa

www.verkostoanatomia.fi

facebook: http://www.facebook.com/pages/Verkostoanatomia/189756439160

EDIT: Finnish Eurovision twitter network

The Finnish tag #euroviisut attracted 840 tweeterers and had 619 mentions. The most mentioned (represented by the size of the node) were @jyrkikasvi (38 mentions), @johannasl (17 mentions), @euroviisut and @eskoseppanen (both 14 mentions). The most active mentioners (represented by the darkness of the node) were @oolatus and @kestinen (both mentioned 10 other. Here’s the picture and pdf.