Què és tuiter.net

  • Posted on: 16 November 2011
  • By: dani

Aprofito que Auri Garcia del diari Ara em fa una entrevista sobre tuiter.net  per copiar-la aqui integrament:

Preguntes: Auri Garcia

- Què és exactament tuiter.net i com funciona?

És una eina experimental d’anàlisi de la conversa sobre temes al Twitter, hem fet previament dues proves, una al voltant de les eleccions Autonòmiques catalanes del novembre de 2010, i posteriorment les Municipals del 22 de Maig. Actualment està en marxa per les eleccions generals del 20n.
L'aplicació analitza la publicació de determinats termes (paraules) piulats des de la coneguda plataforma de microblogging, que a continuació són classificats en grups. Les gràfiques mostren la freqüència d'aparició d’aquests termes cada hora, i permeten extreure informació com per exemple l'evolució de la conversa, el perfil d'opinió dels usuaris que hi participen o des d'on estan piulant.

- És infal·lible detectant tuits sobre política, o se'n poden escapar? Fins a quin punt és exhaustiu? De què depèn?

Només te en compte les piulades que contenen les paraules clau que s’hagin definit, en aquest cas “rubalcaba”, “rajoy”, “pp”, “psoe” i “20n”, per tant no és en absolut exhaustiu, però si dona una idea dels alts i baixos que es donen a la conversa deguts a la aparició als mitjans, mitins, etc.

- Es filtra que siguin només en català, o només d'usuaris catalans, o hi ha alguna altra mena de restricció?

Desgraciadament no es poden filtrar els twitts per català, twitter actualment agrupa els twitts en català dins del grup “castellà”. Només es cerquen els missatges d’aquest grup per evitar que entring missatges en altres idiomes que no tenen res a veure

- En la campanya de les catalanes de l'any passat, quin període de temps vau cobrir?

Va estar funcionant 2 mesos

- Quants usuaris diferents que parlessin de política es van comptabilitzar?

Que parlessin de les paraules clau que vam triar uns 50000 usuaris, tot i que probablement son més

- Quins partits van ser més protagonistes, van tenir més tuits que parlessin d'ells? Amb quines xifres?

Aproximadament semblants. A la xarxa la diferència entre els grans partits és menor que a la realitat de les votacions. Quan algú parla d’un politic o d’un partit, la majoria de vegades no es per que el segueixin o el votin, moltes vegades és per criticar-los.

- Vau comptabilitzar també el volum de conversa sobre temes determinats?

De fet qualsevol es pot descarregar les dades capturades a les eleccions del 28n, http://www.pimpampum.net/blog/2011/04/14/dump-de-les-dades-recollides-a-la-plataforma-tuiter-abans-i-despres-de-les-darreres-eleccions-del-28-de-novembre-del-2010/
en aquest cas amb 29 termes analitzats es van capturar
227,215 tweets i  46,457 usuaris

- En la campanya actual només s'està seguint PP i PSOE, Rajoy i Rubalcaba, per què?

Ho tenim en periode experimental i voliem veure

- Des de quan esteu recopilant dades?

Des de fa un mes i mig, en aquest moment hi ha recopilats uns 200.000 tweets, i uns 50.000 usuaris diferents que en algun moment han fet servir les 5 paraules de l’experiment actual.

- Pel que veig, a dia d'avui dominen força PP i Rajoy. És la tònica general?

Si, tot i que varia força en el temps, predominen els twitts del pp i Rajoy, aproximadament un 60% contra un 40%, però això reflecteix bastant el panorama actual oi?

Daniel Julià
pimpampum.net

Enllaços

Slideshare sobre tuiter.net
http://www.slideshare.net/DanielJuli1/tuiternet-pimpampumnet-7610448

La pàgina de tuiter.net a pimpampum.net
http://www.pimpampum.net/ca/content/tuiternet

Contenido relacionado

Eines útils per la mineria de dades

  • Posted on: 18 September 2014
  • By: dani
Taller Open Data organitzat per Julià Minguillón

He assistit a la tercera part del taller d'Open Data, organitzat per Julià Minguillón de la UOC.

Aquesta tercera part estava dedicada a les eines d'anàlisi de dades mitjançant mètodes estadístics i lamineria de dades, termes implicats però que fan referència a temes diferents

Us en faig un resum de les 3 més utilitzades a continuació:

 

Sopa "milagrosa"

  • Posted on: 13 February 2012
  • By: dani

La cuina és una d'aquestes coses on no cal tenir manies.

Avui ens venia de gust una sopa però el rebost estava força buit. No hi havia els ingredients habituals.

Doncs a improvisar!, i Déu n'hi dó tot el que hi hem arreplegat!

La sopa "milagrosa" ha tingut els següents ingredients:

Maldecaps amb :nth-child(n)

  • Posted on: 8 December 2011
  • By: dani

Qui diu que el CSS és fàcil? Sovint ens trobem coses "rares", tot i que una vegada ho aprens veus que poden tenir sentit.

A can pimpampum estem provant de fer servir el selector :nth-child per poder estructurar columnes. Aquest selector és de CSS3 i tot i que semblaria que molts navegadors (sobretot explorer) no ho admeten, és una solució ideal per adaptar un layout als navegadors de mòbils (android i iphone) que tenen navegadors web d'última generació, el que s'anomena "responsive design"

Que fa la gent durant el dia, segons twitter

  • Posted on: 2 October 2011
  • By: dani
work timeu
trabajo timeu

Aquest projecte em resulta fascinant, http://timeu.se/

Es tracta d'un projecte universitari de Scott Golder (Cornell University)

La idea és ben simple, a partir d'un enorme "set" de dades provinent de twitter es normalitzen segons el desfasament horari, de manera que les "8 del matí" son les "8 del matí" a qualsevol lloc del món. Llavors es tracta de visualitzar la freqüència d'aparició de determinades paraules segons l'hora del dia i el dia de la setmana.