maandag 29 november 2010

python script voot het automatisch parsen van twitter informatie

Dit weekend zat ik eens op Twitter te surfen. Ik zie nog niet helemaal de lol van twitter in. Het zijn alle maal korte zinnen die je maar half begrijpt. Wel leuk dat je kunt zien wie wie volgt.  Na even surfen blijkt dat deze informatie ook direct op het intern kunt downloaden.

type maar eens:
 http://api.twitter.com/1/statuses/friends/barackobama.xml?cursor=-1

als je blijkbaar een twitternaam kent kun je deze invullen:

http://api.twitter.com/1/statuses/friend/twitternaam.xml?cursor=-1




 Wat er uit komt is een xml boom. Het bloed kruipt waar het niet kan gaan. Dat moet natuurlijk te parsen zijn in een python script. Het volgende script laat direct de namen zien van diegene die je volgt.



import urllib
import xml.dom.minidom

url = "  http://api.twitter.com/1/statuses/friends/twitternaam.xml?cursor=-1"
f = urllib.urlopen(url)
xmlstr = f.read()
print (xmlstr)
boom = xml.dom.minidom.parseString(xmlstr)
lijstnamen =boom.getElementsByTagName("name")
for naam in lijstnamen:
    print naam.firstChild.data





link
twitter api information: http://apiwiki.twitter.com/w/page/22554749/Twitter-REST-API-Method:-
forum voor twitter programmeurs: http://groups.google.com/group/twitter-development-talk?pli=1
python library: https://github.com/joshthecoder/tweepy/

Geen opmerkingen:

Een reactie posten