XMLの要素を抜き出す
ex)Twitterのステータスを確認
http://twitter.com/help/test.xml
Twitter が正常に稼動していれば、以下が返って来ます。
<?xml version="1.0" ?> <ok>true</ok>
cf)http://apiwiki.twitter.com/Twitter-REST-API-Method%3A-help%C2%A0test
このXMLドキュメントから"true"を抜き出す
>>> from urllib import urlopen >>> from xml.dom import minidom, Node >>> datasource = urlopen("http://twitter.com/help/test.xml") >>> doc = minidom.parse(datasource) >>> doc <xml.dom.minidom.Document instance at 0x40f3f0> >>> doc.toxml() u'<?xml version="1.0" ?><ok>true</ok>'
ここまでで、XMLのインスタンスを取得することが出来ました。
あとは、以下の様に目的の要素まで降りて行ってデータを取得します。
>>> status = doc.childNodes[0] >>> status <DOM Element: ok at 0x40f670> >>> status.toxml() u'<ok>true</ok>' >>> status.firstChild.data u'true'