読者です 読者をやめる 読者になる 読者になる

XMLの要素を抜き出す

ex)Twitterのステータスを確認
http://twitter.com/help/test.xml

Twitter が正常に稼動していれば、以下が返って来ます。

<?xml version="1.0" ?>
    <ok>true</ok>

cf)http://apiwiki.twitter.com/Twitter-REST-API-Method%3A-help%C2%A0test

このXMLドキュメントから"true"を抜き出す

>>> from urllib import urlopen
>>> from xml.dom import minidom, Node
>>> datasource = urlopen("http://twitter.com/help/test.xml")
>>> doc = minidom.parse(datasource)
>>> doc
<xml.dom.minidom.Document instance at 0x40f3f0>
>>> doc.toxml()
u'<?xml version="1.0" ?><ok>true</ok>'

ここまでで、XMLインスタンスを取得することが出来ました。


あとは、以下の様に目的の要素まで降りて行ってデータを取得します。

>>> status = doc.childNodes[0]
>>> status
<DOM Element: ok at 0x40f670>
>>> status.toxml()
u'<ok>true</ok>'
>>> status.firstChild.data
u'true'