2012年3月2日金曜日

BeautifulSoupでtable内tr検索

図書館の貸出を自働で取り込むプログラムをつくろうとしたら、<table>タグの中に<table>が複数入れ子になっている汚いhtmlでBeautifulSoupでfindAll(u'tr')としたら下の階のも取り出してしまう。
 findAll(u'tr', recursive=False)
で単一階層から取り出してくれる。

0 件のコメント:

コメントを投稿