とりあえず自分用にメモ。
間違ってるところもあるかも。
import mechanize
br = mechanize.Browser()
で、ブラウザ開く感じ
br.open( url )
でurlを開くんだけど、この時robot.txtがある(?)と、開けないので、ブラウザ作ったらbr.set_handle_robots( False )
しておくと開けるようになる。
br.links()で、開いてるページのリンクをgeneratorで渡される。
引数は任意で、"url_regex"とか"text_regex"とかが在って、正規表現渡してやると、一致したリンクが貰える。
links += [x for x in br.links( url_regex = 'hogehoge' )] br.open( links[0] )とかで移動できる。
br.follow_link( text_regex = '' ) br.follow_link( url_regex = '' )で正規表現に一致するリンクに移動。
ログインとか検索とかは
br.select_form( name = 'loginForm' ) br['id'] = id_ br['password'] = psw br['radio'] = ['0'] br.submit()select_formでnameに一致するフォームを選択して、フォームに入力してる。
ラジオボタンは、[]で囲って選択したい値を入れる。
必要な項目を入力し終わったらsubmitしてログインとか検索とか
とりあえず現状こんな感じ
参考
mechanize
Python Mechanize を使ってみる (2) - 傀儡師の館.Python - 楽天ブログ(Blog)