携帯でTwitter日記
=tw つくった
=tw テスト
=tw 携帯から書いてる
=tw サーバおかしい?
=tw お風呂入ろうとしたらすでにお湯があってアルツハイマーかとびびった。抜き忘れだった。
=tw いまここ→ 東京都墨田区
=tw メールで投稿テスト
=tw
なんてよむの?きくぬ?
=tw すばらしい、写真にコメントつけて公開するのがこんなに手軽に!
=tw
ひもの
=tw
梅沢
=tw
すみだ。携帯で画像のリサイズできるんだなぁ。
=tw
そば処 野?日山
=tw
わかな。
=tw
いなげや。濁点つけるのはどうなのか?
=tw
長命…何?
=tw いまここ→ 東京都台東区台東一丁目14
=tw カレー食べにいく。
=tw いまここ→ 東京都台東区台東二丁目8
=tw
ジャイヒンドというカレー屋さん。おすすめ。
=tw
千円
=tw よく考えたらインド人もけっこう器用だよね。右手だけで全部操作するんだもんなぁ。半ば意地で挑戦中。ナンのちぎりかたにはコツがある。漫然と引っ張るのではなく一点に集中させる。この文章は封印された左手で書いてる。
=tw 今まで家にインターネット引いてなかったけど、つい契約してしまった。店員口上手い。失敗だったかも。後で考える。
=tw 待ち時間の間ヨドバシの上のリフレクソロジーしようかと思ったら予約しないと次は6時半て。
=tw 昼間さんざん写真送ったけどそのあと機能不全に陥ったらしい。
=tw
喫茶ルノワール劇こみ。プランBが必要だ。もばつい500エラー。むー。有隣堂で座れるかなぁ?座れた。
これはエラーで送れなかったぶん。
=tw 携帯プラスついったー、という組み合わせはかなり僕の心の隙間を埋めるソリューションであった。後僕が満足するために足りないものは、ブログへの転載支援とコードを書く場合のマネジメントだ。後者はどう書くオルグを使う。
= リアルタイムで見たい人はTwitter / nishiom。 PCから書いているひとりごとも見たければ Twitter / nishio。
= モバツイッターのページが、画像がサムネイルで埋め込まれていてイイと思ったけど、 携帯だとセッション情報をもてない関係でURLにセッションIDが埋め込まれているので公開できない。 そこでモバツイッターのページをスクレイピングして、ついでにいらない情報を捨てたり 古い順に並べたり、ってスクリプトを書いたんだけども、 たぶん正規表現でスクレイピングしたのは大失敗だったと思う。 わずか一日の間なのに改行が増えてたり「br」が「br/」になったり「br /」になったり。
正解は「Twitter APIを使う」だと思った。 今度気が向いたらやる。
反面教師のコード。dataにHTMLデータが入っているとする。
import re
CLEAR_LEFT = "<br\sclear=['\"]left['\"]>"
PAT = r"""
\[@\]\n+</a>\n*<br(\s/)?>\s*
(?P<contents>[^<]+?)\s*
(<a\shref="[^"]+">(?P<loc>[^<]+)</a>)?\s*
(<a\shref="(?P<imgurl>[^"]+)".+?
<img\ssrc='(?P<smallimgurl>[^']+)'.+?)?\s*
(<br\sclear=['"]left['"]/?>)\s*
(?P<date>\d[^&]+\d)
""" % globals()
print PAT
PAT = re.compile(PAT, re.VERBOSE + re.DOTALL)
import time
items = list(re.finditer(PAT, data))
print len(items)
#print items[0].groupdict()["debug"], items[0].groupdict()["contents"]
if 1:
for m in reversed(items):
d = m.groupdict()
date = time.strptime(d["date"], "%m/%d %H:%M")
date = time.strftime("tw%d%H%M",date)
print "<p class='twitter'>"
print "<a href='#%s' name='%s'>=tw</a>" % (date, date)
if d["loc"]:
print "いまここ→", d["loc"]
else:
print d["contents"].replace("\n", "<br/>")
if d["imgurl"]:
print """
<br><a href="http://movatwitter.jp%(imgurl)s">
<img src='http://movatwitter.jp%(smallimgurl)s'>
</a>""" % d
print "</p>"
っていうかコメントによってbrだったりbr/だったりするということは、 「抽象的な形で保管されているデータをテンプレートに流し込む」ではなく 「整形済みのHTMLの形で保管」というアプローチを取っていると言うことだろうか。 うーん。
このサービスに依存しないような形にならないといけないなぁ。