« 自縄自縛アートと503日記 |Main| タンブラー転載日記 »

もじら24日記

jomei-shimasuta!(無意味に自重しました)

Mozilla24 on Flickr - Photo Sharing!

眠い。

最初の20分でバッテリーがなくなったのでログはなし。

yukobaさんにさんざんPythonの処理系を書けとけしかけられる。あうたびに言われている気がする。

shi3zの日記 - マシン語を知らない子ども達 の正論に賛同して 「プログラミング言語というのは、その言語の処理系を実装して初めて「書ける」と言うのです。 プログラムが書ける、という状態は「処理系が書ける」という状態の延長線上にあるべきで、処理系を書けないということはその言語を理解していないということです。」 とか書こうと思ったけど面倒だからやめた。

♪僕らの名前を覚えて欲しい 機械語を知らない子供たちさ~

AutoPagerize+LDRize入れた

AutoPagerize (swdyh)

IT戦記 - Firebug で XPath を簡単に試す方法

AutoPagerizeのPythonドキュメント用のSITEINFOを書いてみた。 コンテンツがdiv class="content"とかで囲まれていれば楽だったのに、 body直下にずらずらおいてあったので困った。 //body/*[not(self::address)]でFirebugの$xではうまいこと取れたのに、 グリモンに書き込んだらうまく動かない。200行目くらいでpageがnullになっているために次のページを読み込んだ後で切り出しに失敗してターミネートされる。 //bodyにしても動かないから悩んだあげく、試しに//addressにしたら動いた。 謎だけど//bodyは使えないと判断して避けて実装。

        {
            url:          'http://www.python.jp/doc/*',
            nextLink:     '(//a[@rel="next"])[last()]',
            insertBefore: '//address',
            pageElement:  '//div[@class="navigation"][position()=1]/following-sibling::node()',
        },

LDRizeの方のSITEINFOも試しに書いてみた。

      {
            domain:    'http://www.python.jp/doc/*',
            paragraph: '//tt[@xml:id]',
            link:      '//a',
            focus:     '',
            stripe:    true,
            height:    10,
      },
XPathよくわかんないなー。 月曜日にamachangにいい参考資料がないか聞こうっと。

トラックバック(Trackback)

Trackback URL: http://www.nishiohirokazu.org/mt/mt-tb.cgi/651

フィードバック

by yukoba | 2007年09月16日 17:42

> yukobaさんにさんざんPythonの処理系を書けとけしかけられる。あうたびに言われている気がする。
言うよ~ 言うよ~ 会うたびに言うよ~♪ (おぃ

by swdyh | 2007年09月17日 02:24

ごめんなさい、bodyが拾えないのはXPathのせいじゃなくてAutoPagerizeのせいです。次のページのHTMLから強引にDOMツリーを作っているせいか、なぜかhtmlやbodyのへんがちゃんとマッチしません。

ご意見・ご感想をお送りください(フィードバック)

(フィードバックはメールで送信され、基本的に表示されませんが、内容によっては公開させていただくこともございます。ご了承ください。Your comment doesn't appear the page immediately. If the comment has value to other people, it will be put on the page or subsequent entries. Thank you.)

上の情報は、いずれも未記入でかまいません。 All of above questions are optional.