感謝のプログラミング 10000時間

たどり着いた結果(さき)は、感謝でした。

【プログラミング 127.5時間】TwitterAPIを使ってワードを検索する。あとはブログ自動投稿のサンプル作成途中

スポンサーリンク

DOM(Document Object Model Level3)とは、標準化団体のW3Cで勧告されている、XMLパーサーにアクセスするためのAPIの仕様のこと。
DOMの特徴はXML文書全体を「DOMツリー」と呼ばれる木構造のデータとして扱う点である。

DOMはXML全体を解析し、メモリ上に読み込む必要がある。
だから、XML文書のファイルサイズが大きくなると、それだけCPUの負荷やメモリ使用量も大きくなってしまう。

SAX(Simple API for XML)はDOMと同様、XMLパーサーにアクセスするためのAPIの仕様である。
パースとは、解析すること。
SAXはXMLを最初から読み込みながら、必要な処理を行う方式。
メモリ負荷は小さく、処理速度も高速である。

■DOMの仕様で決められているインターフェース
Node:DOMツリーの各ノードを表す。
Document:XML文書全体のこと
Element:XML要素を表す
Attr:XML属性を表す
NodeList:Nodeオブジェクトのリストを表す

JavaXMLパーサーで有名なのはApache Xerces2 Javaである
■Xerces2 Java 2.11.0 - zip
http://xerces.apache.org/mirrors.cgi

■HttpClient
http://hc.apache.org/downloads.cgi

■WebDriverのダウンロード
http://docs.seleniumhq.org/download/
このSelenium WebDriverというのは、ブラウザの操作がJavaで簡単に書けるようになるAPI
このブログに詳しく書いてある。
http://d.hatena.ne.jp/suzukij/20110828/1314549996
ちょっといじってみて、正直感動してしまった。
こんなにブラウザの操作が簡単になるとは・・・。
Webアプリのテストも簡単になりそうですね。
これは色々と使い道がありそう。
ちなみにJavaDocは以下。
http://www.jarvana.com/jarvana/view/org/seleniumhq/webdriver/webdriver-common/0.9.7376/webdriver-common-0.9.7376-javadoc.jar!/org/openqa/selenium/By.html

■アメブロへの自動投稿はこちらのブログを参考にしました。
http://ameblo.jp/chabaori/entry-11359024939.html


■WebDriverでChromeを起動させるためには
http://blog.livedoor.jp/minoaw/archives/5739908.html

■その日のホットワードをyahooから取得する
http://blog-search.yahoo.co.jp/buzzwords/rss

参考→http://www.nilab.info/wiki/BuzzwordAPI.html

これらの情報を使って、ツイッターでキーワードを検索して、結果をWebDriverでアメブロに自動投稿するサンプルを作ってみる。