自動巡回エージェントを作る(『スタパライフ』 Ver 1.01)

 Chapter.18 本文ページの解析

 続いて、本文ページの場合です。解析の手順は目次ページの場合と同じですので、もうくどくど言いません(笑)
 各種資料のみ掲載しますので、改めて解析処理を検証してみてください。
 
 本文ページhtmlソース
 本文ページ解析結果htmlタグ付き
 本文ページ解析結果テキスト
 本文ページ解析結果htmlタグ付き(TABLEタグ分割)
 本文ページ解析結果テキスト(TABLEタグ分割)



・本文ページの処理

  82:            page=page_create(buffer,sizeof(buffer));
  83:            ea=page_elements(page);
  84:            el=page_find_elements(page,NULL,"TABLE");
  85:            for(scan=0;scancount;scan++) {
  86:                index=el->items[scan].number+1;
  87:                if((ea->items[index].tag=="TR") &&
  88:                    (ea->items[index+1].tag=="TD") &&
  89:                    (ea->items[index+2].tag=="") &&
  90:                    (ea->items[index+3].tag=="TD") &&
  91:                    (ea->items[index+4].tag=="") &&
  92:                    (ea->items[index+5].tag=="TR") &&
  93:                    (ea->items[index+6].tag=="TD") &&
  94:                    (ea->items[index+7].tag=="P") &&
  95:                    (ea->items[index+8].tag=="BR") ){
  96:                    count=storemessage(
  97:                        log_no,
  98:                        page_element_text(page,&ea->items[index+4]),
  99:                        page_element_text(page,&ea->items[index+2]),
 100:                        page_element_text(page,&ea->items[index+6]));
 101:                    result=1;
 102:                    break;
 103:                }
 104:            }