スレタイの取得方法

スレッドタイトル一覧の取得
http://www.monazilla.org/index.php?e=197

板一覧内に記述されているアドレスにsubject.txtを付けるとスレッドタイトル一覧(スレタイ一覧)が取得できます。

http://[サーバー]/[板名]/subject.txt

(例)地震速報のスレタイ一覧アドレス

http://gimpo.2ch.net/namazuplus/subject.txt

DB

[subject]テーブル

カラム名内容
idintauto_increment
categoryvarchar(255)カテゴリー名
boardvarchar(255)板名
servervarchar(255)サーバーURL
subdomainvarchar(255)スレッドURLのサブドメイン部分
directoryvarchar(255)スレッドURLのディレクトリ部分
datintDATファイル名(スレ立て日のUNIXTIME)
dat_urlvarchar (255)DATファイルのURL
subjectvarchar (255)スレッドタイトル
res_numintレス数
speedfloatスレスピード(レス/時)
crawl_lastint最後にクロールした日時(UNIXTIMEスタンプ)
crawl_saveintDATデータの保存回数
archive_checkint過去ログ行きチェック回数(3回チェックしたら過去ログ行きと判定)
archivetinyint(1)過去ログ行きフラグ
c_utintレコード作成日時(UNIXTIMEスタンプ)=create_unixtimeの意
u_utintレコード更新日時(UNIXTIMEスタンプ)=update_unixtimeの意
d_utintレコード削除日時(UNIXTIMEスタンプ)=delete_unixtimeの意

UNIQUEキー

  • dat
  • thread_url
  • thread_title
    この3つのカラムを複合キーにすれば、重複がないはず。

DATファイルを保存するフォルダ

  • DBに用意するカラムは、DATファイルを保存するフォルダを作成するために必要なデータの分だけ用意しなければならない。
  • datファイルを保存するフォルダの構造を考える。
(例) /dat/subdomain/directory/0/1/2/
  • /dat/フォルダをパ-ミッション「777」にしておく。
    =フォルダ、ファイルの作成が自由にできるようにしておく。
  • /directory/ 以下には、三層の数字のディレクトリを用意=10×10×10=1000分割する。
chmod -R 777 *

で下の階層にあるフォルダも再帰的にパーミッションを変更できる。

更新日:2010-01-03 (日) 00:00:00 (2818d)
トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS