農場主の日常

なんちゃってエンジニアの日常をつらづらと

«Prev || 1 | 2 | 3 | 4 |...| 33 | 34 | 35 || Next»

Googleのインデックスのチェック

 Googleのクロウラーが新しく作ったサイトに来てくれるのは良いのだけれど、そのあとインデックスされているかの方が重要。持って行っても、検索に出てこないんじゃあ意味ない。

 そういうわけで、Googleの検索窓から、「site:」コマンドを使ってインデックスを調べていたのだけれど、「allinurl:」コマンドというのもあるのを知った。
 これを使うと、コロン以降のURLが含まれるすべての結果を表示するのだそうだ。確かに、こっちの方が結果が多い。Google、おくが深い。



休みの更新作業

 なんか、平日は休日にやろうとか思うけど、休日になるとやる気が起きない。すぐやる気にならないのは、本心ではやりたくないということなんだろうか。

 さて、公開したサイト以外に今度は昔のサイトもいじろうということで、いくつか修正。まずは、「農場主の漫遊記」のサイトを、携帯電話に対応させてみた。
 本体はNucleusというCMSで作成しているので、携帯電話に対応させるプラグインを入れただけ。
 このプラグインがやっていることは、アクセスしてきたユーザのUAをチェックし、携帯電話だったら携帯電話専用のスキンを表示するというもの。
 合わせて、表示する際の文字コードをS-JISに変換している。

 いたってシンプルだけれど、仕組みはわかった。試してみた限り、動作はおかしくないのだけれど、ただ1つ、検索がうまく行かない。検索時には入力がS-JISになるわけだけれど、最新版のNucleusでは、検索時に保存されている文字コード以外の入力があった場合にはエラー処理するようなコードが入っているようだ。検索はちょうど、NP_CustomURLでリダイレクトの処理を行っているので、リダイレクトする際に文字コードを判別して変換すれば良いのでは?とも思う。まあおいおい。

 スキンの表示はデフォルトではあまり美しくないので、携帯用のWebサイトテンプレートでも探した方が良いかなあ。

 あと、更新時にツイッターに更新した旨を自動登校するプラグインも作っていたのだけれど、ツイッターでいつの間にかBASIC認証使えなくなってたのか。更新時自動投稿が効かなくなってて気づいた。改造するかどうするか。
 これも合わせておいおい。


googleのディープクロールが始まる

 さて、新サイトを公開していろいろと更新しているのは良いけど、いまだアクセス増えず。
 検索エンジンは、トップページと数ページはクロールしてくれたけれど、10000ページあるページのほとんどは見てくれても居ない。

 そうこうしているうちに、Google先生のディープクロールが始まったようだ。ゆっくりとほとんどのページをなめていってくれている。
 このあと、ページを解析して検索結果に反映してくれるわけだ。ここまでは公開後1ヶ月。そのあとどうなっていくかだな。

サイトのベンチマーキング

 大量のデータをアップロードして、気になるのは表示速度と処理にかかる重さ。
 Webサイトの表示に5秒の時間がかかると、訪問者はもうそのサイトは閉じて開かないというデータがあるようだ。

 さて、表示のベンチマークを取ってみると、どうも駅のリスト表示に時間がかかるようだ。あと、宿の表示もかなり時間がかかるようになってしまっている。

 少しWebを検索。どうも、良く検索するデータにPRIMARY KEYなどのインデックスをつけると検索が速くなるようだ。そういえば、データベース作ったときに、特にPRIMARY KEYなんかを設定していなかったなと。
 データベースの構築をしなおして、PRIMARY KEYの設定を追加。結果、8%ほどの速度アップになった。
 強烈とはいえないけれど、全体で少しこういうのを見直した方が良いな。

でかいデータのアップロード

 さて、宿検索サイト「駅から3分」が形になったので、サーバへのアップロード。
 データベースのデータのアップロードは、phpMyadminの機能を使う。でも、そのままの形でアップロードしたら、データがでかすぎるからかどうにもこうにも途中で止まってしまう。
 アップロードは、基本的にgzip形式を使った方が良いようだ。圧縮して送るわけだから容量も減るし。内容はテキストだから、圧縮すればだいぶん縮むし。

 さて、楽天のデータが更新できたので、その他の旅行会社のデータも更新。と思ったら、JTBのCSVのフォーマットが変わった。馬鹿なんじゃないだろうか。日本旅行は4月から更新してないし、改行コードがデータに入ってるし。

 ちまたの宿検索サイトのデータがじゃらんや楽天ばかりなのはそういう理由があるわけで。まあ、旅行会社としてもできれば自社から直接予約して欲しいから、力の入れ具合は違ってくるわな。

«Prev || 1 | 2 | 3 | 4 |...| 33 | 34 | 35 || Next»

↑ PAGE TOP