Googleのインデックスのチェック
10/09/11 | Webネタ・サイト更新 | サクラキャンドル
Googleのクロウラーが新しく作ったサイトに来てくれるのは良いのだけれど、そのあとインデックスされているかの方が重要。持って行っても、検索に出てこないんじゃあ意味ない。
そういうわけで、Googleの検索窓から、「site:」コマンドを使ってインデックスを調べていたのだけれど、「allinurl:」コマンドというのもあるのを知った。
これを使うと、コロン以降のURLが含まれるすべての結果を表示するのだそうだ。確かに、こっちの方が結果が多い。Google、おくが深い。
そういうわけで、Googleの検索窓から、「site:」コマンドを使ってインデックスを調べていたのだけれど、「allinurl:」コマンドというのもあるのを知った。
これを使うと、コロン以降のURLが含まれるすべての結果を表示するのだそうだ。確かに、こっちの方が結果が多い。Google、おくが深い。
休みの更新作業
10/09/04 | Webネタ・サイト更新 | サクラキャンドル
なんか、平日は休日にやろうとか思うけど、休日になるとやる気が起きない。すぐやる気にならないのは、本心ではやりたくないということなんだろうか。
さて、公開したサイト以外に今度は昔のサイトもいじろうということで、いくつか修正。まずは、「農場主の漫遊記」のサイトを、携帯電話に対応させてみた。
本体はNucleusというCMSで作成しているので、携帯電話に対応させるプラグインを入れただけ。
このプラグインがやっていることは、アクセスしてきたユーザのUAをチェックし、携帯電話だったら携帯電話専用のスキンを表示するというもの。
合わせて、表示する際の文字コードをS-JISに変換している。
いたってシンプルだけれど、仕組みはわかった。試してみた限り、動作はおかしくないのだけれど、ただ1つ、検索がうまく行かない。検索時には入力がS-JISになるわけだけれど、最新版のNucleusでは、検索時に保存されている文字コード以外の入力があった場合にはエラー処理するようなコードが入っているようだ。検索はちょうど、NP_CustomURLでリダイレクトの処理を行っているので、リダイレクトする際に文字コードを判別して変換すれば良いのでは?とも思う。まあおいおい。
スキンの表示はデフォルトではあまり美しくないので、携帯用のWebサイトテンプレートでも探した方が良いかなあ。
あと、更新時にツイッターに更新した旨を自動登校するプラグインも作っていたのだけれど、ツイッターでいつの間にかBASIC認証使えなくなってたのか。更新時自動投稿が効かなくなってて気づいた。改造するかどうするか。
これも合わせておいおい。
さて、公開したサイト以外に今度は昔のサイトもいじろうということで、いくつか修正。まずは、「農場主の漫遊記」のサイトを、携帯電話に対応させてみた。
本体はNucleusというCMSで作成しているので、携帯電話に対応させるプラグインを入れただけ。
このプラグインがやっていることは、アクセスしてきたユーザのUAをチェックし、携帯電話だったら携帯電話専用のスキンを表示するというもの。
合わせて、表示する際の文字コードをS-JISに変換している。
いたってシンプルだけれど、仕組みはわかった。試してみた限り、動作はおかしくないのだけれど、ただ1つ、検索がうまく行かない。検索時には入力がS-JISになるわけだけれど、最新版のNucleusでは、検索時に保存されている文字コード以外の入力があった場合にはエラー処理するようなコードが入っているようだ。検索はちょうど、NP_CustomURLでリダイレクトの処理を行っているので、リダイレクトする際に文字コードを判別して変換すれば良いのでは?とも思う。まあおいおい。
スキンの表示はデフォルトではあまり美しくないので、携帯用のWebサイトテンプレートでも探した方が良いかなあ。
あと、更新時にツイッターに更新した旨を自動登校するプラグインも作っていたのだけれど、ツイッターでいつの間にかBASIC認証使えなくなってたのか。更新時自動投稿が効かなくなってて気づいた。改造するかどうするか。
これも合わせておいおい。
googleのディープクロールが始まる
10/09/02 | Webネタ・サイト更新 | サクラキャンドル
さて、新サイトを公開していろいろと更新しているのは良いけど、いまだアクセス増えず。
検索エンジンは、トップページと数ページはクロールしてくれたけれど、10000ページあるページのほとんどは見てくれても居ない。
そうこうしているうちに、Google先生のディープクロールが始まったようだ。ゆっくりとほとんどのページをなめていってくれている。
このあと、ページを解析して検索結果に反映してくれるわけだ。ここまでは公開後1ヶ月。そのあとどうなっていくかだな。
検索エンジンは、トップページと数ページはクロールしてくれたけれど、10000ページあるページのほとんどは見てくれても居ない。
そうこうしているうちに、Google先生のディープクロールが始まったようだ。ゆっくりとほとんどのページをなめていってくれている。
このあと、ページを解析して検索結果に反映してくれるわけだ。ここまでは公開後1ヶ月。そのあとどうなっていくかだな。
サイトのベンチマーキング
10/08/30 | Webネタ・サイト更新 | サクラキャンドル
大量のデータをアップロードして、気になるのは表示速度と処理にかかる重さ。
Webサイトの表示に5秒の時間がかかると、訪問者はもうそのサイトは閉じて開かないというデータがあるようだ。
さて、表示のベンチマークを取ってみると、どうも駅のリスト表示に時間がかかるようだ。あと、宿の表示もかなり時間がかかるようになってしまっている。
少しWebを検索。どうも、良く検索するデータにPRIMARY KEYなどのインデックスをつけると検索が速くなるようだ。そういえば、データベース作ったときに、特にPRIMARY KEYなんかを設定していなかったなと。
データベースの構築をしなおして、PRIMARY KEYの設定を追加。結果、8%ほどの速度アップになった。
強烈とはいえないけれど、全体で少しこういうのを見直した方が良いな。
Webサイトの表示に5秒の時間がかかると、訪問者はもうそのサイトは閉じて開かないというデータがあるようだ。
さて、表示のベンチマークを取ってみると、どうも駅のリスト表示に時間がかかるようだ。あと、宿の表示もかなり時間がかかるようになってしまっている。
少しWebを検索。どうも、良く検索するデータにPRIMARY KEYなどのインデックスをつけると検索が速くなるようだ。そういえば、データベース作ったときに、特にPRIMARY KEYなんかを設定していなかったなと。
データベースの構築をしなおして、PRIMARY KEYの設定を追加。結果、8%ほどの速度アップになった。
強烈とはいえないけれど、全体で少しこういうのを見直した方が良いな。
でかいデータのアップロード
10/08/29 | Webネタ・サイト更新 | サクラキャンドル
さて、宿検索サイト「駅から3分」が形になったので、サーバへのアップロード。
データベースのデータのアップロードは、phpMyadminの機能を使う。でも、そのままの形でアップロードしたら、データがでかすぎるからかどうにもこうにも途中で止まってしまう。
アップロードは、基本的にgzip形式を使った方が良いようだ。圧縮して送るわけだから容量も減るし。内容はテキストだから、圧縮すればだいぶん縮むし。
さて、楽天のデータが更新できたので、その他の旅行会社のデータも更新。と思ったら、JTBのCSVのフォーマットが変わった。馬鹿なんじゃないだろうか。日本旅行は4月から更新してないし、改行コードがデータに入ってるし。
ちまたの宿検索サイトのデータがじゃらんや楽天ばかりなのはそういう理由があるわけで。まあ、旅行会社としてもできれば自社から直接予約して欲しいから、力の入れ具合は違ってくるわな。
データベースのデータのアップロードは、phpMyadminの機能を使う。でも、そのままの形でアップロードしたら、データがでかすぎるからかどうにもこうにも途中で止まってしまう。
アップロードは、基本的にgzip形式を使った方が良いようだ。圧縮して送るわけだから容量も減るし。内容はテキストだから、圧縮すればだいぶん縮むし。
さて、楽天のデータが更新できたので、その他の旅行会社のデータも更新。と思ったら、JTBのCSVのフォーマットが変わった。馬鹿なんじゃないだろうか。日本旅行は4月から更新してないし、改行コードがデータに入ってるし。
ちまたの宿検索サイトのデータがじゃらんや楽天ばかりなのはそういう理由があるわけで。まあ、旅行会社としてもできれば自社から直接予約して欲しいから、力の入れ具合は違ってくるわな。