さて、楽天トラベルのデータをデータベースに保存したとして、次は他の会社のデータと整合を取ってIDなり何なりをつけなければ使えない。
データを提供している旅行会社には、日本旅行,JTB,るるぶトラベルなんかがあるのだけれど、提供された情報は会社によって違う。たとえば同じ宿と認識するのに、宿の名前は使えない。どうやって同じと認識するか?
使えるのは、一般的な情報で宿固有の情報。住所、電話番号、座標あたりだろう。その辺を使ってデータを処理するコードを書く。
コードはPHPで。サーバでそんなことやったら負荷が上がったり不安定になりそうなので、PCで。ローカル環境でPHPの動く環境を構築してあればずいぶんらくだ。
コードで、いつもはデータの個数をカウント後にfor~next文でまわす方式を取るのだけれど、今回はforeach文を使ってみた。速度やメモリの面で有利らしいのだけれど、どうなんだろう。
コメント