ひげろぐ

技術者として仕事人としての思うところや覚え書きやらです
Home      Profile      Works     
2008-09-17

Mashup Award 4thに応募しました

小生北海道ボケが抜けてませんが皆様いかがお過ごしでしょうか。

さてMashup Award 4thの締め切りが昨日(9/16)でした。
なんか新しく作ろうかとも思ったんですがほどよいネタがなかったのですでにある物を。
アウトドア用品価格比較をそのまま出しました。

利用しているAPIは以下の通り。

メジャーなAPIばっか使ってるので賞を狙えるかどうかは微妙なところですがまあ出すだけ出すかと。

ちょっと機能とかその中身とかを簡単に説明してみたいと思います。

価格比較

スゲーわかりやすい機能。説明の余地なし。
それでも分からない人に贈る言葉はアウトドア用品版価格コム。

価格情報はYahoo!ショッピングのウェブサービスと楽天商品検索から取得。
あとそういうAPIにデータを乗せていないところは独自にスパイダ(ロボット・クローラー)を作って対応してます。

しかし昔気質のウェブサイトのスパイダリング/スクレイピングは地獄だぜフゥハハハーハァー。
変に今かぶれしたJavaScript使いまくりサイトとかもですけどね。AJAXとハサミは使いどころを選んでくださいよ?
ちなみに古のウェブサイトは古の技が一番よく効きます。正規表現とかすごいですよね。 お上品なパーサーに例外を食らわせるような無頼なページも一撃です。

ところで価格比較サイトなんて作るの簡単だぜ!と思っていたけれど実際取り組んでみると意外とやっかいなのが各ショップで売ってるアイテムを同一のアイテムと判別すること。
例えば次のように販売ページのタイトルとかがショップごとにまちまちなんです。

  • ショップA ふーばー ほげほげテント 湯たんぽふたつおまけ!
  • ショップB 【送料無料】ふーばーほげほげテント
  • ショップC HPとMPがたちまちマックスに! foobar ほげほげテント

各販売ページのタイトルや商品名のパターンでがんばって判別しようとしてますけど誤判別とかまだあります。
可能ならばメーカーの型番でマッチさせるのがいい感じですが、その型番をデータとして持ってるショップばかりでもないのが困ったものだったりします。

ブログから口コミ収集

ブログ検索から記事を収集したら口コミ情報として使えるのでは。
そんな風に思っていた時期が俺にもありました。

実際やってみて当初の思惑と比べると期待はずれ度80%くらいでした。
ノイズだらけ。
スパムを排除してもなお役に立つ記事は少ないと言う。

一応テキスト解析とかで重み付けをうまくできたりすれば使えるようになるかもしれないので捨ててはいません。
役に立つ情報もあることはありますし。
逆に考えるとこういうノイズを適切にフィルタしたブログ検索とかあると素敵かもしれないですね。
ブログ全体を対象にしたら無理っぽいですがニッチなテーマに絞ったブログ検索とかなら目はありそう。

会員機能

会員機能とかつけても閑古鳥が鳴くだけだぜ!ということは重々承知の上で独自コンテンツが欲しかったので作りました。
基本的に会員がうれしくなるような作りになってます。

  • ユーザーレビュー(自分の思いの丈をぶちまけられてうれしい)
  • 値下げ通知(お目当てのアイテムが寝下がったらすぐ分かってうれしい)
  • 所持品管理(自分の持っている物がなんなのかわかって二度買いとか防止できるのでうれしい)

ね、うれしいでしょう?
今後の盛り上がりに期待したいところです。俺たちの戦いはこれからだ!

今目指しているところ

最初は価格比較のみで行こうと思って始めたサイトですが、最近「アウトドア用品のデータベースっぽくできるんじゃないだろうか?」とか言う考えがふつふつと。
まあ趣味で好きな分野なので長く続けることも苦ではないということでコツコツやっていこうと思ってます。

2008-08-21

mixiのOpenIDを使えるようにしてみた

早速サービスに組み込んでみた。
単に認証に使うだけでマイミク認証とかコミュニティ認証とか特別なモノは使ってないけど。

仕様を見てもわかるがClaimed IdentifierにユーザーIDが含まれているのでRP側に誰が登録したか分かるようになっている。
同じ2.0対応でもこの辺りはそれが分からないようなClaimed IdentifierになっているYahoo!とは違う。

ガイドラインを見るに基本的にmixiのサービスと絡めて使って欲しいということみたいなのでこれはこれでいいんだろう。
OP側の方針次第と言うことで。

ただ一点気になる点はエンドユーザがエイリアスを設定するとClaimed Identifierが変わってしまう点。
これアウトじゃないの?いいのかな。
Claimed Identifier変わってしまったらRP側からそれを知るすべがないので別のユーザーとして扱うしかない、と思うんだけど何か方法あるのかしらん。
OP-Local Identifierに数字のIDが入ってきてるのかとか思って調べてみたけどそれもないようだったし。

ちなみにエイリアスも一回設定したら二度と変えられないようにはなってるみたいだけど、一度だけにしろエイリアス設定前と設定後で変わってしまう可能性がある。
エイリアスあっても別にいいけど最初にOpenID使うときに固定させるべきではなかろうか。

まあユーザー側から見てエイリアス設定する意味もよくわからんので設定する人は少ないと思うけど。プレミアムユーザーのみのオプションだし。
でもいったんエイリアス設定しちゃったらもう数字IDのClaimed Identifierにもどせないっぽいので、OpenID使う人が増えてきたら少ないなりになんか問題起きそうな気もする。

2008-05-23

アウトドア用品価格比較というサイトをオープンしました

アウトドア用品価格比較

昨年10月末の開発合宿でRailsを使って作ってたサービスをようやくリリースしました。
半年以上経ってから出すのがお約束になってます。すみません。

さて、内容はなんのヒネリもない直球なサイト名の通り、アウトドア用品の価格比較サイトです。
商品の価格比較とブログ検索などから集めた商品に関する記事を口コミ情報として載せています。

価格.comとか既存の価格比較サイトでもアウトドア用品の価格比較はあるのですが、比較対象の商品点数や商品に関する情報が充実しているものがなく不満を感じていたので作りました。
というわけでそんな不満を感じていたユーザーの観点から見てもけっこういいかんじのものができたんじゃないかなぁと思っています。かつまだまだやりたいことがたくさんあったりしてモチベーションは尽きません。

まさに「俺が欲しいから作りました」最強。

仮運用は一ヶ月ちょっとくらい前から行っていて、スパイダを回してデータを集めて、集まってきたデータを見ながらちょこちょこアプリケーションを調整したり、データの選別をしたりしてました。
正直まだ調整し切れてない部分もあるのですが、まあそこそこ形になったということでこのたび正式運用を開始の運びと相成りました。

まだまだこれからのサイトですがどうぞごひいきに。

中身の話とか開発に関する話とか折を見てまた書きます。

関連

追記

合宿にいっしょに行ったF.Ko-ji氏にレビューしてもらいました!

Ruby on Railsで作られたアウトドア用品の価格比較サイト – F.Ko-Jiの「一秒後は未来」

copyright brass.to | powered by WordPress ME