どこのサイトだったかマジ忘れたんだけど、カテゴリを細かくしていくとタグに、タグを粗くするとカテゴリになる、みたいなニュアンスの文章を見た記憶がある。
正直言ってカテゴリは難しい。複合的なものをどう扱うかとか悩む。タグはタグで、たくさんつけてこそ意味があると私は思っている。ニコニコ動画の唯一タグ(同じタグを探してもまったく見つからない)のは問題があるけど、あのくらいつけまくられて意味があると思うんだ。
で、ですよ。
自分の日記のタグとかカテゴリとかがめんどい。ぶっちゃけ、なくても検索すればいいじゃん?とか思ったんだけど、良く考えるとそれはそれで問題。一応公開日記なので人に見てもらいたいという意識もあるわけで、どんな内容が書かれているんだろうってのを知らせるのは意味がある。
そこで考えたのが形態素解析。日記の内容をざーっと解析して、良く触れられているワードを出してくれれば、タグもカテゴリも要らないんじゃね?みたいな。
そんなわけで、作ってみた。暫定版なんで最近10件の日記を舐めて解析して、上位20名詞をタグクラウド化しただけ。メカブたんの調教具合がunkなので全然駄目だし、毎回チェックとか無駄に重いので要調整だけど、うまくやればまぁまぁ便利になるんじゃないかしら?
webの世界の流れは異常に早いので、既にもっと凄いことがやられているんじゃないかという気がしないでもない。やれやれだぜ。誰か知ってたら教えて。
6月 19th, 2007 at 8:26:19
http://www015.upp.so-net.ne.jp/ina/piece-programming.html#べつやくメソッド
そういえば前にこんなの作ってました。
形態素解析なんて不真面目で良いということを知ったw
6月 19th, 2007 at 10:05:04
Blog360でも、なんか似た様なことしてるっぽいです。
http://blog360.jp/
でも、名詞単位で区切ってる感はないので、
もしかしたら解析まではしてないかもしれません。
てか、形態素解析の結果をタグ化するのって面白そうですね。
ぜひ導入してみたいです……が、
一言二言で終わることのあるオレのブログでは、
あまり効果はなさそうですorz
6月 20th, 2007 at 1:39:04
>ina
形態素解析は裁量次第なんだぜ?
正直、形態素解析は昔課題でやっただけなのでアレです。もう少しがんばろう。
>うたげやん
360はざっとみたけどよくわからんのう。
ただたんに件数が多いものを使っているんじゃなかろうか。
でも、googleとかって形態素解析しているよね。文章入れると綺麗に切られて検索されている気がするので。
もう少し何とかしたいけど暇を作れるかなー?