BlogもどきのWeblog

備忘録と日々の呟きとメモとCGIの実験場とされる何か。
プロフィール

GLANSHE
絵描き担当らしい

Total: 31367
Today: 22
Yesterday: 219
最新の記事

コンテンツ

最新のコメント

最新のトラックバック

カテゴリー

リンク

ニコ動MyListLink

12/3ゼミ(2)
昨日の続き。

次の発表はw君。
Webファーミングにおけるユーザ個別化に関する研究。らしい。

Webサーバより取得したWebログをユーザ認証、Cookie、セッション識別等によりユーザを個別化する。

ユーザ認証はユーザIDとパスワードによるWebページのログイン、Cookieにはユーザ識別用のIDを書き込み、セッション識別ではサイト内での行動をURLに情報を埋め込む事でそのサイトから出るまでのユーザの行動を把握する。
トランザクション識別では、それらの方法から個別化したユーザの行動を追跡し、ページの閲覧時間等から意味のある行動を割り出し、それらの情報を元にしてマイニングを行う。
マイニングアルゴリズムはAprioriを用いる。

マイニング結果をルールとして、よりよいデータソースを取得する為にWebサイトを再構築する。

まず、やろうとしている事が過去に研究室でやった事とほぼ同じ。
s.s先輩とs.t先輩の論文は参考文献に入っていたので読んだのだと思うけど、その前段階のh.o先輩の論文が、今回のpptでやろうとしている事に相当する研究なので、その論文も読むこと。
トランザクション識別に関しては、その論文に書いてあるはず。

卒業研究ではWebログからユーザの個別化をするという事なので、確か研究室に国際会議のWebログが存在するはずなので、そのWebログ等を見ること。

w君のやろうとしている研究は、h.o先輩がWebログマイニングについて研究し、s.t先輩がそれを受け継ぎ、そのマイニングの為に必要なデータを効率よく取得する方法についての研究を行い、更にs.s先輩がそれまで不完全であったユーザ個別化についての研究を行った、という一連の研究の継続研究なのです。
S先生としては、ここまでの一連の研究の中で「個別化されたデータ」と言うものをマイニングする。と言う事をやって欲しいらしい。

その辺を研究室の先輩と相談すると研究の方向性が見えてくるかもしれない。


次の発表はk君。
検索エンジンを用いたWebコンテンツマイニングに関する研究。らしい。

Google等の検索エンジンから、とあるキーワードに関する情報を機械が収集し、その収集した情報の中から人間が必要としている情報を機械が判断し、提示する?らしい。

キーワードを入力すると、検索エンジンから検索結果を拾ってきて、それらをいくつか選び出す。選び出す方法はpptからでは不明。背景知識を利用?
次にその選び出したページのタグを除去し、テキストのみのデータにする。それを和布蕪を用いて形態素解析をする。
解析結果を頻度分析してマイニングにかける?何がしたいのかよくわからない。

マイニング方法にもいくつか方法があるけれど何を使うのか、どのような知識を発見したいのかを言う必要性がありそう。
先輩の受け売りだけど、
「全体像がこうありまして、自分はこうやりますよ。
全体的にこういう完成を目指すんだけど、
自分としてはこの部分をやりますよ。」
と言うところをもう一回考え直してみるとまとまるかもしれない。

発表でS先生が少々キレてたけど、あまり深く悩まなくても大丈夫。これからよくすればいいんだ。
あと発表の時にちょっとくらいどもったり詰まったりしても誰も気にしてないから気にしないで自分の言いたい事をちゃんと言うのがいいと思う。なんなら事前に発表用のテキストでも作ってみると楽かも。

ゼミでも言われていた事だけど、どうも「やりたい事」とpptの間にズレがあるのが現時点で最大の問題らしい。pptを見ても研究の全体像がちょっと見えて来ないので、きちんと「やりたい事」を表せるようにすること。


発表人数が多くて大変だった…。


time stamp:2007/12/04 22:32:16
トラックバック(0)|コメント(0)
コメントを書く
この記事のトラックバックURL:
何かしら