BlogもどきのWeblog

備忘録と日々の呟きとメモとCGIの実験場とされる何か。
プロフィール

GLANSHE
絵描き担当らしい

Total: 31195
Today: 69
Yesterday: 99
最新の記事

コンテンツ

最新のコメント

最新のトラックバック

カテゴリー

リンク

ニコ動MyListLink

10/8ゼミ
10/10まで日がありません。4年生は頑張ってください。
自分は…何しようかorz

最初はw君。
WebFarmingにおけるユーザ個別化に関する研究。らしい。
けどpptの内容と実際に言っている事は結構違う内容。
多分一番の問題はsさんのpptをほとんど流用している事。
自分の言おうとしている事に関して同じ内容があれば流用しても構わないだろうけど、流用しすぎて自分の言おうとしている事が潰れるのは問題。

聞いた限りでは、sさんの研究をベースに、マイニングを主とした研究をやりたいそうだけど、卒業研究としてやるのはユーザ個別化までのようだ。
ぶっちゃけsさんはユーザ個別化についてかなりよいところまで実装していたと思うので、これを卒業研究にするなら少なくとも別の方法、もしくは別段階においての違う手法を用いる必要があると思う。
そうでないと、何の実りも無い研究になってしまう。

それとWeb Farmingについて理解が足りないのは多分間違いが無いと思う。
Web Farmingとは簡単に言うとまず欲しいデータが存在し、そのデータを収集する為のWebページを作成し、その収集したデータをマイニングする。
そのマイニング結果を再利用して、より質の高いデータの収集をする為にWebページの改善をする。
と言うような、マイニングの為のデータを育てる事が重点に置かれている。

後は、ユーザの背景知識を利用して個別化をするらしいけど、その背景知識は何処から入手するのか。また、特異性指向マイニングを使うと書いていたけど、本当にそのマイニング手法が向いているのか、別の方法は使わないのか等、"自分の研究"にする為に必要な点が多々欠けている。

10日まで日がありませんが、少なくとも自分がやりたい事くらいはちゃんと言えるように修正して欲しい。


次はk君。
検索エンジンを用いたコンテンツマイニングに関する研究。らしい。
キーワードを検索エンジンにかけて出てきた検索結果をタグ除去してテキスト形式に変換。
その後目的のキーワード近辺の文章を茶筅(形態素解析するプログラム)にかけ、そこから名詞を抽出。
その名詞を出現頻度や背景知識(近接後やオントロジー等)を用いて重み付けをして、リストにし、それを更に検索エンジンにかけて同じ事をする。
その結果をデータベースに格納(このDBは何に使うか未定らしい)する。
しかも実際にやりたい事は文章の復元?らしい。

最終的にどのようにするのかは未定であり、やった事の経過発表のような内容になっている。
そろそろ方針を定めないと最後で動けなくなる可能性があるので少しは意識して欲しい。
最後の格納したDBを何に使うのかを仮定でも良いので決めないと中間発表で質問された時答えられないので注意。


明日は発表練習をするそうだけど、5分と言うのは案外短く、一枚に割ける時間を気にしながら作ってみるとよいかも。
それと一度言う事をテキストに落としてみて、実際に時間を計りながら喋ってみてもよいと思う。
でも発表時は余計な動作とかも入るのでテキストが5分ぴったりになっても伸びるので注意。


まぁ、なるようになるし、失敗しても大事にはならない。あまり気負いすぎなくても大丈夫じゃないかな。


time stamp:2007/10/08 17:45:42
トラックバック(0)|コメント(0)
この記事のトラックバックURL:

コメントを書く
名前:
タイトル:
MAIL:
URL:
コメント:
PASS:
何かしら