新語収集にあたり

昨日UPした①のリンク先を200程調べながら、「無駄なんじゃないか」などと考えてる
今日この頃です。

やってる作業自体はどうしても無駄だと思うのだけども。実は。新語収集に関して言えば。
完全に個人的な思惑が絡んでるとしか思えなかったりする。
まあ、いいけど。

とは言え、その作業中にいろいろ思いつくので、
多少は役にたってるような気もちょっとはする。

てなわけで、そこら辺メモ。

【各ジャンルに絡む固有名詞を扱っているサイトをジャンルごとにわけ
収集してみるのはどうか?】

各ジャンルに絡む固有名詞(’商品名・題名など) を
「新語」として扱ってよいものかどうかは分からないけども、
「新語」として認知される可能性の高い語が含まれている場合は多いようにも思える。
その点から考えるにこの手のサイトを押さえて置く必要はあるような気もする。
ブログの記事タイトルとかもそれなりに狙い目かなあ。
更新記事を表示しているようなページとかもありかもなあ。

例 HPの更新率の高いCDショップ・同様の本屋・同様の食い物屋 など


【亀井さん とこの新語をいくつか並べて検索してみる】

↑をやってひっかかるようなサイトのアドレスを中心に収集。
おそらくブログが多く引っかかるような気はする。
というか、今回の仕事自体がブログ中心になりそうな気はするっすね。うん。


エキサイトのサーチストリームみたいなサイトを探す】

よく知らんが、エキサイトの他にもありそうな気はする。探して見た事はないけども。

こういうとこの語を常にウォッチ・収集するような仕組みを作っておけると良いのだろうがねえ。

こういうとこで収集した語と他から収集した「仮新語候補」との出現頻度を比較した後、
高頻度のものを新語候補に挙げて
その後、何か別の方法で篩にかけて「新語」を抽出するとか。どうっすかね。
もちろん全部機械作業。まあ、こっちでやる仕事ではないですけども。

こっちとしては「仮新語候補」収集にあたり、その候補サイトをピックアップするだけですが。
あとは向こうでピックアップしたURLから巡回収集するんだろうし。機械的に。

しかし、いまいちわからんっすねえ。どんなサイトが良さ気なのか。
[PR]
by zetumu | 2006-05-03 01:41 | 新語収集・・・するの?
<< 特定された個を取り扱ってるのは... 新語収集・・・するの? >>