2008年4月16日水曜日

Googleの文字解析の問題みたいだ・・・

この「電脳網潜水」は、「電脳」で検索ができないし、その関係キーワードに「電脳網」や「電脳網潜水」は出て来ない。「電脳盤」も出てこない。

Google Web検索で出てくる「電脳」関連キーワードはこれだけだ。
関連検索: 電脳コイル, 高速電脳, 電脳売王, アキハバラ電脳組, 電脳空間, 電脳あいたん, 電脳工場, 電脳書房, 電脳会議, 電脳超合金タチコマ

ということは、「電脳網潜水」を「電脳」+「」+「潜水」という単語にGoogle内部のデータベースは分割できていないことになる。
電脳網」や「電脳網潜水」ではちゃんと検索できている。

つまり、Googleの苦手な処理を発見したということかな。

まあ、でも「電脳」=「コンピュータ」や「網」=「ネットワークコンピュータネットワーク」は中国語で、「潜水」は日本語だから仕方の無いことかもしれない。

それでは対策はどうするのかというと、流行語辞書を検索エンジンが持っているだろうから、流行った言葉を自動的に収集して辞書登録すれば良いかと思う。これは言語処理なのできっと大変だろうな。

日本でFEP開発していた人は沢山いたけど、今は何をしているのだろうか・・・
Googleはそういう人をヘッドハンティングしないのだろうか?

PS.自分はFEPの経験はありません。XIMPのデバッグぐらいしかやってませんので、言語解析はできません。それに日本語も英語も中国語も全部下手だから・・・

0 件のコメント: