2010年11月25日木曜日

日記:自然言語処理のはずだが実は統計処理、と思っていたらGUIまでやらされている

 上司があるプログラムをクライアントにレビューしている。

 プログラムは、テキスト検索にちょっとした統計処理を加味することでテキストマイニングっぽい機能を追加したもの。自然言語処理といえなくもない。

 処理自体は単純だが、統計処理で時間がかかるので、データの持ち方と、計算のさせ方に工夫がある。といっても、文字列検索をTRIEにして、共起関係をHarwell-Boeing形式にしただけで、大したことはやっていない。
 でも、このあたりを、通常のアプリケーションプログラマーに任せると、そのまんま配列に格納して、とてもじゃないが、実時間に結果が帰ってこないので、こちらにおはちが回ってきた。

 そして、なぜかGUIまでも書くことになった。はい、データ構造とのすりあわせが必要という意図ですね。自分の専門外でも業務命令ならやるけど、実際うんざりしている。
 こういう些末の作業はは他のやつにやらせて、自然言語処理とかデータ構造周りを自分に集中的にやらせた方が効率がよいのに。とか考えているけど、上司には内緒である。

 そうこうしてできたプログラムを何度かレビューして、そのたびに手直し。先方も自然言語処理のことはわからないから、焦点はそこではなく、使い勝手=GUIになってしまい、その修正指示がくる。文句を腹にしまい込んで、対応するが。

 レビューを何回か繰り返しているが、修正は結局GUIがメインで、アルゴリズム的な部分は表示条件の設定調整程度。
 でも、今回は、速度優先というリクエストだったので、精度的にはそんなによくないけど、それでいいのか?
 まだ、デモ段階らしいからいいんだけど、現実に適用しようとすると、データ量とか、いろいろな問題が出てきて、計算アルゴリズムとかも変えないといけないんだけど、今言っても「まず動くものを見せるのが先決」ということで、聞く耳を持ってくれないので、後々やることになるだろう作業を考えて戦々恐々としている。

 まあ、仕事とは、往々にしてこんなもんである。こちらの思惑とは違うところで進んでいく。