自然言語処理 悪魔の辞典

最終更新日: 2001-10-06 (公開日: 2000-09-21)


言い換え (paraphrase)
都合の悪いことを別の表現でごまかすこと。物は言い様。 例: 「わがまま→自分の意思をしっかり持っている人」 「不潔→ワイルド系」「くだらない研究→興味深い研究」 「役に立たない研究→基礎研究」
意味論 (semantics)
意味論の意味は意味論の意味論によって定義される。
SVM (support vector machine)
ポスト決定木の最右翼。決定木を参照のこと。
エラー率 (error rate)
精度の向上が芳しくないときに用いる。精度が 0.01 % 上がりま した、と言わずに、エラー率が 5%下がりました、と言うとよい。
機械学習 (machine learning)
自己の学習をあきらめた人間の最後のよりどころ。
形態素解析 (morphological analysis)
文を形態素に分割すること。形態素が何であるかは永遠の謎。
決定木 (decision tree)
一時期は猫も杓子も愛用していたもの。その中身は誰も理解して いない。古きよき時代には「それは決定木で学習すればいいよ」 と言っておけば専門家のふりができた。
研究者 (researcher)
論文を生産する人のこと。
コーパス (corpus)
文の集まり。自然言語処理では神聖なもの。コーパスが足りない、 と不平をこぼす者にはコーパスの作成という苦業が待っている。 用例: 「この手法がうまくいかない理由の 1つとして、学習に利 用したコーパスの質の低さが挙げられる」
コミッティーベース (committee base)
駄目な奴は何人集まっても駄目という真理を証明しようとする試 み。
今後の課題 (future work)
やりたくないこと。または、絶対にできないこと。
参考文献 (reference):
参考にした方がいいと言われている文献。実際に論文の著者に読 まれることはまれ。何も読んでいないと思われないようにたくさ ん挙げておくとよい。
実験 (experiment)
自然言語処理の醍醐味。あるいは、人生の不毛さについて考えさ せてくれるもの。
辞典 (the dictionary)
あなたが今読んでいるもの。
自然言語処理 (natural language processing)
言語を表層のみから理解しようとする無謀な試み。その研究者は 日夜、不毛な試行錯誤に励んでいる。
謝辞 (acknowledgement)
義理以外のなにものでもないもの。まだ実験すら始まっていなく ても書ける部分。
情報検索 (information retrieval)
誰も知りたくない情報を手間暇かけて探すこと。検索が目的であっ て情報はその手段にすぎない。
スパースネス (sparseness)
少ししかないこと。研究者の脳そのもの。
精度 (precision)
自然言語処理の研究に不可欠なもの。数値をごまかすことは倫 理に反するが、都合のいいように解釈を曲げるぶんには問題な い。精度が高くてもたいていのものは役に立たない。
こ とわざ: 精度を上げる最もいい方法は、悪い精度から始めるこ とである
対話 (dialogue)
自分の言いたいことを言って、相手の言うことを聞かないこと。
統計的自然言語処理 (statistical natural language processing)
「統計的自然言語処理とはカレーライスのようなものだ。誰にで もそこそこうまく作れる」とはよくいったものだが、実態はカレー ヌードルに近い。ただし、3分の代わりに 3か月の退屈な実験を 要する。
ブースティング (boosting)
多くは精度の悪さをブースティングするもの。実験がうまくいか なかったときの怒りをブースティングする効果を持つ。
文法 (grammer)
文法学者 1人につき 1つ存在する体系のこと。
要約 (summarization)
自然言語処理の応用技術。 長い文章から意味のある部分だけを取り出して短い文章を作る。 ほとんどの文章は要約すると「、、、。」になる。
論文 (paper)
簡単なことを難しく説明したもの。または、難しいことを簡単に 説明したもの。後者の場合、肝心なことは何 1つ書かれていない。 読まれる論文の数より書かれる論文の数の方が多い。

Satoru Takabayashi