自然言語処理 悪魔の辞典
最終更新日: 2001-10-06 (公開日: 2000-09-21)
- 言い換え (paraphrase)
- 都合の悪いことを別の表現でごまかすこと。物は言い様。 例: 「わがまま→自分の意思をしっかり持っている人」 「不潔→ワイルド系」「くだらない研究→興味深い研究」 「役に立たない研究→基礎研究」
- 意味論 (semantics)
- 意味論の意味は意味論の意味論によって定義される。
- SVM (support vector machine)
- ポスト決定木の最右翼。決定木を参照のこと。
- エラー率 (error rate)
- 精度の向上が芳しくないときに用いる。精度が 0.01 % 上がりま した、と言わずに、エラー率が 5%下がりました、と言うとよい。
- 機械学習 (machine learning)
- 自己の学習をあきらめた人間の最後のよりどころ。
- 形態素解析 (morphological analysis)
- 文を形態素に分割すること。形態素が何であるかは永遠の謎。
- 決定木 (decision tree)
- 一時期は猫も杓子も愛用していたもの。その中身は誰も理解して いない。古きよき時代には「それは決定木で学習すればいいよ」 と言っておけば専門家のふりができた。
- 研究者 (researcher)
- 論文を生産する人のこと。
- コーパス (corpus)
- 文の集まり。自然言語処理では神聖なもの。コーパスが足りない、 と不平をこぼす者にはコーパスの作成という苦業が待っている。 用例: 「この手法がうまくいかない理由の 1つとして、学習に利 用したコーパスの質の低さが挙げられる」
- コミッティーベース (committee base)
- 駄目な奴は何人集まっても駄目という真理を証明しようとする試 み。
- 今後の課題 (future work)
- やりたくないこと。または、絶対にできないこと。
- 参考文献 (reference):
- 参考にした方がいいと言われている文献。実際に論文の著者に読 まれることはまれ。何も読んでいないと思われないようにたくさ ん挙げておくとよい。
- 実験 (experiment)
- 自然言語処理の醍醐味。あるいは、人生の不毛さについて考えさ せてくれるもの。
- 辞典 (the dictionary)
- あなたが今読んでいるもの。
- 自然言語処理 (natural language processing)
- 言語を表層のみから理解しようとする無謀な試み。その研究者は 日夜、不毛な試行錯誤に励んでいる。
- 謝辞 (acknowledgement)
- 義理以外のなにものでもないもの。まだ実験すら始まっていなく ても書ける部分。
- 情報検索 (information retrieval)
- 誰も知りたくない情報を手間暇かけて探すこと。検索が目的であっ て情報はその手段にすぎない。
- スパースネス (sparseness)
- 少ししかないこと。研究者の脳そのもの。
- 精度 (precision)
- 自然言語処理の研究に不可欠なもの。数値をごまかすことは倫 理に反するが、都合のいいように解釈を曲げるぶんには問題な い。精度が高くてもたいていのものは役に立たない。
こ とわざ: 精度を上げる最もいい方法は、悪い精度から始めるこ とである
- 対話 (dialogue)
- 自分の言いたいことを言って、相手の言うことを聞かないこと。
- 統計的自然言語処理 (statistical natural language processing)
- 「統計的自然言語処理とはカレーライスのようなものだ。誰にで もそこそこうまく作れる」とはよくいったものだが、実態はカレー ヌードルに近い。ただし、3分の代わりに 3か月の退屈な実験を 要する。
- ブースティング (boosting)
- 多くは精度の悪さをブースティングするもの。実験がうまくいか なかったときの怒りをブースティングする効果を持つ。
- 文法 (grammer)
- 文法学者 1人につき 1つ存在する体系のこと。
- 要約 (summarization)
- 自然言語処理の応用技術。 長い文章から意味のある部分だけを取り出して短い文章を作る。 ほとんどの文章は要約すると「、、、。」になる。
- 論文 (paper)
- 簡単なことを難しく説明したもの。または、難しいことを簡単に 説明したもの。後者の場合、肝心なことは何 1つ書かれていない。 読まれる論文の数より書かれる論文の数の方が多い。
Satoru Takabayashi