AI用語集
人工知能の完全辞典
ステミング
アルゴリズム的ヒューリスティック手法で、単語から接尾辞を除去して語幹を取得します。必ずしも辞書に存在する有効な単語を生成するわけではありません。レンマ化より高速ですが、精度は低い手法です。
形態素
意味を持つ言語の最小単位で、これ以上分解すると意味が失われます。形態素は自由形態素(自立語)または拘束形態素(接辞)になります。
接辞
語幹や根に付着して新しい単語を形成したり、文法的機能を変更したりする拘束形態素。接辞には接頭辞、接尾辞、接中辞、周接辞が含まれます。
屈折
単語の形態を変更して時制、数、性、格などの文法的カテゴリーを表現する形態論的プロセス。屈折は単語の基本カテゴリーを変更しません。
派生
既存の語幹に接辞を追加して新しい単語を形成するプロセスで、多くの場合、文法的カテゴリーや意味を変更します。派生は言語の語彙を豊かにします。
形態論解析
単語を形態論的構成要素に分解し、文法的特性を特定する計算プロセス。機械翻訳など多くのNLPアプリケーションで不可欠です。
語幹
派生語や屈折語の一部で、接辞が付着する部分。多くの場合、根やレンマに相当します。語幹は単語の主要な語彙的意味を担う要素です。
屈折パラダイム
関連する文法的カテゴリーに応じて単語が取りうるすべての屈折形の完全なセット。パラダイムは形態論的変動の体系的構造を表します。
アロモルフ
形態素が使用される文脈に応じて変化する音声的または表記的な変異。アロモルフは自然言語における形態論的規則の複雑さを示す。
生産的形態論
言語において現在も活動している形態論的プロセスの集合であり、新しい形を作り出すことを可能にする。歴史的に固定された規則を扱う非生産的形態論と対照をなす。
連結形態論
形態素が単純な線的連結によって互いに追加されるタイプの形態論。フランス語や英語などのインド・ヨーロッパ語族の言語で支配的。
非連結形態論
単語の形成が接辞の追加ではなく、内部の修正を伴う形態論的システム。アラビア語などセム語族の言語に見られる語根パターンが特徴。
形態論的トークン化
テキストを完全な単語ではなく、意味のある形態論的単位に分割するプロセス。トルコ語やフィンランド語など形態論的構造が複雑な言語にとって不可欠。
挿入辞
語頭や語末ではなく、語根の内部に挿入される接辞。稀な現象だが、タガログ語や英語の一部スラング形式などに存在する。
周接辞
語幹の周りに接頭辞と接尾辞の両方として挿入される不連続な接辞。ドイツ語(ge-t)やオランダ語で一部の過去分詞を形成するために見られる。
クリティック
統語論的には単語のように振る舞うが、音韻論的には隣接する単語に付加された接辞のように振る舞う形態論的要素。クリティックは単語と接辞の中間的な位置を占める。
形態統語論
形態論と統語論の間のインターフェースで、単語の形態論的性質が統語的挙動にどう影響するかを研究する。形態と文法機能の関係を理解する上で重要。
形態素セグメンテーション
単語を構成形態素に自動的に分解するNLPタスク。膠着語の分析と未知語認識において重要。
形態素タギング
品詞、時制、法、数などの詳細な形態論情報でトークンを自動的に注釈付けするプロセス。従来の単純なPOSタギングより詳細。