構文木の表示

ウェブブラウザ上に表示された統語構造タグ(構文木)の閲覧方法について説明します。

構文木の表示例を示します。以下の図は、キーワードの種類を「文字列」、キーワードを「下の位」として岩波GDAコーパスを検索したとき、ヒットした文に付与されている構文木をウェブブラウザで表示したときのスナップショットです。

syntactic tree
(クリックで原寸大の画像を表示します)

GDAコーパスでは、統語構造はタグの入れ子で表現されていますが、本ツールではこれを木構造で表示します。ノードのラベル(su, np, vp, adp など)はコーパスに付与されているGDAのタグ名です。

赤い文字は検索キーワードを表わします。上図の場合、「下の位」が赤く表示されています。

[等位構造の表示]

GDAの仕様では、syn="c" という属性は等位構造を表わし、そのタグの下位の要素間に並列関係があることを示します。本ツールでは、syn="c" という属性を持つタグを緑色で表示します。例を以下に挙げます。
syntactic tree
(クリックで原寸大の画像を表示します)

図中の np はGDAコーパス上では
  <np syn="c"><np>黒い筋</np>、<np>黒いまだら</np><np>
となっており、「黒い筋」と「黒いまだら」の間に並列関係があることを表わしています。同様に、図中の v はGDAコーパス上では
  <v syn="c"><adp>緑ががった黄色で</adp>、<vp>黒い筋、黒いまだらがある</vp><v>
となっており、「緑がかった黄色で」と「黒い筋、黒いまだらがある」の間に並列関係があることを表わしています。

[同格の表示]

GDAの仕様では、syn="a" という属性はそのタグの下位の要素間に同格の関係があることを示しています。本ツールでは、syn="a" という属性を持つタグを青色で表示します。例を以下に挙げます。
syntactic tree
(クリックで原寸大の画像を表示します)

図中の np はGDAコーパス上では
  <np syn="a"><n>なます</n>(=<n>酢にひたした食品</n>)<np>
となっており、「なます」と「酢にひたした食品」の間に同格の関係があることを表わしています。

[前向き依存関係の表示]

GDAの仕様では、syn="f" という属性は「前向き依存関係の連鎖」を表わします。このとき、そのタグの下位の要素は、係ることのできる前方の兄弟要素のうち最も近いものに係るとみなされます。これは係り受け関係の省略記法の一種ですが、本ツールではラベルのない仮想的なノードを追加して係り受け関係をわかりやすく図示します。例を以下に挙げます。
syntactic tree
(クリックで原寸大の画像を表示します)

図中の丸で囲まれた np というタグは、GDAコーパス上では以下のようにタグ付けされています。
<np syn="f">
  <adp>一つの面を境にして</adp>
  、
  <adp>両側の部分が</adp>
  <adp>互いに</adp>
  <adp>その面に垂直に</adp>
  <v>押し合う</v>
  <n>力</n>
</np>
この np タグは子として7つの要素を持ちますが、フラットな構造になっていて、係り受け関係は明示されていません。しかし、syn="f" という属性が直近のものに係ることを表わすこと、<〜p> は最大投射を表わし他の要素は係らないことから、これらの要素には
  一つの面を境にして  ⇒  、
  、  ⇒  押し合う
  両側の部分が  ⇒  押し合う
  互いに  ⇒  押し合う
  その面に垂直に  ⇒  押し合う
  押し合う  ⇒  力
というような係り受け関係があります。構文木の表示画面ではラベルのないノードが自動的に挿入され、上記の係り受け関係を図示しています。

[倒置の表示]

syn="f"という属性が倒置を表わすことがあります。
  <adp syn="f"><n>何</n><v>だ</v><adp>それは</adp></adp>
この例では2番目の要素「だ」の係り先がないため、最後の要素「それは」が2番目の要素「だ」に逆向きに係ることを表わします。本ツールでは、逆向きの係り受け関係があるとき、syn="f"を持つノードを adp のようにオレンジ色で表示します。

検索ビューのトップに戻る
目次に戻る