GSK2014-A 拡張固有表現タグ付きコーパス

Description: 「拡張固有表現タグ付きコーパス」は、 国立国語研究所『現代日本語書き言葉均衡コーパス』(BCCWJ)のコアデータ(約2,000文書)および、「CD-毎日新聞’95データ集」の新聞記事(約8,000記事)に対し、 関根の拡張固有表現階層 -7.1.0- を人手付与したコーパスである。BCCWJでは、異なり約43,000(のべ約100,000)個、新聞記事では異なり約60,000(のべ約240,000)個の固有表現にタグ付けした。
本データは付加情報のみを提供し、テキスト自体は含まれていない。本データを利用するためには、それぞれ、 『現代日本語書き言葉均衡コーパス DVD版 Ver.1』(BCCWJ)「CD-毎日新聞’95データ集」を別途入手する必要がある。(テキストを含む完全なコーパスを復元するプログラムが付属するが、新聞記事については、Windowsには対応していない)
なお、本言語資源は、科研費特定領域研究「代表性を有する大規模日本語書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」(領域代表:前川喜久雄)の助成を受けたものである。
Creator:東京工業大学
Price:

GSK会員限定無料配布言語資源
会員は、年度中、会員限定無料配布言語資源の利用が一件目の場合に限り無料。年度中、会員限定無料配布言語資源の利用が二件目以上にあたる会員は、5,400円(税込み、送料別)。非会員は32,400円(税・送料込み)。

Date:2015.3
Format:1 CD-R
Format.encoding:
Language:Japanese

上記言語資源の入手に当たっては、利用申請書兼誓約書(拡張固有表現タグ付きコーパス) に必要事項をご記入いただき、メール、FAX、郵便等にて、事務局までお送り下さい。 有料の場合、折り返し、ご請求書をお送りしますので、宛名等ご指定のある場合は申請時にお知らせください。また、利用申請書兼誓約書の記入にあたっては「会員種別と利用種別の個人・団体について」をご確認下さい。

なお、公開が年度末となったため、2015年4月30日までの利用申請は、2014年度会員無料分として扱います。 ご不明な点は事務局にお問い合わせください。