GSK2009-B 新聞記事GDAコーパス2004

Description: 本データは新聞記事テキスト(3,000記事、約37,000文、約910,000語)に対して形態素・統語構造・語義・照応と共参照の情報を付与したコーパスである。これらの付加情報は全て人手修正されている。また、コーパスの記述形式はGDA(Global Document Annotation)に準拠する。 本データは付加情報のみを提供し、テキスト自体は含まれていない。テキストを含む完全なコーパスを復元するには「CD-毎日新聞’94データ集」を別途購入する必要がある。 語義の情報として岩波国語辞典第五版における語義の識別番号が付与されている。識別番号に対応する語義の定義文を得るには「岩波国語辞典第五版タグ付きコーパス2004」を入手する必要がある。
なお、本データを閲覧・検索するためのGUIツール『GDAコーパスブラウザ』がGSKから無償配布されている。
Creator: 三菱電機株式会社
Price: 商用利用不可。教育・研究目的限定。
個人・会員21,600円、個人・非会員43,200円、団体・会員43,200円、団体・非会員86,400円。別途、送料3,240円。
Date:2012.2
Format:1 CD-ROM (60.7MB)
Format.encoding:Shift-JIS
Language:Japanese
利用事例:言語情報処理ポータルのページに移動します

上記言語資源の入手に当たっては、「利用申請書兼誓約書(新聞記事GDAコーパス2004)」 に必要事項をご記入いただき、メール、FAX、郵便等にて、事務局までお送り下さい。 折り返し、ご請求書をお送りしますので、宛名等ご指定のある場合は申請時にお知らせください。また、利用申請書兼誓約書の記入にあたっては「会員種別と利用種別の個人・団体について」をご確認下さい。