GSK2010-A 岩波国語辞典第五版タグ付きコーパス2004

2021年3月31日をもって配布を終了いたしました。
Description: 本データは岩波国語辞典第五版における約5万6千項目のデータに、形態素・統語構造・照応と共参照、岩波国語辞典自身に基づく語義の情報などを付与したコーパスである。これらの付加情報は全て人手修正されている。また、コーパスの記述形式はGDA(Global Document Annotation)に準拠する。コーパスに含まれる文の総数は約198,000、形態素の総数は約1,120,000である。
なお、本データを閲覧・検索するためのGUIツール『GDAコーパスブラウザ』がGSKから無償配布されている。
Creator: 株式会社岩波書店
三菱電機株式会社
Price: 商用利用不可。教育・研究目的限定。
個人・会員22,000円、個人・非会員44,000円、団体・会員44,000円、団体・非会員88,000円。別途、送料3,300円。
Date:2010.5
Format:1 CD-ROM (255MB)
Format.encoding:Shift-JIS
Language:Japanese
Relation: 『分類語彙表』の見出し語と、本言語資源『岩波国語辞典第五版タグ付きコーパス2004』に含まれる国語辞典見出し語との対応表が作成され、公開されている。
https://github.com/masayu-a/WLSP2iwanami
https://www.ninjal.ac.jp/research/project-3/institute/all-words-wsd/
利用事例:言語情報処理ポータルのページに移動します