GSK2020-B 自然会話コーパス話題アノテーション情報

Description: 本データは『名大会話コーパス』の文字化ファイルの全ての行に対し、約100種類の話題アノテーション情報を与えるファイルである。
話題の情報の詳細は説明文書を参照のこと。
ファイルを解凍すると、『名大会話コーパス』の129の文字転記ファイルに対応する129のCSVファイルが現れる。それぞれのCSVファイルには行番号と、話題タグのみが含まれている。利用するためには、別途『名大会話コーパス』のファイル本体が必要となる。
『名大会話コーパス』の管理は現在は国立国語研究所に移管されており、本体ファイルは以下のURLで公開されている。そちらの利用条件なども読んだ上で利用されたい。
https://mmsrv.ninjal.ac.jp/nucc/

本言語資源は JSPS 科研費基盤研究(B) 「話題が語彙・文法・談話ストラテジーに与える影響 の解明」(課題番号 18H00676 研究代表者 中俣尚己)の成果物である。
Creator:J-TOCC科研研究者グル―プ(代表者:京都教育大学 中俣尚己)
Price:

教育・研究・開発(非営利)目的利用限定。
GSK会員限定無料配布言語資源
会員は、年度中、会員限定無料配布言語資源の利用が一件目の場合に限り無料。
年度中、会員限定無料配布言語資源の利用が二件目以上にあたる会員は、5,500円(税込み、送料別)。
非会員は33,000円(税・送料込み)。

Date:2020.7
Format:zipファイル (圧縮時 754KB 展開時 2.3MB)
Language:Japanese

上記言語資源の入手に当たっては、利用申請書兼誓約書(自然会話コーパス話題アノテーション情報) に必要事項をご記入いただき、メール、FAX、郵便等にて、事務局までお送り下さい。 有料の場合、折り返し、ご請求書をお送りしますので、宛名等ご指定のある場合は申請時にお知らせください。また、利用申請書兼誓約書の記入にあたっては「会員種別と利用種別の個人・団体について」をご確認下さい。本言語資源は基本的にメール添付でお送りします。