GSK2017-B JAISTタグ付き自由対話コーパス

Description:

人間同士の雑談における発話に対し、対話行為ならびに共感をタグ付けしたデータ。対話行為とは、話者の意図による発話の分類である。本コーパスでは「自己開示」「質問(YesNo)」「質問(What)」「応答(YesNo)」「応答(平叙)」「あいづち」「フィラー」「確認」「要求」の9種類の対話行為が付与されている。一方、共感は、ここでは相手に対する発話者の共感・非共感の有無による発話の分類を表す。本コーパスでは「共感」「非共感」「その他」の3種類のタグが付与されている。

本コーパスは、自由対話を書き起こしたテキスト、具体的には国立国語研究所で公開されている『名大会話コーパス』の一部の対話に対してタグを付与している。対話数は97、発話数は92,020である。

詳細は、付属のマニュアルを参照のこと。

本データで公開しているのはタグの情報のみであり、元のテキストは含まれていない。テキストを含めた完全なコーパスを復元するためには、別途『名大会話コーパス』(無料で入手可能)を用意する必要がある。(復元方法)

名大会話コーパスについては以下のウェブページを参照していただきたい。
http://mmsrv.ninjal.ac.jp/nucc/

Creator: 北陸先端科学技術大学院大学(JAIST) 白井研究室
Price: 研究目的使用限定。
個人・会員22,000円、個人・非会員44,000円、団体・会員44,000円、団体・非会員88,000円。別途、送料3,300円。
Date:2017.7
Format:1 CD-R (9.2MB)
Format.encoding:UTF-8
Language:Japanese
利用事例:言語情報処理ポータルのページに移動します
上記言語資源の入手にあたっては、利用申請書兼誓約書(JAISTタグ付き自由対話コーパス) に必要事項をご記入いただき、メール、FAX、郵便等にて、事務局までお送り下さい。 折り返し、ご請求書をお送りしますので、宛名等ご指定のある場合は申請時にお知らせください。また、利用申請書兼誓約書の記入にあたっては「会員種別と利用種別の個人・団体について」をご確認下さい。