GSK2007-C Web日本語Nグラム第1版

Description: Nグラムは一般に公開されている日本語のWebページでGoogleがクロールしたものから抽出されている。ただし、閲覧に特別な認証が必要なページや、metaタグにnoarchive,noindex 等が指定されているページは対象に入っていない。抽出対象となった文数は約200億文で、出現頻度20回以上の1~7グラムを収録している。 データの詳細については付属のREADMEも参照のこと。
Creator: グーグル株式会社
Price: 教育・研究目的使用限定。営利目的利用不可。
個人・会員22,000円、個人・非会員44,000円、団体・会員44,000円、団体・非会員88,000円。別途、送料3,300円。
Date:2007.7
Format:6 DVD-R (26GB gzipで圧縮済み)
Format.encoding:UTF8
Language:Japanese
利用事例:言語情報処理ポータルのページに移動します

上記言語資源の入手にあたっては、利用申請書兼誓約書(Web日本語Nグラム第1版) に必要事項をご記入いただき、メール、FAX、郵便等にて、事務局までお送り下さい。 折り返し、ご請求書をお送りしますので、宛名等ご指定のある場合は申請時にお知らせください。なお、利用申請書兼誓約書には必ず署名・捺印をお願いいたします。メールでの申込受付は署名・捺印された文書をスキャンしたPDFファイルに限らせていただきます。それ以外はFAXまたは郵便にてご送付下さい。 また、利用申請書兼誓約書の記入にあたっては「会員種別と利用種別の個人・団体について」をご確認下さい。