NLP2026 言語資源賞
■2026年 言語資源賞の選考について
言語資源賞は,言語資源データベースに掲載された言語資源の中から,特に優れていると認められるものに授与される賞です.言語資源データベースの公開ならびに言語資源賞の授与は言語処理学会と言語資源協会(GSK)との共同事業です.
言語資源賞の選考対象となる言語資源は,言語資源データベースに掲載され,2024年10月1日から2025年9月30日までの間に公開され,かつ過去に言語資源賞の選考対象になっていない言語資源です.今回は57件の言語資源が対象となりました.12名の委員からなる選考委員会を組織し,一次選考と二次選考の二段階で選考を行いました.
一次選考では,各言語資源に対し,利益相反を考慮して2名の選考委員を割り当てました.各委員は,独自性,応用可能性,作成コスト,品質などの観点から言語資源を評価し,1〜5点の総合評価点をつけました.評価の高い上位12件の言語資源を選定し,二次選考の対象言語資源としました.
二次選考では,選考委員が上記12件の全ての言語資源を精査し,言語資源賞にふさわしいと思われる3件の言語資源を選んで投票しました.ただし,選考委員がその開発に深く関わった言語資源には投票できないものとしました.投票結果ならびに選考委員による討議の結果,1件の言語資源を言語資源賞に推薦することとしました.
言語処理学会の理事会ならびにGSKの理事会の承認を得て,推薦言語資源への授賞が決まりました.
■2026年 言語資源賞
●JMED-DICT
永井宥之, 西山智弘, 大槻優佳, 藤牧貴子, 川端京子, 工藤紀子, 山崎由佳, 白石暖哉 , 梶原智之, 進藤裕之, 河添悦昌, 今井健, 矢田竣太郎, 若宮翔子, 荒牧英治
JMED-DICTはおよそ70万語を収録した大規模な医療用語辞書です.病名データ,医薬品データ,部位データ,検査データの4つのサブデータから構成され,用語そのものの情報だけでなく,用語間の関係,メタ情報,他のリソースへのリンク情報を含みます.医療用語を頻度に応じて2種類に分け,頻度上位エントリは人手でメンテナンスし,頻度下位エントリの情報は自動付与しています.辞書は定期的にメンテナンスされています.また,各情報は信頼度のラベルを持ち,人手によるチェックを経るごとに信頼度のレベルが上がります.同辞書は,大規模言語モデルをはじめとした計算機を通じて利用されることを想定し,効率的なメンテナンスにより大規模かつ高品質な医療用語情報を提供するものであり,価値の高い言語資源であると言えます.
■言語資源賞 選考委員
橋田 浩一 (理化学研究所)
今一 修 (日立製作所)
大熊 智子 (旭化成)
柏野 和佳子 (国立国語研究所)
川田 拓也 (日本電気)
黒田 由加 (三菱UFJリサーチ&コンサルティング)
白井 清昭 (北陸先端科学技術大学院大学)
徳永 健伸 (東京科学大学)
難波 英嗣 (中央大学)
富士 秀 (富士通)
藤田 早苗 (NTT)
吉川 和 (富士通)