======================================== 模擬診療録テキスト・データについて ======================================== 作成日 2012/07/30 修正日 2013/02/05 ======================================== 1.はじめに ======================================== 本データは大学教育充実のための戦略的大学連携支援プログラム「コメディカ ル養成のための教育用電子カルテシステムおよびデータベースの構築と実践」 にて作成された模擬患者診療記録からテキスト部分を抜粋したデータ(以下, 模擬データ)と,模擬テキストのうち医師が記述すべき文章について,アノテー ションを付与したデータ(模擬診療録データ)の2つからなります. A.模擬データ EHR_***.txt B.模擬診療録データ EHR_***.xml B.模擬診療録データに付与されているタグについての詳細は次章以下をご覧下さい. ======================================== 2.模擬診療録データ ======================================== 2.1 基本原則 文節タグは,文節を越えない名詞の最大範囲に,付与されています. 文節を越える大きな表現には付与されません. 2.2 タグの種類 *文節タグ(文節を越えない範囲で付与) age : 年齢 complaint : 症状名・疾患名 hospital : 病院名 location : 場所名

person : 人名 time : 日時 xsex : 性別 *その他のタグ : タイプミスを含む(文に対して付与) : 患者単位および診察単位を表す(複数行の文に対して付与) 2.3.各文節タグの説明 文節タグについての説明と適応例及び除外例を挙げました. * age は,年齢を表す箇所に付与されています. 程度や範囲を表す表現(まで,~,頃,約等)も含まれています. ただし,年齢を特定出来ない『若い』・『高齢』等は含まれていません. 【適用例】 63歳 41歳頃から 20-61歳 【除外例】 若いころ * complaint ------- 属性:modality(2.4.参照) は,ICD10コードに対応する症状や疾患名を表す箇所に付与されています. 症状を動詞で表現している場合は含まれていません. また,連体修飾がある場合,助詞を介する修飾部は含まれていません. 検査結果により疾患であることを表している場合にも付与されていますが, 『低下』・『拡張』等のみでは付与されていません. 【適用例】 核性白内障 この腫れ白内障の手術のため 視力低下 炎症反応高値であり 幽門狭窄(+) ※陽/陰性や+/-等は含まない 呼吸困難感と咽頭の腫脹を認め, ※助詞を含まないように付与 【除外例】 白内障手術を施行 糖尿病代謝内科 潰瘍底には ※文節として疾患を表していない場合は付与せず 視力が低下した ※文節の範囲内では疾患に相当する表現はないため付与せず * hospital は,病院や医療施設名が特定できる可能性を表す箇所に付与されています. ただし,特定の病院を指さない場合は含みません. また,診療科は含みません. 【適用例】 T病院循環器科 当院受診した 【除外例】 近くの病院 * location は,場所が特定できる箇所に付与されています. 一般的な場所の記述は含みません. 【適用例】 東京ディズニーランド 山梨県 【除外例】 外 施設 トイレ 会社 自宅 *

person

は,医師名等個人が特定できる箇所に付与されています. 【適用例】

長谷川医師

から紹介され, 【除外例】 長谷川式簡易知能評価スケール 母親にIC 看護師より説明 医師の記録 * time は,日時あるいは期間を表す箇所に付与されています. と同様,程度や範囲を表す表現も含まれており,『昔』等のあいまいな表現は 含まれていません. また,日単位よりも小さいスケール(例えば時間のみ)の記述は含まれていません. なお,日付であっても,資料等の日付は含まれていません. 【適用例】 2008年1月呼吸苦あり 2007年1月8日から約2ヶ月半 入院3日目 4月1日2日 ※『,』『と』『や』は含まず区切る 明日午前11時より 明日の午前11時より ※日付と組み合わせて使われている時間は含まれる 【除外例】 発症から3時間以内 (日胸:67巻3号,2008年3月) (資料) * xsex は,性別を表す箇所に付与されています. 【適用例】 男性 2.4.属性の説明 本データでは,タグにのみ以下の3種類のmodality属性を付与しています. *modality="positive" (デフォルト; 属性が入力されていない場合は,modality="positive"を表しています) タグ内の表現が,実際にある場合に相当します. *modality="negation" タグ内の表現が,実際にはない場合や打ち消されている場合に相当します. *modality="suspicion" タグ内の表現が,確信はないが可能性がある場合や疑われている場合に相当します. 3.その他 本データのアノテーションにつきましては,NTCIRパイロットタスクMedNLPのアノテーションとほぼ同等です. 詳細はNTCIRパイロットタスクのサイトをご覧ください. http://mednlp.jp/medist データについては,教育用電子カルテシステム連携プログラム 運営委員会事務局 国際医療福祉大学 情報教育室 http://ehr-renkei.iuhw.ac.jp/contact.php アノテーションについては,東京大学 知の構造化センター 荒牧研究室までお 問い合わせ下さい. http://mednlp.jp