複合語の構成素情報を考慮した医療用語難易度の推定

山本 英弥 (1751121)


近年,インフォームド・コンセントという語が注目を浴びている. この語は,患者などの非医療者が治療などに関して説明を受け,内容を理解した上で,自らの意志で医療者の方針に合意するという意味である.この語が示すように,質の高い医療を実現するために,医療者と非医療者のコミュニケーションの重要性が高まっている. それに伴い,医療者はより正確で分かりやすい説明を求められるようになってきた.

しかし,限られた時間の中で,説明の正確さとわかりやすさを両立するには,難解な医療用語の使用を避けられない場合があり,全ての語を噛み砕いて説明することができないと考えられる. また,医療者は医療用語に慣れているために,非医療者にとって難解な医療用語が理解しづらく,噛み砕いて説明するべき語がわからない可能性がある. したがって,両者のコミュニケーションの質をより高くするためにまず必要なことは,多くの非医療者にとって難解な医療用語を,お互いが把握することだと考えられる.

このような背景のもと,国立国語研究所は,アンケートを用いて非医療者にとって難解な医療用語を取り上げ,それらがどのような要因で難解に感じられるかを調査した「『病院の言葉』をわかりやすくする提案」を公開した.しかし対象語彙は約60語と小規模であり,実用にはより大規模なものが求められる.そこで本研究では,大規模な「難解な医療用語リスト」を作成するために,機械学習を用いた医療用語の難易度推定手法は確立されていないため,一般的な日本語の難易度を推定する既存の手法に基づいて新たに提案する.クラウドソーシングを用いて医療用語が難解に感じる要因を調査した結果, 複合語が難解であるということがわかった.これを構成素数などの素性として表現し,既存の手法に追加して医療用語の難易度推定をした結果,既存の手法と比較して決定係数で 27 ポイントの向上を実現した.

本発表では,(1)既存の一般語の難易度推定手法に基づくベースライン手法での医療用語難易度推定と課題の検討 (2)クラウドソーシングを用いて医療用語が難解に感じる要因の調査をし,医療用語の難易度推定精度を向上させるために用いる新規素性をの決定 (3)語の構成素の頻度情報を新規素性として追加した医療用語の難易度推定手法の提案 という順で説明する.