しかし,限られた時間の中で,説明の正確さとわかりやすさを両立するには,難解な医療用語の使用を避けられない場合があり,全ての語を噛み砕いて説明することができないと考えられる. また,医療者は医療用語に慣れているために,非医療者にとって難解な医療用語が理解しづらく,噛み砕いて説明するべき語がわからない可能性がある. したがって,両者のコミュニケーションの質をより高くするためにまず必要なことは,多くの非医療者にとって難解な医療用語を,お互いが把握することだと考えられる.
このような背景のもと,国立国語研究所は,アンケートを用いて非医療者にとって難解な医療用語を取り上げ,それらがどのような要因で難解に感じられるかを調査した「『病院の言葉』をわかりやすくする提案」を公開した.しかし対象語彙は約60語と小規模であり,実用にはより大規模なものが求められる.そこで本研究では,大規模な「難解な医療用語リスト」を作成するために,機械学習を用いた医療用語の難易度推定手法は確立されていないため,一般的な日本語の難易度を推定する既存の手法に基づいて新たに提案する.クラウドソーシングを用いて医療用語が難解に感じる要因を調査した結果, 複合語が難解であるということがわかった.これを構成素数などの素性として表現し,既存の手法に追加して医療用語の難易度推定をした結果,既存の手法と比較して決定係数で 27 ポイントの向上を実現した.
本発表では,(1)既存の一般語の難易度推定手法に基づくベースライン手法での医療用語難易度推定と課題の検討 (2)クラウドソーシングを用いて医療用語が難解に感じる要因の調査をし,医療用語の難易度推定精度を向上させるために用いる新規素性をの決定 (3)語の構成素の頻度情報を新規素性として追加した医療用語の難易度推定手法の提案 という順で説明する.