aved from url=(0092)http://isw3.naist.jp/IS/Local/IsOffice/e-thesis/M/styles/html/mthesis-abstract-template.html -->
We propose a word attribute transfer framework based on reflection to obtain a word vector with an inverted target attribute for a given word in a word embedding space. In natural language processing, words are represented as the vector. Several vectorize method can caputure word vector's semantic operation that is called analogy such as king - man + woman = queen. These relations can be used for changing a word’s gender attribute from king to queen. This attribute transfer can be performed by subtracting a difference vector man - woman from king when we have explicit knowledge of the gender of given word king. However, this knowledge cannot be developed for various words and attributes in practice. For transferring queen into king in this analogy-based manner, we need to know that queen denotes a female and add the difference vector to change its gender attribute. In this work, we transfer such binary attributes based on an assumption that such transfer mapping will become identity mapping when we apply it twice. The proposed framework is based on reflection mapping that satisfies this property; queen should be transferred back to king with the same mapping as the transfer from king to queen. Experimental results show that the proposed method can transfer the word attributes of the given words, and does not change the words that do not have the target attributes.
本研究では鏡映変換に基づくの単語の属性変換を提案する. 自然言語処理において,単語はしばしばベクトルで表現される. 単語ベクトルを得る手法のいくつかでは king - man + woman = queen のような単語ベクトルの意味演算(アナロジー)が成り立つことが知られている. このアナロジーを用いてkingからqueenに,またqueenからkingに変換することが可能である. 一方,アナロジーによる変換はkingが男性であるという事前知識がある場合にkingから差分ベクトル man - woman を引くことでqueenに変換可能である. そしてqueenからkingに変換する場合,queenが女性であるという事前知識のもと差分ベクトルを足すことで性別を変換できる. しかしそのような知識は無数にあるため全ての単語に付与することは不可能である. そこで本研究では,性別のような二値属性を持つ単語を知識なしで変換する理想的な写像を,2回繰り返すと恒等写像となるような写像であると定義し,そのような特性を持った写像である鏡映変換に基づくフレームワークを提案する. 鏡映変換は同一の写像でベクトルの位置を相互に反転させる写像で,kingをqueenに,queenをkingに変換できる. 実験の結果,鏡映変換によって目的の二値属性を持つ単語は変換され,その属性を持たない単語は変換されないことが示された.