ゼミナール発表

日時: 9月25日(金)3限 (13:30-15:00)


会場: L1

司会: 南 裕樹
田中 宏 1461005: D, 中間発表 中村 哲,杉本 謙二,戸田 智基,Sakriani Sakti,Graham Neubig
title: Real-Time Vibration Control of an Electrolarynx based on Statistical F0 Prediction
abstract: An electrolarynx is a type of speaking aid device which is able to mechanically generate excitation sounds to help laryngectomees produce electrolaryngeal (EL) speech. Although EL speech is quite intelligible, its naturalness suffers from monotonous fundamental frequency patterns of the mechanical excitation sounds. To make it possible to generate more natural excitation sounds, we propose direct $F_0$ control of the electrolarynx based on statistical excitation prediction to develop an EL speech enhancement technique effective for daily life including face-to-face conversation. We develop a prototype system by implementing the proposed control method in an actual, physical electrolarynx and evaluate its performance.
language of the presentation: Japanese
 
向原 康平 1451106: M, 2回目発表 中村 哲,小笠原 司,戸田 智基,Sakriani Sakti,Graham Neubig
title: Bottleneck Features for Emotional Speech Recognition
abstract: Automatic speech recognition (ASR) system is used for emotional speech. However emotion influence speech signal. Therefore emotional speech degrades ASR quality. In this presentation, we focus on bottleneck features for emotional speech recognition. The bottleneck features are made by deep neural network hidden layer which has small number nodes than other layer. We think bottleneck structure can extract features and bottleneck features represent phoneme essential features. By using bottleneck features for emotional speech recognition, we confirm improvement results compared with emotion adaptation model and normal model.
language of the presentation: Japanese
発表題目: ボトルネック特徴量を用いた感情音声の認識
発表概要: 音声認識システムは一般に広く使われるようになっており,感情のこもった音声を自動認識する機会が多くなってきた.しかし,感情の揺らぎは音声に影響を与え,平静音声を想定している通常の音声認識システムでは認識精度の低下を引き起こす.本研究では感情音声の入力に対する認識精度向上のため,ディープニューラルネットワークを用いて作成するボトルネック特徴量に着目する.ボトルネック特徴量とは,隠れ層のノード数を少なくしたボトルネック構造のニューラルネットワークから抽出する特徴量である.ボトルネック特徴量は特徴量強調が行われ,感情音声のゆらぎに左右されない音素の本質的な成分を抽出することができると考えられる.ボトルネック特徴量を用いたモデルを感情音声の認識に用いた結果,通常の音声認識モデル,感情に対して適応学習を施したモデルと比べて音声認識精度の向上が確認できた.
 
袴田 有哉 1451083: M, 2回目発表 小笠原 司,杉本 謙二,高松 淳
title: Humanoid robots opening and closing motion in consideration of the contact force
abstract: Humanoid robots have a similar form of a human. So, humanoid robots are are expected to work in place of us. In our daily life, opening and closing motion is done many times. For example door, refrigerator, drawer and so on. Instability of the two-legged is considered as a factor that is difficult to perform this task. In this presentation, I describe how to maintain stability in the opening and closing motion by using the known force which occurred when doing that task. First, I explain how to generate the motion based on inverse kinematics in the case of the force is small. Then, describing the Resolved Momentum Control implementation that allows controlling the momentum of the whole body by the feedback control in order to increase the stability. Finally, I propose the feedforward control method to exert the power of purpose by using the known force which occurred when doing the task.
language of the presentation: Japanese
発表題目: ヒューマノイドロボットによる作業中の接触力を考慮した開閉動作
発表概要: ヒューマノイドロボットは,人間に近い身体性を活かし生活環境下で人間と同等の作業ができるようになることが期待されている.実際の生活空間では,ドアや,冷蔵庫,引き出しなどの開閉動作が数多く見られる.これらの動作の達成を困難にしている要因として二足歩行の不安定性が挙げられる.本発表では,ヒューマノイドロボットが開閉動作を行う際に発生する力を既知とすることで,安定性の維持を行う方法について述べる.まず,発生する力が小さい場合の逆運動学による動作生成法を説明する.次に,力を発揮した際に転倒しないようフィードバック制御により全身の運動量を制御可能とする分解運動量制御の実装を説明する.さらに,発生する力を既知とすることでフィードフォワード制御により目的の力を発揮する制御方法の提案を行う.