コロキアムB発表

日時: 9月17日(木)4限(15:10~16:40)


会場: L1

司会: 佐藤 勇起
中前 美祐 M, 2回目発表 数理情報学 池田 和司, 金谷 重彦, 吉本 潤一郎, 久保 孝富, 福嶋 誠, 日永田 智絵
title: *** replace this part with the title of your talk IN ENGLISH ***
abstract: *** replace this part with the abstract of your talk IN ENGLISH ***
language of the presentation: *** English or Japanese (choose one) ***
発表題目: *** この部分を発表題目に ***
発表概要: *** この部分を発表概要に ***
 
中村 明星 M, 2回目発表 数理情報学 池田 和司, 金谷 重彦, 吉本 潤一郎, 福嶋 誠, 日永田 智絵
title: Sparse Regression for Truncated Data using Non-Convex Penalty
abstract: Truncated regression is a kind of “regression problem in the Biased-Sample setting”. In the past decades, many works in statistics, engineerings, and economics have pursued the appropriate framework for estimating the coefficient vector of this model. However, most of those studies are for low-dimensional settings, and truncated regression in high-dimensions has not been well studied. For example, previous studies have only used Lasso (L1 regularization) for extending the model to high-dimensional settings, though Lasso doesn’t generally have a promising properties.
  In this research, therefore, we propose a high-dimensional truncated regression model using non-convex penalty, in particular L_{1/2} regularization. In the standard (un-truncation) settings, L_{1/2} penalized estimator is superior to Lasso in terms of sparsity, sample efficiency, and support recovery performance. For the purpose of overcoming difficulties due to truncation, high-dimensionality, and non-convexity, our estimation algorithm consists of both techniques by Daskalakis+(2020) and Zou & Li (2008). Our computational experiments result implies our estimator performs better than previous works in terms of error rate and support recovery performance.
language of the presentation: Japanese
発表題目: 切断データに対する、非凸ペナルティを用いたスパース回帰
発表概要: 切断回帰は「観測にバイアスがある設定における回帰問題」の一つである。切断回帰モデルの係数を適切に推定する枠組みは、過去数十年で統計学や工学、経済学において幅広く研究されてきた。しかしそれら多くは低次元設定に対してのものであり、高次元設定における切断回帰についてはこれまで十分に研究されていない。例えば既存研究では、切断回帰を高次元モデルに拡張するにあたって L1 正則化 (Lasso) を適用しているものの、Lasso 推定量は必ずしも良い性質を持つわけではない。
 そこで本研究では、非凸ペナルティを用いた高次元切断回帰モデルを提案する。我々は非凸ペナルティとして特に L_{1/2} ノルムを採用する。L_{1/2} 正則化モデルは標準的 (非切断) 設定において、スパース性、サンプル効率性、変数選択能力の観点で Lasso 推定量に優越することが知られている。我々は切断と高次元性、目的関数の非凸性といった困難に対処するために、Daskalakis+(2020) と Zou & Li (2008) 両方のテクニックを用いた推定アルゴリズムを構築する。本発表では計算機実験の結果を紹介し、我々の推定アルゴリズムが誤差レートおよび変数選択能力の観点で既存手法より優れている可能性を報告する。