コロキアムB発表

日時: 9月14日(水)2限(11:00-12:30)


会場: L1

司会: 江口 僚太
柿本 和希 D, 中間発表 ソフトウェア設計学 飯田 元, 松本 健一, 片平 真史, 石濱 直樹, 高井 利憲
 
栢割 脩平 M, 2回目発表 ソフトウェア設計学 飯田 元, 松本 健一, 片平 真史, 石濱 直樹, 高井 利憲
title: Hidden Uncertainty-aware Out-of-Distribution Detection for Real-time Object Detetion
abstract: Although neural networks have achieved high performance in various fields, their application to safety-critical systems such as automobiles and spacecraft is still limited. This is because the behavior of the models is stochastic and involves uncertainty in prediction, which poses a safety challenge. Typical methods for estimating the prediction uncertainty of neural networks, such as ensemble methods and Bayesian neural networks, have been proposed, but they are all computationally expensive and have limitations in their application to real-time systems. In this study, we propose an object detection model for autonomous driving systems that enables real-time uncertainty estimation. In particular, we focus on the detection of out-of-distribution data and work to reduce false positives and increase safety by detecting classes that are unknown to the model. The proposed method aims to improve the out-of-distribution detection capability over conventional methods by estimating uncertainty in a single forward propagation calculation to ensure real-time performance, and by estimating overall uncertainty that also takes into account uncertainty in the intermediate layers.
language of the presentation: Japanese
発表題目: リアルタイム物体検出のための中間層の不確実性を考慮した分布外検出手法
発表概要: ニューラルネットワークは様々な分野で高い性能を達成しているが、自動車や宇宙機などのセーフティクリティカルシステムへの適用は未だ限定的である。これは、モデルの振る舞いが確率的で、予測に不確実性を含むため、安全性に課題があるからである。ニューラルネットワークの予測の不確実性を推定する代表的な手法として、アンサンブル法やベイズニューラルネットワークなどの手法が提案されているが、いずれも計算コストが高く、リアルタイムシステムへの適用に限界がある。本研究では、自動運転システムを対象として、リアルタイム性の高い不確実性推定が可能な物体検出モデルを提案する。特に、分布外データの検出に焦点を当て、モデルにとって未知のクラスを検出することで、誤認識を減らし、安全性を高めることに取り組む。提案手法では、1回の順伝播計算で不確実性を推定することでリアルタイム性を確保しつつ、中間層の出力も考慮した総合的な不確実性を推定することで、従来手法よりも分布外検出能力を高めることを目指す。
 
井原 輝人 M, 2回目発表 ソフトウェア設計学 飯田 元, 松本 健一, 市川 昊平, 平尾 俊貴, 柏 祐太郎
title: Appriacation of Code-Aware Models for Automating Code Review
abstract: Code review is a process in which developers manually find bugs and improve existing code, and is extremely important for maintaining software quality. However, the problem is that a lot of time is consumed in conducting code reviews.In recent years, there has been a lot of research aimed at automating part of the review process using deep learning techniques. Recent years, automated Code Review (ACR) has received a lot of attention. ACR is a technology that uses deep learning to predict reviewer comments or the committer's code modifications in response to those comments, improving the efficiency of the review process. Deep learning techniques commonly used in the NMT field, such as Transformer and T5, are used as deep learning models. On the other hand, recent research in the MSR field has focused on deep learning models (Code-Aware models) that can recognize the sentence structure of code and have produced results in benchmark tasks such as code transformation and code summarization. In this study, we attempt to improve accuracy by applying Code-Aware models such as code2seq and GraphCodeBERT to the prediction of committer's modified code, which is one of the benchmarks in ACR. We will also analyze the differences in accuracy and prediction results of each model to contribute to the proposal of new models and model improvement in the future.
language of the presentation: Japanese
発表題目: 自動コードレビューにおけるコード認識モデルの活用
発表題目: コードレビューは、開発者が手作業でバグを発見し、既存のコードを改善する等、ソフトウェアの品質を維持する上で重要なプロセスである。しかし、コードレビューの実施にあたって多くの時間を消費していることが問題となっている。近年、自動コードレビュー(ACR)が注目を集めている。ACRはレビュアーのコメントや、そのコメントに対してのコミッターのコード修正を深層学習技術を用いて予測しレビューを効率化する技術である。深層学習モデルにはTransformerやT5などNMT分野で一般的に使用される深層学習技術が使われている。一方で近年、MSR分野ではコードの文構造を考慮可能な深層学習モデル(コード認識モデル)の研究が進み、コード変換やコード要約などのベンチマークタスクで成果を上げている。本研究ではACRにおけるベンチマークの1つであるコミッターの修正コード予測に対してcode2seqやGraphCodeBERTといったコード認識モデルを適用することで精度の向上を試みる。また、各モデルの精度や予測結果の差異を分析し今後の新規モデル提案やモデル改良に寄与することを目的とする。
 
福本 大介 M, 2回目発表 ソフトウェア設計学 飯田 元, 松本 健一, 市川 昊平, 平尾 俊貴, 柏 祐太郎
title: An Investigation on the Performance of Domain Adaptation for Transformer-based Code Completion
abstract: Code completion has the benefit of improving coding speed and reducing the cost of learning programming languages. In recent years, DL-based code completion techniques have been studied. Specifically, Language models such as Transformer have shown outstanding performance because they can complete code by considering the context before and after the code that expects be completed. While the model can generate the set of candidate codes, some of those might need to be modified by developers because each project has different coding rules or even its architecture. In this study, to complete code that fits a specific project appropriately, we fine-tune the model with additional data from the target project by domain adaptation. We investigate how the effectiveness of domain adaptation varies with the size of the repository and the presence or absence of coding conventions, and seek optimal domain adaptation methods. Our preliminary experiment which we trained RoBERTa observes that our domain adapted model improves 4.9% of the edit distance rate and 5.8% of the perfect prediction rate, compared to the fine-tuned model with the out-of-domain dataset.
language of the presentation: Japanese
発表題目: Transformerを用いたコード補完のためのドメイン適応の性能に関する調査
発表概要: コード補完は,コーディング速度の向上や,プログラミング言語の学習コストの削減などのメリットがある.近年、深層学習を用いたコード補完技術が研究されている。Transformerをはじめとする言語モデルを用いた手法は、補完するコードの前後の文脈を考慮して補完でき、優れた性能を見せています。しかし、プロジェクトごとにコーディング規約やアーキテクチャが異なるため、開発者が補完結果のコードを修正しなければならない場合があります。そこで本研究では,プロジェクトに適合したコードを補完するために,対象プロジェクトのデータを追加してモデルを学習させるドメイン適応の効果を検証する。リポジトリのサイズやコーディング規約の有無などの違いでドメイン適応の効果がどのように変わるかを調査し、最適なドメイン適応の手法を模索する。RoBERTaにコード補完タスクを学習させた結果、ドメイン適応したモデルは、ドメイン外データで学習させたモデルと比較して、編集距離が4.9%、完全予測率が5.8%向上することが確認された。