昨年度修了した馬場由羽貴くんが筆頭著者として執筆した論文が日本統計学会誌に採択されました。

ランダムでない欠測を含む時系列モデリング

執筆者
馬場 由羽貴(九州大学大学院数理学府)
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)

アクセプト
2024年2月27日

D1の王際強さんのポスター発表が「The 12th conference of the Asian Regional Section of the International Association for Statistical Computing (IASC-ARS)」でOutstanding Young Researcher/Student Poster Presentation Awardに選出されました

ポスタータイトル

SSVD Based Biclustering Methods via Mixed Prenet Penalty

発表者

Jiqiang Wang and Kei Hirose

Abstract:

Standard clustering methods typically group samples based on their entire set of observed features. In large datasets, however, only a few features may play a role in distinguishing different clusters.

In our research, we observed that if certain biclusters produced by the algorithm are excessively similar, which means they have a high degree of repetition (overlap). Such redundancy can pose challenges to our analysis because it is difficult to identify the useful variables. On the other hand, these repeated portions may also contain valuable information. However, a simple prohibition or allowance of repetition is not sufficient. We need to find a method to identify when it is necessary to retain duplicated parts. In our study, we successfully improved the SSVD (Sparse Singular Value Decomposition) by proposing the following mixed Prenet penalty (a hybrid of Prenet (product-based elastic net) penalty and the original elastic net penalty) to replace the original adaptive Lasso penalty in the SSVD method.

The Prenet penalty was originally proposed by Hirose and Terada (2022) to deal with the loading matrix in Factor analysis. It is based on the product of a pair of elements in each row of the loading matrix. The Prenet not only shrinks some of the factor loadings toward exactly zero but also enhances the simplicity of the loading matrix, which plays an important role in the interpretation of the common factors. However, the original Prenet penalty itself cannot provide a good clustering result in our experience, then we extended it to make it compatible with the general elastic net and allow users to easily control the threshold for allowing overlapping by adjusting parameter values. This improvement has a noticeable effect on reducing the degree of dummy overlapping.

受賞日
2023年12月8日

D2の吉田航くんが筆頭著者として執筆した論文がComputational Statistics & Data Analysisに採択されました。

論文タイトル

Fast same-step forecast in SUTSE model and its theoretical properties

執筆者

吉田 航(九州大学大学院マス・フォア・イノベーション連係学府)
廣瀬 慧(九州大学マス・フォア・インダストリ研究所)

概要:

本論文は、SUTSEモデルを用いた、多変量時系列予測についての研究です。予測では、各変数の、予測誤差の相関関係を利用することを考えています。しかし、この相関を推定する際に、SUTSEモデルの枠組みでは、計算コストが大きいです。そこで本論文では、通常まとめて行われる、モデル推定と予測誤差の相関の推定を切り分け、2段階で実行することで、予測の高速化を図りました。実際に、この提案手法をバスの混雑度予測に応用した結果、11時間かかっていた解析を、8秒で終了することができ、精度も大きな差がありませんでした。また、提案手法にまつわる理論的特徴も議論しています。特に、カルマンフィルタによる予測の誤差について、新たな性質を証明しています。

アクセプト
2023年9月24日

 

Computational Statistics & Data Analysisに採択されました

論文タイトル

Hierarchical clustered multiclass discriminant analysis via cross-validation

執筆者

廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)
三浦 完太(九州大学 大学院数理学府修士課程 2020年度修了)
小家 亜斗吏(九州大学 大学院数理学府修士課程 2017年度修了)

アクセプト
2022年9月2日

 

frontiers in Energy Researchに採択されました

論文タイトル

Interpretable modeling for short- and medium-term electricity demand forecasting

執筆者
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)

アクセプト
2021年11月1日

論文のWEBページ

Numerical Methods in Engineeringに採択されました

論文タイトル

Sparse multivariate regression with missing values and its application to the prediction of material properties

執筆者(敬称略

寺本 圭祐(広島大学 大学院先進理工系科学研究科 数学プログラム)
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)

アクセプト
2021年10月25日

論文のWEBページ

混雑度予測アプリ「itocon」の予測アルゴリズムについて,修士課程2年・吉田君の解説した記事が「九大理学部ニュース」に掲載されました

「itocon」は,九州大学伊都キャンパス周辺のバス停の混雑度をリアルタイムで可視化するアプリです.
(開発:九州大学 大学院システム情報科学研究院 ヒューマノフィリックシステム研究室)

吉田君は,混雑の予測を算出するアルゴリズムを構築しました.
アルゴリズムの仕組みについて,吉田君が「九大理学部ニュース」で詳しく解説しています.

2021年度統計関連学会連合大会で三浦君,馬場君,吉田君が口頭発表を行います

大会開催期間  2021年9月5日~9日(オンライン)

発表者と講演タイトル(敬称略)

9月7日 三浦 完太(修了生)  
廣瀬 慧
クロスバリデーションに基づく正準判別のクラスタリングとその高速化
9月8日 馬場 由羽貴(修士2年) 
廣瀬 慧
NMARにおける状態空間モデルの推定
9月9日 吉田 航(修士2年)
廣瀬 慧
適切な誤差分散推定によるモデル選択後の予測精度向上

修了生の三浦君, 小家君と共著の論文がプレプリントで公開されました

論文タイトル

Hierarchical clustered multiclass discriminant analysis via cross-validation.

本論文では,クラスタリングを用いた高精度な正準判別分析を提案しました.階層的クラスタリングを用いており,クラスタリングの指標としてクロスバリデーションを用いることを考案しました.このとき,クラスタリングの各ステップでクロスバリデーションを計算する必要があるため,計算時間がかかります.そこで,高速に計算するアルゴリズムを構築しました.このアルゴリズムは,hcldaというRパッケージで実行でき,githubに公開されています.


執筆者(敬称略)

廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)
三浦 完太(九州大学 大学院数理学府修士課程 2020年度修了)
小家 亜斗吏(九州大学 大学院数理学府修士課程 2017年度修了)

三浦君のコメント

この論文は,小家先輩の判別分析の際に似ている群をあらかじめクラスタリングするというアイデアを元に作成しました.ここで用いたクラスタリング手法は階層的クラスタリングを参考にしたものを用いています.先生と共同でこの論文内容のRパッケージも作成しており,貴重な経験が出来たと思います.


 

昨年度修了した沖永悠一君の論文がScientific Reportsに採択されました

論文タイトル

Relationship between gene regulation network structure and prediction accuracy in high dimensional regression.

植物の遺伝子から形質を予測する際,通常Lassoなどの高次元回帰モデルが用いられますが,遺伝子ネットワークと予測精度の関係性についてはこれまであまり議論されていませんでした.本論文では,その関係性をモンテカルロシミュレーションによって検証しました.

研究内容の詳しい解説が『九大理学部ニュース』に掲載されています.

執筆者  ※所属は論文作成当時 / 敬称略

沖永 悠一(九州大学 大学院数理学府)
京極 大助(兵庫県立人と自然の博物館 自然・環境マネジメント研究部)
近藤 聡(トヨタ自動車(株)アグリバ イオ事業部 農食事業室)
永野 惇(龍谷大学 農学部)
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)

修士課程2年・吉田航君が作成した混雑予測アルゴリズムがアプリ「itocon」で活用されています

九大生がよく利用するバス停(昭和バス・西鉄バス)の混雑度をリアルタイムで可視化するアプリ(Web版・LINE版)

アプリ管理・運営 / 九州大学 大学院システム情報科学研究院 ヒューマノフィリックシステム研究室

吉田君のコメント

今回, アプリに実装していただいたアルゴリズムは, 次の日のバスの混雑度を, その日までのデータを用いて予測するものです.使用したモデルは, 状態空間モデルというモデルです. その中でも, ARモデルとローカルレベルモデルというモデルを組み合わせたものを使用しました. この2つのモデルは昔からよく知られるシンプルなモデルであります. 予測には, 前日までのバスの混雑度のみを使用します. イベント情報や気象情報など, 様々なデータを元に, 複雑なモデルを立てて予測することも考えられますが, 今回の解析ではシンプルなモデルの方が合っていると考えました. 実際に中々上手くいってくれて, 178日分のデータに対して予測の平均2乗誤差が, 8.64人^2程でした.
今回実装していただいたのは翌日の混雑度を予測するアルゴリズムですが, 今後として, 当日のある時刻の混雑度をその時刻以前のデータを元に予測をする, 当日予測を考えています.

修士課程2年・馬場由羽貴君が参加した研究インターンシップがC-ENGINEの成果事例として紹介されました

C-ENGINE(一般社団法人 産学協働イノベーション人材育成協議会)実施のインターンシップに参加

実施期間2020年8月~10月の2ヶ月間
受入企業川崎重工業株式会社 技術開発本部 (リモートによる実施)

馬場君のコメント

去年の10月にC-ENGINEを通して川崎重工業での研究インターンシップに取り組みました. 実験データの取得やデータの前処理など, 普段の研究では経験できないようなデータ解析に取り組むことができ, 非常にいい経験になりました. 今回の経験を生かして,これからも実用場面を意識した研究を行っていきます.