ランダムでない欠測を含む時系列モデリング
執筆者
馬場 由羽貴(九州大学大学院数理学府)
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)
アクセプト
2024年2月27日
ランダムでない欠測を含む時系列モデリング
執筆者
馬場 由羽貴(九州大学大学院数理学府)
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)
アクセプト
2024年2月27日
ポスタータイトル
SSVD Based Biclustering Methods via Mixed Prenet Penalty
発表者
Jiqiang Wang and Kei Hirose
Abstract:
Standard clustering methods typically group samples based on their entire set of observed features. In large datasets, however, only a few features may play a role in distinguishing different clusters.
In our research, we observed that if certain biclusters produced by the algorithm are excessively similar, which means they have a high degree of repetition (overlap). Such redundancy can pose challenges to our analysis because it is difficult to identify the useful variables. On the other hand, these repeated portions may also contain valuable information. However, a simple prohibition or allowance of repetition is not sufficient. We need to find a method to identify when it is necessary to retain duplicated parts. In our study, we successfully improved the SSVD (Sparse Singular Value Decomposition) by proposing the following mixed Prenet penalty (a hybrid of Prenet (product-based elastic net) penalty and the original elastic net penalty) to replace the original adaptive Lasso penalty in the SSVD method.
The Prenet penalty was originally proposed by Hirose and Terada (2022) to deal with the loading matrix in Factor analysis. It is based on the product of a pair of elements in each row of the loading matrix. The Prenet not only shrinks some of the factor loadings toward exactly zero but also enhances the simplicity of the loading matrix, which plays an important role in the interpretation of the common factors. However, the original Prenet penalty itself cannot provide a good clustering result in our experience, then we extended it to make it compatible with the general elastic net and allow users to easily control the threshold for allowing overlapping by adjusting parameter values. This improvement has a noticeable effect on reducing the degree of dummy overlapping.
受賞日
2023年12月8日
論文タイトル
Fast same-step forecast in SUTSE model and its theoretical properties
執筆者
吉田 航 | (九州大学大学院マス・フォア・イノベーション連係学府) |
廣瀬 慧 | (九州大学マス・フォア・インダストリ研究所) |
概要:
本論文は、SUTSEモデルを用いた、多変量時系列予測についての研究です。予測では、各変数の、予測誤差の相関関係を利用することを考えています。しかし、この相関を推定する際に、SUTSEモデルの枠組みでは、計算コストが大きいです。そこで本論文では、通常まとめて行われる、モデル推定と予測誤差の相関の推定を切り分け、2段階で実行することで、予測の高速化を図りました。実際に、この提案手法をバスの混雑度予測に応用した結果、11時間かかっていた解析を、8秒で終了することができ、精度も大きな差がありませんでした。また、提案手法にまつわる理論的特徴も議論しています。特に、カルマンフィルタによる予測の誤差について、新たな性質を証明しています。
アクセプト
2023年9月24日
論文タイトル
Hierarchical clustered multiclass discriminant analysis via cross-validation
執筆者
廣瀬 慧 | (九州大学 マス・フォア・インダストリ研究所) |
三浦 完太 | (九州大学 大学院数理学府修士課程 2020年度修了) |
小家 亜斗吏 | (九州大学 大学院数理学府修士課程 2017年度修了) |
アクセプト
2022年9月2日
論文タイトル
Sparse and simple structure estimation via prenet penalization
執筆者
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)
寺田 吉壱(大阪大学 基礎工学研究科)
アクセプト
2022年4月13日
論文タイトル
Interpretable modeling for short- and medium-term electricity demand forecasting
執筆者
廣瀬 慧(九州大学 マス・フォア・インダストリ研究所)
アクセプト
2021年11月1日
論文のWEBページ
論文タイトル
Sparse multivariate regression with missing values and its application to the prediction of material properties
執筆者(敬称略)
寺本 圭祐 | (広島大学 大学院先進理工系科学研究科 数学プログラム) |
廣瀬 慧 | (九州大学 マス・フォア・インダストリ研究所) |
アクセプト
2021年10月25日
論文のWEBページ
「itocon」は,九州大学伊都キャンパス周辺のバス停の混雑度をリアルタイムで可視化するアプリです.
(開発:九州大学 大学院システム情報科学研究院 ヒューマノフィリックシステム研究室)
吉田君は,混雑の予測を算出するアルゴリズムを構築しました.
アルゴリズムの仕組みについて,吉田君が「九大理学部ニュース」で詳しく解説しています.
大会開催期間 2021年9月5日~9日(オンライン)
発表者と講演タイトル(敬称略)
9月7日 | 三浦 完太(修了生) 廣瀬 慧 | クロスバリデーションに基づく正準判別のクラスタリングとその高速化 |
9月8日 | 馬場 由羽貴(修士2年) 廣瀬 慧 | NMARにおける状態空間モデルの推定 |
9月9日 | 吉田 航(修士2年) 廣瀬 慧 | 適切な誤差分散推定によるモデル選択後の予測精度向上 |
論文タイトル
Hierarchical clustered multiclass discriminant analysis via cross-validation.
●
本論文では,クラスタリングを用いた高精度な正準判別分析を提案しました.階層的クラスタリングを用いており,クラスタリングの指標としてクロスバリデーションを用いることを考案しました.このとき,クラスタリングの各ステップでクロスバリデーションを計算する必要があるため,計算時間がかかります.そこで,高速に計算するアルゴリズムを構築しました.このアルゴリズムは,hcldaというRパッケージで実行でき,githubに公開されています.
執筆者(敬称略)
廣瀬 慧 | (九州大学 マス・フォア・インダストリ研究所) |
三浦 完太 | (九州大学 大学院数理学府修士課程 2020年度修了) |
小家 亜斗吏 | (九州大学 大学院数理学府修士課程 2017年度修了) |
三浦君のコメント
この論文は,小家先輩の判別分析の際に似ている群をあらかじめクラスタリングするというアイデアを元に作成しました.ここで用いたクラスタリング手法は階層的クラスタリングを参考にしたものを用いています.先生と共同でこの論文内容のRパッケージも作成しており,貴重な経験が出来たと思います.
論文タイトル
Relationship between gene regulation network structure and prediction accuracy in high dimensional regression.
●
植物の遺伝子から形質を予測する際,通常Lassoなどの高次元回帰モデルが用いられますが,遺伝子ネットワークと予測精度の関係性についてはこれまであまり議論されていませんでした.本論文では,その関係性をモンテカルロシミュレーションによって検証しました.
研究内容の詳しい解説が『九大理学部ニュース』に掲載されています.
執筆者 ※所属は論文作成当時 / 敬称略
沖永 悠一 | (九州大学 大学院数理学府) |
京極 大助 | (兵庫県立人と自然の博物館 自然・環境マネジメント研究部) |
近藤 聡 | (トヨタ自動車(株)アグリバ イオ事業部 農食事業室) |
永野 惇 | (龍谷大学 農学部) |
廣瀬 慧 | (九州大学 マス・フォア・インダストリ研究所) |
九大生がよく利用するバス停(昭和バス・西鉄バス)の混雑度をリアルタイムで可視化するアプリ(Web版・LINE版)
アプリ管理・運営 / 九州大学 大学院システム情報科学研究院 ヒューマノフィリックシステム研究室
吉田君のコメント
今回, アプリに実装していただいたアルゴリズムは, 次の日のバスの混雑度を, その日までのデータを用いて予測するものです.使用したモデルは, 状態空間モデルというモデルです. その中でも, ARモデルとローカルレベルモデルというモデルを組み合わせたものを使用しました. この2つのモデルは昔からよく知られるシンプルなモデルであります. 予測には, 前日までのバスの混雑度のみを使用します. イベント情報や気象情報など, 様々なデータを元に, 複雑なモデルを立てて予測することも考えられますが, 今回の解析ではシンプルなモデルの方が合っていると考えました. 実際に中々上手くいってくれて, 178日分のデータに対して予測の平均2乗誤差が, 8.64人^2程でした.
今回実装していただいたのは翌日の混雑度を予測するアルゴリズムですが, 今後として, 当日のある時刻の混雑度をその時刻以前のデータを元に予測をする, 当日予測を考えています.
C-ENGINE(一般社団法人 産学協働イノベーション人材育成協議会)実施のインターンシップに参加
実施期間 | 2020年8月~10月の2ヶ月間 |
受入企業 | 川崎重工業株式会社 技術開発本部 (リモートによる実施) |
馬場君のコメント
去年の10月にC-ENGINEを通して川崎重工業での研究インターンシップに取り組みました. 実験データの取得やデータの前処理など, 普段の研究では経験できないようなデータ解析に取り組むことができ, 非常にいい経験になりました. 今回の経験を生かして,これからも実用場面を意識した研究を行っていきます.
研究室のwebサイトを開設しました.