Skip to main content

単語分散表現モデルの埋め込み空間を用いた概念間探索手法の構築と大規模言語モデルの機械論的解釈可能性への応用

Venue #

NLP若手の会 第19回シンポジウム (YANS 2024), S5-P02

Authors #

Junya G. Honda (TUT / Emosta), Shuhei Ogawa (Emosta), Kotaro Sakamoto (UTokyo)

言語モデルは人と同様に概念を獲得しているのか? この研究では,概念同士のつながりを可視化し,モデルが内部で概念をどう解釈しているかを明らかにすることを目指す.入力を埋め込み空間に対応づけて保存し,概念間の探索空間をサンプリングしてネットワークを構築,経路探索と近傍の再サンプリングを通じて概念間の関係を可視化する手法を提案した.Word2Vec(chiVe)を用いた青空文庫3作品の構造分析と,SAE(Sparse AutoEncoder)を用いたLLM内部の特徴量による概念探索の2つのアプローチで検証を行った.

See Also #
Junya G. Honda
Author
Junya G. Honda
Master’s student in Computer Science and Engineering at Toyohashi University of Technology (Uehara Lab). Interested in how AI can bring new insights to neuroscience — analyzing brain networks as graphs with GNNs, and using counterfactual explanations to turn model predictions into actionable insights for clinical use. Also exploring how to extract and visualize the knowledge that AI models acquire internally.