【流 通】横浜市立大学と同志社大学 大規模言語モデルで公会計研究の軌跡を追跡

"横浜市立大学と同志社大学の研究グループ(*)は、大規模言語モデルBERT(*2)を用いて、1980〜2019年の公会計研究(PSAR)論文306本分のフルテキストを対象として、トピックモデリング手法(BER Topic)を適用し、主要なトピックを抽出した。従来のLDA(*3)ではなく、BERTを使ったことで、より文脈に応じた分類が可能になった。

社会科学は、自然科学と比べて理論体系や研究アプローチが多様化する傾向があり、文献レビューにおいても総合する難しさが指摘されてきた。その代表例として、公会計(Public Sector Accounting:PSAR)の領域は、財務会計・管理会計・行政管理・経済学・政治学というような複数の観点が交錯する学際的領域であり、従来のレビュー手法では著者が論文を読み、トピックを著者の主観に基づいて分類するため、著者の持つバイアスを小さくしながら全体像や主要なトピックを把握することがむつかしかった。特に定量的・定性的などの多様な方法論が混在した研究領域である場合、メタアナリシスなどの統合作業も難しい状況で、さらに旧来のLDAなどのトピックモデリングを用いた研究では、単語間の関係性のみに着目しており、文脈の理解に乏しかった。

一方、自然言語処理の分野では、BERT(Bidirectional Encoder Representations from Transformers)に代表される大規模言語モデル(LLM)が登場し、文脈理解に基づいた高精度な文献分類やトピック抽出が可能になっている。

今回の研究はこのような背景のもと、BERTベースのトピックモデリング(BER Topic)を活用して、公会計研究の40年間(1980〜2019年)の動向と構造を明らかにすることを目的としている。

共同研究では、ABDCランク(*4)上位の会計系ジャーナル11誌から「public sector「government」等のキーワードで抽出した公会計関連論文306本(1980~2019年)を収集し、全文を対象に形態素解析や前処理を実施した後、BERTopicを用いて文献のクラスタリングと主題分類を実施した。

分析の結果、7つのトピックが識別され、特に以下の6つが主要テーマとして抽出されました(①監査と債券市場、②医療費管理、③業績と管理会計、④公共汚職、⑤公共サービス、⑥公共・環境アカウンタビリティ、⑦その他)。

これらを時系列でトレンドを確認したところ、1980年代から2010年代にかけて「監査と債券市場」、「医療費管理」は減少傾向にありますが、「業績と管理会計」、「公共・環境アカウンタビリティ」は2000年代までは増加傾向でその後は同論文数程度を維持、「公共サービス」、「公共汚職」は増加傾向であることを確認した。 

今後、Emerging Technology分野との接続、他分野・他領域への応用展開や政策・教育・実務への知識転移などが期待される。


*1 横浜市立大学国際商学部・大学院データサイエンス研究科 黒木淳教授、同志社大学 商学部商学科 廣瀬喜貴准教授らの研究グループ


*2 大規模言語モデルBERT

Transformer双方向エンコーダ表現(Bidirectional Encoder Representations from Transformers)

2018年にGoogleにより論文で発表されたNLP(自然言語処理)モデル。

深層学習と呼ばれる学習方法のモデルの一種で、過去のNLP(自然言語処理)モデルと異なり、文章を文頭と末尾の双方向から事前学習するように設計されている。また学習に使用することができるデータが大量に存在し、様々なタスクに対して柔軟な対応が可能という特徴がある


*3 LDA

Latent Dirichlet Allocation(潜在ディリクレ配分法)

膨大なテキストデータから「隠れたテーマ(トピック)」を自動的に発見するための統計的手法で、データがどのトピックをどの程度含んでいるかを確率的に推定する


*4 ABDCランク

Australian Business Dean Council(オーストラリアビジネス学部長評議会)

ビジネス研究と学術における高い水準を提供するために設立され、ABDCジャーナルリストは、A*、A、B、Cの4段階に分類されている。研究者が論文掲載に適したジャーナルを特定するのに役立つ


・製品名および会社名などは、各社の商標または登録商標です