CH139

◆第139回 人文科学とコンピュータ研究発表会

主査: 堤智昭(筑波大学)
幹事: 橋本雄太(国立歴史民俗博物館)、小川潤(東京大学)、高田智和(国立国語研究所)李媛(京都大学)

情報処理学会人文科学とコンピュータ研究会(IPSJ SIG Computers and the Humanities)では、下記の通り第139回研究会発表会の開催を予定しております。歴史、地理、芸術、民俗、文学、言語、社会などなど、様々な人文科学の諸領域での情報資源の記録、蓄積、分析、提供や応用に関わる研究発表をお考えの方はぜひ奮ってご応募ください。

********************
 日時: 2025年8月3日(日)
 会場: シャトレーゼホテル談露館(山梨県甲府市丸の内1-19-16) 現地開催のみ
 発表申込締切: 2025年6月24日(火)6/17から延長しました
 原稿提出締切: 2025年7月8日(火)
********************
※参加申込みは、情報処理学会のマイページ(リンク)のメニュー「イベント一覧・申込」からお願いします。

参加費

参加費詳細はこちら

募集内容・発表要領

※全ての発表いずれも2~8pの予稿の提出が必要となります(この範囲であれば枚数は自由です)。
予稿のフォーマットは情報処理学会のページをご参照ください。

遠方からの発表学生への金銭的補助について

プログラム

2025年8月3日(日) 10:25~16:50  

 10:25-10:30

開会挨拶

 10:30-11:30

セッション1

 10:30-10:50

(1) 文章生成システムにおける感情遷移主導の物語生成手法とその評価

〇石原信也(岡山大学)

本研究は、大規模言語モデル(LLM)による物語生成の実現を目指し、ナラティブ性を誘導するプ ロンプト設計手法を提案する。従来の構造指示型による生成制御に対し、感情の遷移を主軸としたプ ロンプトを導入することで、構造的制御ではなく感情的展開に基づく物語生成の新たな制御軸を提示 ・評価するものである。ここでは従来の文章生成手法を概観しその特徴と限界を整理する。次に、感 情遷移を制御軸とする物語生成のために、典型的な感情変化パターンの分析を行い、それに基づいた プロンプトの概形を設計・提案する。評価実験では、構造指示型プロンプトと、提案する感情指示型 プロンプトの双方から短編物語を生成し、ナラティブ性に富んだ出力の割合を比較することで有効性 を検証した。感情遷移をプロンプト設計の中核に据える本手法はGPT以降の生成系研究における「出 力誘導の方向性」に新たな可能性を示すものである。

 10:50-11:10

(2) 年譜資料の構造化と可視化―森鷗外「抽斎年譜」を例に―

〇鈴置怜子(東京大学情報システム部)
・市太佐知(人間文化研究機構)
・西口真梨奈(東京都立中央図書館)
・福嶋彩乃(東京大学経済学図書館)
・星合耀子(国文学研究資料館)
・村田祐菜(国立国会図書館)
・吉村雄太(国立国会図書館)

本研究では東京大学総合図書館所蔵『抽斎年譜』を対象にTEIによるテキスト構造化手法の検討とビューワの構築による可視化をおこなった。『抽斎年譜』は森鷗外が小説『渋江抽斎』執筆のために抽斎の息子・渋江保に制作を依頼した年譜資料であり、編年体の『渋江抽斎』は本書に大きく依拠するとされる。朱筆や墨筆による書き込みや加筆・訂正のほか、鷗外本人による書き込みも存在する。加えて、抽斎の周辺人物に関する情報も多く含まれている。現在「鷗外文庫書入本画像データベース」でデジタル画像が公開されているが、このような資料の特徴をデジタルで十分に表現するために、TEIによるテキスト構造化と可視化の方法を検討した。デジタル源氏物語やNDL古典籍OCR-Liteなど図書館員の関わるDHの成果をふまえつつ、複数の図書館員による共同でのTEIマークアップの実践事例としての意義がある。

 11:10-11:30

(3) GemmaへLoRAを用いた太宰治の文章の生成について

○伊藤祥一朗(日本国際学園大学)
・山島一浩(日本国際学園大学)

太宰治の小説をAIに学習させて生成した文章が与える印象について研究する。方法として同じ作者 の文章と生成した文章が、読み手へどのような印象を与えるかを比較する。そして生成された文章が 同一作者の物と認識するのかについて研究する。AIについてはgoogle社の提供するgemmaへLoRAを用 いて学習させた。また学習基データは青空文庫より引用した。

 11:30-13:00

休憩

 13:00-14:00

セッション2

 13:00-13:20

(4) シェルフリーディングを自動化するためのプログラム制作の試み:AI-OCRを活用した大学図書館 の事例

〇金城沙弥香(慶應義塾大学大学院文学研究科)

本研究では,大量の学術書を取り扱う大学図書館において,シェルフリーディングの作業を自動化するためのプログラムの制作を試みた.通常,専門書を多く取り扱う大学図書館では,整理するべき資料が膨大なことに加えて,資料の分類が細分化されていることが,シェルフリーディングの作業をより複雑にしている.この作業には多くの人手が必要であり,その人件費は運営上の大きな負担となる.つまり,シェルフリーディングの作業を自動化することができれば,図書館の運営において利点が大きい.具体的な事例として,東京都内の某大学図書館を取り上げて,AI-OCR(光学式文字認識)を活用したシェルフリーディング自動化プログラムを制作し,提案する.

 13:20-13:40

(5) ネットワーク分析による日本美術作品の定量分析:浮世絵の創造性の変化

〇本那真一(北陸先端科学技術大学院大学)
・松井暉(神戸大学)

本研究は日本の伝統工芸品である浮世絵を対象としてネットワークモデルを用いながらその創造性を定量的分析を行う. 画像分類モデルである VGG モデルを利用して画像から特徴量を抽出し, 視覚的な特徴と画風をそれぞれ特徴量にして表現した 2 つのネットワークを作成する. ネットワーク分析では,新規性や後への影響度を計算する指標である破壊性指数を用いて, 浮世絵師や浮世絵の創造性を定量的に評価する. この分析によって, 視覚的な特徴を表現したネットワークでは破壊性指数が年代を経過するごとに減少する傾向にあるが, 画風の特徴を表現したネットワークでは破壊性指数は安定することが分かった. これは, 浮世絵の創造性が視覚的なイメージとして大局的には一見陳腐化しているように見えるが, 作者の画風や流派などの視点では創造性が発揮され続けたことを示唆している.

 13:40-14:00

(6) 文化多様性の検証に向けた家紋の計量分析の試み:形態情報のみに着目した探索的検討

〇市川千馬(北陸先端科学技術大学院大学)
・中分遥(北陸先端科学技術大学院大学)

本研究は、日本の家紋の意匠に表れる形態的傾向を定量的に分析し、その文化的背景の解明の足掛かりとして基礎的データを得ることを目的とする。従来の家紋研究では、系譜や記号論的分類に重きが置かれてきたが、意匠の選択に影響を与えた環境的・文化的要因を定量的に捉える試みは少ない。そこで本研究では、多様な家紋の画像を対象に、HOG(ヒストグラム・オブ・グラディエント)を用いて形態的特徴量を抽出し、主成分分析および階層的クラスタリングを実施した。その結果、形態的に類似する家紋が一定の視覚的パターンに基づいて分類される傾向が確認された。今後は、この分類結果を地域的・生態的・文化的文脈と照合し、家紋がどのような形態的選好や価値観のもとに生成・伝播してきたのかを多角的に検証していく予定である。

 14:00-14:15 

休憩

 14:15-15:20

セッション3

 14:15-14:40

(7) 遺伝的アルゴリズムによる通学区域の最適化

〇寺門宏倫(茨城県立伊奈特別支援学校)

遺伝的アルゴリズムの手法を用いて新設校を設置する際の最適な通学区域を推計する手法を提示する。

 14:40-15:00

(8) Markdownを用いた古典籍OCRテキストの簡易マークアップの試み

〇守岡知彦(国文学研究資料館)

NDL古典籍OCRの登場により日本の古典籍の全文画像を実用的な精度でテキストデータに変換することが可能となったが、平均すると10文字に1,2文字程度残る誤字を修正するためには構成作業やOCRの学習用データの管理等が必要であり、テキストデータの修正過程や関連データの管理を適切に行う上でGitのような分散版管理システムを利用することはとても重要であると言える。また、GitLabやGitHub等のGitリポジトリホスティングサービスにはMarkdownのレンダリング機能や編集機能がありIIIF Image APIを用いて原本画像のテキスト部分を切り出した画像と認識結果のテキストを並べて表示することが可能である。今回はGitLab Flavored Markdownを用いて行や注記関係等の情報を記載した簡易的アノテーションの試みについて報告する。

 15:00-15:20

(9) デジタルアーカイブ構築のためのボーンデジタルコンテンツの整理・選別支援手法のデザインと開 発

〇原田真喜子(都留文科大学地域交流研究センター/東京大学大学院情報学環)

フィールド・ミュージアムの諸活動において生成・蓄積されてきたボーンデジタルコンテンツ群から、デジタルアーカイブとして管理・公開対象とする資料を効率的に選定する手法のデザイン・開発とその実践について報告するものである。本研究ではPythonを用いてデータ抽出を自動化し、Excelでメタデータを管理するシステムを検討し実装する。さらに、植物の写真に属しては複数のAIを用いた学名判定システムを構築し、学名判定に要する時間を軽減する取り組みを行っている。本発表では、その設計思想、実装の概要、今後の展望について報告する。

 15:20-15:35 

休憩

 15:35-16:45

セッション4

 15:35-16:00

(10) 3Dモデル生成技術によるデジタルアーカイブの推進

〇中川源洋(株式会社ニコン)
・池田孝弘(株市会社ニコン)

近年,博物館法の改正を背景に,デジタルアーカイブへの関心が高まっている.デジタル化の手法としては,主に静止画や動画が用いられているが,これらは撮影時の視点に依存するため,立体物の情報が欠落するという課題がある.この課題を解決する手段として,対象物を三次元的に記録する3Dモデル生成技術の活用が進められている.筆者らは,静態および動態の対象物に対応した3D化技術の開発を進め,さまざまな対象物のデジタルアーカイブに応用してきた.筆者らはデジタルアーカイブに適した3Dスキャン技術を開発した.本システムは、短時間でのモデル生成が可能であり,利用者の経験やスキルに依存しないという特徴を有する.本報告では,当該技術の概要と得られたデータの活用事例について述べる.

 16:00-16:20

(11) 西浦田楽記録映像のWeb公開に向けた権利処理を考慮した映像公開管理システム

〇池田脩平(静岡大学大学院総合科学技術研究科)
・小林宥斗(静岡大学大学院総合科学技術研究科)
・前川朋輝(静岡大学大学院総合科学技術研究科)
・西尾典洋(静岡大学創造科学技術大学院/目白大学メディア学部)
・杉山岳弘(静岡大学創造科学技術大学院/静岡大学大学院総合科学技術研究科)

本稿では、重要無形民俗文化財「西浦の田楽」の演目を撮影した記録映像をWeb上で一般公開するために考案した、公開に関わる権利処理を考慮した映像公開管理システムを報告する。西浦の田楽は、47種類の演目が奉納され、毎年20人弱の能衆(出演者)によって演じられる。記録映像の一般公開にあたっては、別当(祭主)や能衆らの意向に柔軟に対応する必要がある。さらに、映像に映る人物の肖像権の処理もしくは配慮も必要となる。本研究室が保有する西浦の田楽に関連する映像データは7年分約670本にのぼり、これらに対する複合的な権利処理の状況を効率的に管理するため、システムを用いた公開管理を行う。具体的には、演目そのものの公開可否に関する祭主の判断および出演者の肖像権使用の許諾に関する権利処理の状況を整理・記録し、それに基づいてWeb上での映像公開の可否を制御する。非公開映像に対しては、外部からのアクセスを制限する。

 16:20-16:45

(12) 東アジアテキスト研究のためのデータモデル構築における現状と課題

〇永崎研宣(慶應義塾大学/一般財団法人人文情報学研究所)
・岡田一祐(慶應義塾大学)
・高須賀萌(慶應義塾大学)  

日本を含む東アジアのテキスト研究においては、データ形式の標準化が十分でなく、結果として、オープンサイエンスが求められる現状において、有効なデータの構築と共有が行えていないという状況がある。それを解決することを目標の一つとして掲げる文部科学省委託事業「人文学・社会科学のDX化に向けた研究開発推進事業」では、各地で構築されつつある東アジアテキストデータの構造化手法や教育カリキュラムについての調査と検討を進めつつある。本発表では、それを踏まえた現状と課題について報告する。

 16:45-16:50閉会

懇親会

お問い合わせ先

ch-madoguchi■jinmoncom.jp(@を■に変更しています)


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS