主査: 橋本雄太(国立歴史民俗博物館)
幹事: 耒代誠仁(桜美林大学)、小川潤(ROIS-CODH)、鈴木親彦(群馬県立女子大学)、吉賀夏子(大阪大学)
情報処理学会人文科学とコンピュータ研究会(IPSJ SIG Computers and the Humanities)では、下記の通り第133回研究会発表会の開催を予定しております。歴史、地理、芸術、民俗、文学、言語、社会などなど、様々な人文科学の諸領域での情報資源の記録、蓄積、分析、提供や応用に関わる研究発表をお考えの方はぜひ奮ってご応募ください。
********************
日時 2023年9月30日(土)
会場 岡山大学 津島キャンパス 文法経講義棟(N4) 10番および11番教室(リンク) 現地開催のみ
※会場のN4棟へは、「岡山駅」西口バスターミナル22番乗り場からバスで「岡大西門」が最も早くて安くて楽です。(リンク)
発表申込締切 2023年8月18日(金) 締切厳守 (締め切りを延長しています)
原稿提出締切 2023年9月7日(木)
********************
1. 情報処理学会のマイページ(リンク)から参加申込みをお願いします。(現地では受付できません。研究会開催日の10日前頃から参加申し込みリンクが設置されます。)
2. 今回は、懇親会参加についても、「9月21日」までに「(リンク)」から参加可否を入力いただきますようご協力お願いします。
※ロング/ショートいずれも2~8pの予稿の提出が必要となります(この範囲であれば枚数は自由です)。
※予稿のフォーマットは情報処理学会のページをご参照ください。
※今回は一般口頭発表のみの募集と致します。
研究会登録会員 | 無料 |
学会正会員 | 2750円 |
学会会員学生 | 1100円 |
学会非会員学生 | 1650円 |
非会員 | 3850円 |
参加費詳細はこちら
【補足】 研究会への参加申し込みは、通常研究会開催10日前から研究会当日まで情報処理学会の「マイページ」で受け付けています。各自でご登録よろしくおねがいします。
2023年2023年9月30日(土)
10:00-10:10
開会挨拶
10:10-11:30
セッション1
10:10-10:30
(1) 古日記天候記録を用いた夏季気温変動の復元と樹木年輪セルロースの酸素同位体比との比較
○吉田史織(お茶の水女子大学)・神山翼(お茶の水女子大学)
気象観測データが存在する以前の気候変動を復元する試みとして,古日記に記された天候記録の中の晴天日数や降水日数に基づいた気温変動の復元といった研究が今までになされている.また,樹木年輪に含まれるセルロースの酸素同位体比は,樹木の成長する時期である夏季の降水量や気温と相関を持つことが示されている.本研究では,先行研究の手法に基づき,一部の地域における夏季の月平均日最高気温を推定し,年輪セルロース酸素同位体比の気候成分と比較することでその信頼性について議論することを目標とする.
10:30-10:50
(2) 北上川舟運に関する時空間データベース構築の一検討
○阿部昭博(岩手県立大学)
北上川の舟運は,江戸時代から鉄道の開通する明治時代の半ばにかけて,米を主とする物資輸送や交通を長く支えていたが,その実態はあまり明らかではない.本研究では,北上川舟運に関する時空間データベースの構築法とその活用方法を明らかにし,地域史としての舟運の解明と伝承に資することを目的とする.具体的には,北上川舟運の盛岡藩領における中継地として栄え,江戸期の舟運実態に関する歴史史料の収集や調査が他地域よりも活発な黒沢尻河岸(現北上市)に着目し,北上市立博物館と連携のもと実施する.本稿では,GISを用いた時空間データベース構築に向けた基礎的な検討状況について報告する.
10:50-11:10
(3) GPT-3.5を用いた架空の郷土料理レシピ生成のための郷土料理知識データの調整
○河村郁江(名古屋産業大学/名古屋工業大学 大学院工学研究科 情報工学類) ・白松俊(名古屋工業大学 大学院工学研究科 情報工学類)
地域の特色や食文化を生かした新しい郷土料理のレシピは,地域資源の有効活用や関心の向上を促し,地域の活性化に寄与する可能性がある.本研究ではそのような効果を狙い,架空の郷土料理レシピ生成アプリを開発する.このアプリでは,GPT-3.5に郷土料理の専門知識を与えるためLlamaIndexを活用する. しかし,専門知識をLlamaIndexで与えるだけでは,生成されるレシピの適切性が保証されないという課題が明らかになった.その原因は, 地名の認識やLlamaIndexの回答の正確性に関連しており,それを解決するための改善策として,知識データの更新、ユーザーインターフェースの改善,およびLlamaIndexのプロンプト改善を行った.また,システムの改善前と改善後の生成するレシピの比較を行い考察した.
11:10-11:30
(4) モーションアーカイブと機械学習を用いた琉球舞踊の姿勢判別と精度検証
○阪口直樹(龍谷大学大学院理工学研究科)・曽我麻佐子(龍谷大学先端理工学部)
本研究では,これまでにモーションキャプチャで取得した舞踊のモーションデータを活用するため,舞踊の知識がなくても容易に舞踊の分類を可能にすることを目的としている.そこで,琉球舞踊のモーションアーカイブと機械学習を用いて男踊りと女踊りの姿勢判別を試みた.特徴量としてモーションデータから得られる関節の位置情報と角度情報を使用し,琉球舞踊の作品と基本動作の一部から特徴的な姿勢を抽出して学習済みモデルを作成した.判別結果の精度を検証するため,学習済みモデルでの判別結果とプロの舞踊家に判別してもらった結果との比較を行った.
11:30-13:00
休憩
13:00-14:10
セッション2
13:00-13:25
(5) 東アジア古典籍のための動的なデジタル学術編集版の構築
○永崎研宣(一般財団法人人文情報学研究所)
日本の含む東アジア古典籍のデジタル学術編集版の構築は,それらの資料を対象とする様々な研究分野にとって重要な課題である.本発表では,国立国会図書館が近年公開した古典籍用OCRによって生成したシステムとテキスト差分比較プログラムを用いることで,動的なシステムとしてこれが構築可能であることを示す.
13:25-13:50
(6) JSON-LD を用いた古字書注文構造化の試み
○守岡知彦(国文学研究資料館))
古辞書の注文をその指示対象である文字に関する知識の意味グラフと紐づける場合,注文のテキストの構造化が必要である.通常,こうした構造化は TEI 等でのマークアップによって行われるが,これを丸ごと RDF の世界に持っていくためにはなんらかの工夫が必要である.そこで,HDIC の注文テキストを構造化した上で CHISE 文字オントロジーに取り込むことを目的に RDF のシリアル化形式の一つである JSON-LD を用いた古辞書注文マークアップのための形式を試作し,実際に大広益会玉篇(宋本玉篇; HDIC-SYP)の注文の構造化を行なった.
13:50-14:10
(7) デジタルサンスクリット辞書によって追加学習された大規模言語モデルを用いたサンスクリット辞書の横断検索
○塚越柚季(東京大学大学院人文社会系研究科)
Cologne Digital Sanskrit Dictionaries(以下,CDSD)には数々のサンスクリット辞書が収録されている.現在,CDSD のサービスでは横断検索は実装されておらず,その実現に向けて研究がなされている.この CDSD ではデジタル辞書が XML 形式に似た形式で構築されている.本研究では,そのような辞書データを用いて大規模言語モデルに追加学習を行い,サンスクリット単語に対する辞書的な意味記述を行えるようにし,CDSD 収録のサンスクリット英語辞書を対象とした擬似的な横断検索を実現させる.これにより,複雑なサンスクリットの意味や用法を迅速に理解する手助けが期待される.具体的な手法は次の通りである.大規模言語モデルである Llama 2 を活用し,CDSD 収録辞書が持つサンスクリットの見出し語の意味を問いかけ,CDSL辞書から得られた辞書記述を生成するように学習を行う.また,この学習には LoRA(Low-Rank Adaptation)手法を用いる.その結果として得られるモデルは,サンスクリット単語の意味を問いかけられたとき,辞書の記述に近いトークンを生成できるようになる.
14:10-14:30
休憩
14:30-16:30
企画セッション:東洋史研究におけるDH
14:30-14:35
趣旨説明
14:35-15:20
(8)KH CorderおよびChineseTextProjectの分析ツールを用いた漢文テキストマイニング-北魏墓誌銘辞を実例として
〇大知聖子(名城大学)
テキストマイニングとは、統計的にテキストを分析する手法である。本報告ではまず、東洋史研究におけるテキストマイニングを応用した研究の現状および課題について紹介する。次に、報告者が北魏墓誌の銘辞という韻文形式の古典中国語に対して、KH CorderおよびChineseTextProjectの分析ツールを用いて漢文テキストマイニングを行った研究の実例を紹介する。具体的には、テキスト間の類似度の分析・語の共起ネットワーク分析・対応分析などのやり方を示す。
15:20-16:05
(9)古漢字情報をコンピュータで扱うために
〇片倉峻平(東京文化財研究所)
近年発見の続く戦国時代の竹簡出土資料は、貴重な一次資料として多くの古代中国研究者に重視されており、その効果的な利用のためには画像やテキスト情報のデジタル化が求められる。一方でその文章は今の我々の用いる漢字とは性質の異なる古漢字で書かれており、テキストデータとして記述する際には工夫が必要となる。今回は出土資料上の古漢字情報のテキストデータ化について、その記述案を紹介しつつ議論したい。
16:05-16:30
質疑応答
16:30-16:45
閉会
ch-madoguchi■jinmoncom.jp(@を■に変更しています)