主査: 橋本雄太(国立歴史民俗博物館)
幹事: 耒代誠仁(桜美林大学)、小川潤(ROIS-CODH)、鈴木親彦(群馬県立女子大学)、吉賀夏子(大阪大学)
情報処理学会人文科学とコンピュータ研究会(IPSJ SIG Computers and the Humanities)では、下記の通り第135回研究会発表会の開催を予定しております。歴史、地理、芸術、民俗、文学、言語、社会などなど、様々な人文科学の諸領域での情報資源の記録、蓄積、分析、提供や応用に関わる研究発表をお考えの方はぜひ奮ってご応募ください。
********************
日時 2024年7月26日(金) 9:00~12:00
会場 国際日本文化研究センター 日文研セミナー室1(アクセス)
共催 国際日本文化研究センター・高麗大学校人文社会デジタル融合人材養成事業団・人間文化研究機構DH推進室
※公共交通機関を利用の場合は、桂川駅・京都駅からのバス時刻表の確認をお勧めいたします。
発表申込締切 2024年6月21日(金)
原稿提出締切 2024年7月4日(木)
********************
研究会申し込みページがオープンしました。情報処理学会のマイページ(リンク)→会員メニュー→イベント一覧・申込から参加申込みをお願いします。
CH136の終了後、同会場で下記のイベントが開催されます。
研究会登録会員 | 無料 |
学会正会員 | 2750円 |
学会会員学生 | 1100円 |
学会非会員学生 | 1650円 |
非会員 | 3850円 |
参加費詳細はこちら
今回の発表会は国際日本文化研究センター・高麗大学校人文社会デジタル融合人材養成事業団・人間文化研究機構 DH 推進室と共同開催で、高麗大学生も聴講参加可能です。
可能な場合、発表スライド・予稿を日英併記にしていただくと、聴講者の理解の助けとなります。
※2~8pの予稿の提出が必要となります(この範囲であれば枚数は自由です)。
※予稿のフォーマットは情報処理学会のページをご参照ください。
※今回は一般口頭発表のみの募集と致します。
2024年7月26日(金) 9:00~12:00
9:00-9:10 開会挨拶
9:10-10:10 セッション1
9:10-9:30
(1) ゲームクレジットのTEIエンコーディングとメタデータ生成の試み
○福田 一史(立命館大学)
ゲームの創作は映画などと同様に多くのスタッフが関わる点に特徴がある。その情報源として、ゲームクレジットに研究的興味が集まりつつありSvelch(2021)などすでにいくつかの先行研究がある。クレジットを持続的かつ再帰的にデータ化する枠組みを構築することで、ゲームならではの特徴を踏まえた分析環境が提供できると考えられる。 すでに、ゲームクレジットのメタデータ生成の先行事例として、IGDBやMobyGamesなどがある。またクレジットテキストの書き起こしサービスも存在する。ただしメタデータ先行生成には役割解釈がブラックボックス化する課題があり、一方書き起こしはデータ処理の課題や記述ルールの不統一などの課題がある。 本研究ではこれらを踏まえ、出典を参照可能で再帰性の高いTEIに対応したゲームクレジットテキストデータベースの構築を指向し、とりわけクレジットテキスト書き起こしとそのTEIエンコーディング及びそれを用いたメタデータ生成の方法論について検討する。具体的には、主要なクレジット表示パターンを抽出及び要件化し、事例の記述を通じたTEIのゲームクレジットにおける記述ポテンシャルを評価する。その上で、生成されたメタデータの品質と本枠組みの妥当性を検証する。
9:30-9:50
(2) A Novel Dataset Development Method for Evaluating Sentiment Recognition Bias of Large Language Models in Conflict Structures
○井下 敬翔(滋賀大学大学院データサイエンス研究科)
The rapid advancement of AI has enabled Large Language Models (LLMs) to acquire vast knowledge from extensive text data, making them versatile for various tasks. However, LLMs also inherit biases from their training data, leading to discriminatory behaviors towards attributes like gender, race, and political ideologies. This is particularly concerning in national security, where sentiment bias towards specific countries can cause significant issues. Existing methods for evaluating these biases face challenges. This study proposes a novel method using tweet data from the Ukraine-Russia war, involving automated sentiment labeling and anonymization by LLMs to create accurate datasets. Results show that the proposed method effectively evaluates LLM sentiment biases across different conflict structures. In conclusion, this study introduces an effective method for assessing LLM biases and emphasizes the need for future research to develop larger datasets and improve anonymization techniques.
9:50-10:10
(3) 古事類苑と和歌の引用関係を考慮した知識グラフ構築
○上松 大輝(総合研究大学院大学)
・武田 英明(国立情報学研究所)
・山田 奨治(国際日本文化研究センター)
・相田 満(日本女子大学)本研究では,明治期に編纂された百科史料事典である「古事類苑」と,古事類苑内で引用,参照される和歌の関係をモデル化し,知識グラフを構築した.. 古事類苑には,部,門,項とインデックスが設定されており,さまざまなことがらの説明と引用書や参考資料の情報が記載されている. 各インデックスとことがら,および引用書と参考資料の関係性を整理し,古事類苑に合わせたRDFの構造を定義したのち,まずは天部のRDF化を行なった. また,古事類苑に記載されていることがらは,さまざまな文献や史料を引用,参照して情報が記述されており,文献名や資料の一部が引用として記載されている. 古事類苑を知識グラフかすることで,引用,参照関係をもとにさまざまな史料と接続して活用することが可能となる. しかしながら,引用箇所を示すことが可能な形式で公開されている和歌集や史料は数少ない. そこで本研究では,古事類苑の構造化と引用,参照文献のうち和歌集を対象に構造のモデル化と知識グラフの構築を行う.
10:10-10:30 休憩
10:30-11:30 セッション2
10:30-10:50
(4) IIIF Tsukushi Viewer:日本古典籍へのアクセス性を向上させる生成AIチャット機能
○北本 朝展(ROIS-DS人文学オープンデータ共同利用センター/国立情報学研究所)
・本間 淳(フェリックス・スタイル)
・カラーヌワット タリン(Sakana AI)
大規模言語モデル(LLM)やビジョン言語モデル(VLM)などの生成AIモデルが学術研究の方法論を変革しつつある。IIIF Tsukushi Viewerは、そうした生成AIモデルを日本古典籍に関するチャットに導入し、日本古典籍へのアクセス性向上を目指すソフトウェアである。この機能を実現するために、AIくずし字認識や埋め込みベクトルなどを活用したテキストデータベースの構築、日本古典籍を対象としたAIチャット機能の設計、IIIFの世界と生成AIを接続するIIIF Tsukushi Viewerの実装など、いくつかの技術的課題に取り組み、3000点以上の日本古典籍を対象としたシステムを試作した。
10:50-11:10(5) 帝国議会議事速記録のテキストデータ作成に向けたテキスト修正支援ツールの開発
○北野 勇太(北海道大学大学院情報科学院)
・横山 想一郎(北海道大学大学院情報科学研究院)
・山下 倫央(北海道大学大学院情報科学研究院)
・川村 秀憲(北海道大学大学院情報科学研究院)
・伊藤 孝行(北海道大学大学院メディア・コミュニケーション研究院)
明治憲法下の国会である帝国議会議事速記録をコーパス化するために、国立国会図書館の提供するOCR技術「NDLOCR」を使用し、約90%の精度で画像データからテキストデータの変換が可能となっているが、内容の分析にさらなる精度向上が求められている。この問題に対して、テキストデータ修正支援システム「ハルニレ」を開発し、NDLOCRの認識対象となった画像データと文字認識の結果であるテキストを同時に表示し、ユーザがNDLOCRの文字認識結果を容易に確認・修正することが可能とした。本稿では、ハルニレを利用結果からNDLOCRの文字認識の精度やハルニレを用いた誤認識修正の作業効率を算出し、ハルニレがもたらす修正作業の効率化の効果を評価する。
11:10-11:30(5) 郷土料理継承のためのユーザー参加型レシピ生成システムの試作
○河村 郁江(名古屋産業大学)
郷土料理は地域の特色や文化を反映する重要な遺産の一つである。しかし、調理や素材の入手の手間から、現代では作る人が減少し、その継承が困難になっている。本研究では、郷土料理の継承を目的としてユーザー参加型のレシピ生成システムを試作した。本システムは、既存の郷土料理レシピを基に生成AIを用いてユーザーの要望に応じた新しいレシピを作成する。ユーザーが要望作成や生成レシピの評価を通して、郷土料理を再認識することを目指している。評価の結果、ユーザーの75%がシステムを通じて郷土料理について学べたと回答した。一方で、要望に合ったレシピであるという回答は59%、郷土料理らしさが残っているという回答は58%であった。今回は郷土料理について学び考えることを主軸として進めたが、生成レシピの精度についても検討を進めたい。
11:30-12:00 閉会
日時: 7月26日 18:45〜(終了は20:30頃を予定)
場所:国際日本文化研究センター 中庭
申込締切:2024年7月10日(水)
申し込みフォームはこちらから
ch-madoguchi■jinmoncom.jp(@を■に変更しています)