CH132

◆第132回 人文科学とコンピュータ研究発表会

主査: 橋本雄太(国立歴史民族博物館)
幹事: 耒代誠仁(桜美林大学)、小川潤(ROIS-CODH)、鈴木親彦(群馬県立女子大学)、吉賀夏子(大阪大学)

※重要・ご注意※
第132回研究会は、現地開催のみで実施することにいたしました。ただし、やむを得ない事情がある場合に限って、事前録画したビデオによる発表を認める予定です。詳細は「申込方法」をご覧ください。

情報処理学会人文科学とコンピュータ研究会(IPSJ SIG Computers and the Humanities)では、下記の通り第132回研究会発表会の開催を予定しております。歴史、地理、芸術、民俗、文学、言語、社会などなど、様々な人文科学の諸領域での情報資源の記録、蓄積、分析、提供や応用に関わる研究発表をお考えの方はぜひ奮ってご応募ください。

********************
 日時 2023年5月20日(土)
 会場 亜細亜大学(5号館2階523~526教室) 現地開催のみ
 発表申込締切 2023年4月6日(木) 締切厳守とする
 原稿提出締切 2023年4月20日(木)
********************

会場について

募集内容

※学生ポスターセッション/ロング/ショートいずれも2~8pの予稿の提出が必要となります(この範囲であれば枚数は自由です)。
※予稿のフォーマットは情報処理学会のページをご参照ください。

申込方法

参加費

研究会登録会員無料
学会正会員2750円
学会会員学生1100円
学会非会員学生1650円
非会員3850円

参加費詳細はこちら

遠方からの発表学生への金銭的補助について

プログラム

2023年5月20日(土)10:25~17:15

10:25-10:30 開会挨拶

10:30-12:00 セッション1

10:30-10:50
(1) テキストマイニングを用いた北魏墓誌におけるジェンダーステレオタイプの研究

 ○大知聖子(名城大学)

 近年、テキストマイニングを用いた人文学研究は増加しているが、中国古代史の分野では研究が少ない。その理由は、既存の分析ツールをそのまま使って古典中国語(漢文)を扱えないからである。そこで私はKH Coderでオリジナル辞書を登録したMeCabを使うことで、漢文のテキストマイニングの分析を可能にした。 具体的には、中国の北魏王朝における出土資料である墓誌を用い、男女の墓誌でどのような語句が使われているかを検討した。分析対象は墓誌の中でも銘辞という漢詩の部分に特に注目した。なぜなら、銘辞はすべて1句4文字で構成されており、古典中国語を分析するのに適した構成だからである。 本報告では計454件の北魏墓誌の銘辞を扱い、二字熟語として19339語の単語を抽出した。その二字熟語の類似性をChinese Text Projectを使いネットワーク図で示した結果、男女で明確に異なる語彙を用いていることが判明した。また、200字のワードクラウドを男女別に分けるとより差が明確になった。男性は北魏王朝への軍事的・政治的貢献について賞賛する語句が顕著であった。例えば「哲人」「良木」「良人」「君子」という単語がある。 女性は嫁ぎ先の家庭で夫の父母に奉仕することが賞賛されていた。例えば「四徳」「六行」「女儀」「慎終」という単語がある。次に顕著な特徴として、美しい容貌が賞賛されていた。例えば「蘭蕙」「窈窕」という単語がある。この結果は『魏書』という正史に記された女性の実態とは異なる。『魏書』では実家が有力な女性は嫁ぎ先でも強い権力を持っている。したがって、北魏墓誌では王朝側が理想とした女性のジェンダー規範を描写していると考えられる。 この研究は、古典中国語でも辞書を工夫することによってテキストマイニングが可能になる道を開くものである。従来の研究では漢文を精読することが重要視されていたが、この研究により数量的研究の実用化についても議論する契機となるに違いない。

10:50-11:15
(2) 日本古典籍における校異情報の構造化 -『伊曽保物語』のTEIマークアップを事例として-

 ○李澤珍(国文学研究資料館)

 校異とは同じ内容の諸本を比較し、その本文間の異同を記すことである。日本古典籍を対象とした校異は、これまでその殆どが紙面上で行われてきたが、近年デジタル化の進展に伴う研究環境の変化に応じて、校異とはいかにあるべきかをあらためて考えることが求められている。本稿では、従来の紙面における校異の状況を踏まえながら、デジタル環境における校異の手法について検討する。具体的には、欧文イソップ寓話集の日本語訳本『伊曽保物語』を事例として、TEI ガイドラインに準拠した諸本の校異情報マークアップの一案を提示する。

11:15-11:35
(3) 条件付きCycleGANを用いた劣化くずし字の修復に関する試み

 ○金子隼大(立命館大学院理工学研究科)
  ・石橋龍人(立命館大学院理工学研究科)
  ・孟林(立命館大学院理工学研究科)

 日本古典籍は、文学的に優れた書物である同時に、当時の政治や暮らしを記した歴史的価値を有する文化財である。古典籍は、くずし字と呼ばれる、現代では解読困難な形態の文字で書き表されているため、光学文字認識(OCR)を用いた解析が盛んである。しかし、長い年月を経て、文字の劣化が生じており、可読性を損なわせるとともに、文化財である古典籍の部分的な消失を引き起こしている。本研究では、深層学習の画像生成モデルである、敵対的生成ネットーク(GANs)の一種のCycleGANを用いた劣化修復の一環として、条件付きCycleGANによる劣化修復を試みる。その結果、3種類の分類器において、合わせて1.97%の劣化文字の正解率向上を達成した。

11:35-12:00
(4) 題詠表現に着目した中世歌合の構造化と提示手法に関する試み―建仁元年『石清水社歌合』を事例として―

 ○幾浦裕之(国文学研究資料館)
  ・永崎研宣(人文情報学研究所)
  ・加藤弓枝(名古屋市立大学)

 日本古典文学資料において、和歌は『源氏物語』とともに最も早くから本文のデジタル化が進んだジャンルである。しかし作品本文の表示方法や検索機能が固定して利用されつづけており、研究者の読解や異文情報をデジタルテキストとして記述する方法も未だ模索されていない。本発表では勅撰和歌集とともに約1100年の長い歴史をもつ、歌合(うたあわせ)という和歌の優劣を競う作品形態を、TEI/XML形式でマークアップする方法について提示する。具体的には中世和歌のひとつの到達点とされる『新古今和歌集』が成立した13世紀初頭の成立の『石清水社歌合』を対象とする。中世和歌の基本的な創作方法である題詠(だいえい)の表現形式をマークアップし、マークアップによって和歌作品の読解を深め、可視化し、デジタルテキストとして残すことができる方法を提案する。

12:00-13:30 休憩

13:30-15:30 学生ポスターセッション

(13:30-14:00 ショートプレゼンテーション)  

(5) 自閉スペクトラム特性の強いヒトと機械学習のカテゴリ化における類似点の検討

 ○岩淵汐音(千葉大学大学院松香研究室)

申請者はヒトと機械学習それぞれのカテゴリ化について、特に自閉スペクトラム特性の強いヒトと機械学習のカテゴリ分類における類似点から話したい。 ヒトが知覚したものをカテゴリに分類する際の処理方法はさまざまである。その処理の中でも、今回は典型例を利用する例について話したい。また、発達障害の一つである自閉スペクトラム症では情報を集約する機能が弱い「弱い全体統合」が見られる。なお、近年認知科学では自閉スペクトラム症に見られる特性を認知の個人差の一つとして扱う考えが広がっている(自閉スペクトラム特性)。この自閉スペクトラム特性がつよいヒトだが情報を集約する機能が弱いゆえに典型例を利用するカテゴリ化において不得意が見られるといわれている。これは一部の機械学習でも見られることではないだろうか。申請者は自閉スペクトラム特性の強さと典型例を利用するカテゴリ化の関係について現在の研究を述べたうえで、機械学習との比較という今後の展望を述べる。

(6) ブロックチェーンに基づく文献目録共有システムの開発

 ○磨有祐実(大阪大学大学院情報科学研究科)
  ・山田憲嗣(大阪大学大学院情報科学研究科)
  ・中山文(神戸学院大学人文学部)
  ・谷田純(大阪大学大学院情報科学研究科)

 本研究では、人文学分野における文献情報を有効活用する新たな手法として、ブロックチェーンに基づく人文情報活用システムを提案し、その有効性を明らかにする。具体的な実験システムとして、概念を明確にし、実装上の課題を明らかにするため、文献情報共有システムを開発した。システムは、Webフロントエンド、スマートコントラクト、The Graphにより実装され、プライベートネットワークにおける運用によって動作確認と性能評価を行った。非集権管理、低コスト、ゼロダウンタイムなどの特徴により、新たな人文情報活用手法として有効な手法と考えられる。

(7) 現代中国の抗日アニメーションにおける日本人のイメージ ―KH Coderによる登場人物のセリフ分析からの考察―

 ○高野かずみ(岡山大学)

 中国における抗日アニメーションには日本人キャラクターが必ず登場するが、ある種のステレオタイプ的イメージに固定される傾向にある。本調査の目的は、中国人に根付く日本人イメージの一端をセリフから抽出し、その特徴と傾向、表現の意図を分析することである。分析の結果、抗日アニメーションにおける日本人とは侵略者としての日本軍という悪のイメージを有していることが推測された。

(8) 『十番虫合絵巻』ビューワの開発―TEIを用いた和歌文学資料のマークアップを通じて―

 ○藤原静香(京都女子大学大学院/京都産業大学)
  ・幾浦裕之(国文学研究資料館)
  ・永崎研宣(人文情報学研究所)
  ・盛田帝子(京都産業大学)
  ・飯倉洋一(大阪大学)
  ・松本大(関西大学))

現在、『十番虫合絵巻』(ホノルル美術館蔵)について、研究会による注釈作業とTEIを用いたテキストデータの構造化が進められている。その成果として開発を行ったビューワは、TEIによるマークアップを利用して絵巻物の画像とテキストデータの情報を同時に表示・比較することを可能とし、歌合資料の新たな公開手段を提案するものである。本発表では、ビューワの仕様と活用方法を提示するとともに、和歌文学資料TEI化の一例として『十番虫合絵巻』のマークアップについて検討したい。

(9) モデル構築のための因子分析-環境配慮行動の規定要因に関する研究を題材として

 ○石井康平(千葉大学大学院人文公共学府公共社会科学専攻公共学コース)

 発表者は、霞ヶ浦流域住民に対する質問紙調査をもとに、住民の環境配慮行動について、その規定要因の関係性を構造的に示すことを、修士論文の研究課題としている。環境配慮行動に関する先行研究では、分析手法として、観測変数だけでなく、潜在変数も含めてモデルを構築する共分散構造分析が用いられる。この共分散構造分析は、モデル構築の前段階として、観測変数から潜在変数を導く因子分析を行うこともあり、因子分析の精度が重要な要素となる。そこで、本発表では、この規定要因の連関を分析する上で、モデル構築の基礎となる因子分析について、そのあり方を考察する。具体的には、本発表での因子分析の結果と先行研究を比較することや、質問紙の構成と因子分析の結果との関係性を検討することを通して考察していく。

(10) Music Encoding Initiativeを用いた雅楽譜翻訳の実践 ― 分業可能な邦楽譜のデジタル翻訳を目指して

 ○関慎太朗(東京大学大学院人文社会系研究科)
  ・大向一輝(東京大学大学院人文社会系研究科)

現在利用されている楽譜符号化技術の多くは五線譜の記述を基礎に開発されており、音楽文化全体の多様性を十分に反映できているとは言い難い。本研究は雅楽譜の五線譜化に取り組んだ先行研究を参照し、漢字と仮名を用いる雅楽譜の記述のみから読み取り可能な情報と一定の解釈や口伝による稽古によってもたらされる情報の切り分けを行い、Music Encoding Initiative (MEI)を用いた雅楽譜のデジタル翻訳手法を提案する。また、原資料の記述内容に応じてプロセスを切り分けることで、作業全体の分業が可能なワークフローについて検討する。

(11) IIIFを利用した非文字資料・文字資料の比較分析

 ○小野寺華子(千葉大学)

 江戸時代後期に盛岡藩で誕生した田山暦(南部絵暦、盲暦)は、絵暦という特徴から暦注の読み解きが研究の中心となってきた。本研究では田山暦を作る際に参考にしていたとされる伊勢暦を用いて、2つの天明3年田山暦(岩手県立博物館版、蛇足庵本版)と同年伊勢暦、天明7年田山暦と同年伊勢暦をそれぞれIIIF Curation Viewer上で比較していき、田山暦に採用されなかった暦注から法則性を見出せないかどうかを検討していく。また、天明3年と天明7年の田山暦における暦注の描かれ方の変化についても考察していく。

(12) 仏教の伝統的知識体系の構造化に向けて:日本の漢訳経典注釈書に対するマークアップについての一試論

 ○佐久間祐惟(東京大学大学院)
  ・永崎研宣(人文情報学研究所)
  ・左藤仁宏(東京大学大学院)
  ・村瀬友洋(大蔵経研究推進会議)
  ・下田正弘(武蔵野大学)

 本発表は、漢訳経典の注釈書をいかにTEIガイドラインに準拠しつつ構造化するか、という問題について、漢訳『楞伽経』(四巻本)に対して日本中世の虎関師錬が著した注釈書『仏語心論』を例として検討する。『仏語心論』は、その段落分けが今なおそのまま利用されるなど、現在の『楞伽経』研究においても参照される重要な文献である。ところが、(1)経典本文、(2)注釈範囲指定箇所、そして(3)実際の語義・意味の説明という三つの要素が離れて存在する当該文献の注釈は、一見しただけでは経典部分と注釈箇所の対応関係が不明瞭である。今回は、テキストの視認性を向上させ、研究の利便性を高めるための試みとして、<seg>を用いた『仏語心論』のマークアップを検討する。

(13) モーションキャプチャデータを活用した日本舞踊のVR学習支援システム

 ○横山大貴(立命館大学)
  ・李亮(立命館大学)
  ・長谷川恭子(立命館大学)
  ・鹿内菜穂(亜細亜大学)
  ・田中覚(立命館大学)

 近年では歴史的に重要な文化財をデジタルデータ化し保存するデジタルアーカイブという取り組みが行われている。舞踊や演劇など無形文化財の多くは人から人へ伝承されてきため世代の移り変わりとともに異なる内容が伝えられる事がある。よって、デジタルアーカイブにより無形文化財のその時その瞬間のありのままを、かつ膨大な情報量を保存することが可能であり、その活用範囲は広い。伝統芸能のどの分野においても後継者不足といった問題があることから、本研究では、日本の伝統的な舞踊である日本舞踊に着目し、光学式モーションキャプチャで得られた高精度なモーションデータを用いて、教育や後継者の育成のためのVR学習支援システムの作成をした。

(14) 現代日本の歌謡曲における「祈り」を対象とした計量テキスト分析

 ○和田理恵(東京大学大学院人文社会系研究科基礎文化研究専攻宗教学宗教史学専門分野博士課程)
  ・阿達藍留(東京大学大学院人文社会系研究科文化資源学研究専攻文化資源学専門分野修士課程)

 本研究では、現代日本の歌謡曲の歌詞にあらわれる「祈り」の形態を明らかにするために、KH Coderを用いた計量テキスト分析を行った。32万曲以上のデータから取得した、「祈」を含む11070曲の歌詞の中から、大衆の受容の要素を加味するために作成したCD等の売上上位曲、紅白歌合戦出場曲などのリストとマッチした3738曲のデータを分析に用いた。年代ごとの特徴語や「祈」との共起語から、それぞれの年代における歌詞の中の「祈り」の形態を明らかにした。

(15) 訓点資料画像の文字位置検出と訓点資料データベースへの追加

 ○苫米地康太(岐阜工業高等専門学校)
  ・田島孝治(岐阜工業高等専門学校)

 漢文に語順や送り仮名、読み方などの注釈を、文字や記号で付与し、日本語として理解しやすくした資料を訓点資料と呼ぶ。これまでに資料に付与されたヲコト点などの加点情報を電子化する手法を検討し、訓点のデータベースを構築してきた。しかし、現在のデータベースで検索結果として得られるのは、文字の出現位置や、存在するページ全体の写真であり、文字毎の画像を得ることはできない。このため、特定の文字に付与された訓点を比較するなどの処理は難しかった。まず、文字単位での画像を切り出すため、翻刻データを用いて行内の文字数や割注の位置を概算し、さらに文字の連続領域を切り出すことで、領域の始点座標、終点座標(右下の座標)、幅、高さを検出した。さらに、IIIF Curation Viewerの部分矩形領域指定機能を利用し切り出し用URLを用意することで、データベースに画像を埋め込んだ。

15:30-15:40 休憩

15:40-16:45 セッション2

15:40-16:00
(16) 小泉八雲の未完小説「茶碗の中」の計量的な考察

 ○山田峰大(放送大学大学院文化科学研究科)

 小泉八雲の「茶碗の中」は小説内の物語部分が文章の途中で突然途切れており未完としての体裁を取っている。これが作者の演出によるものなのか、本当に未完のものであるかを計量的な観点から考察する。

16:00-16:25
(17) 日本古典籍のテキスト化への取り組み――『羇旅漫録』を素材として――

 ○松田訓典(国文学研究資料館)
  ・高須賀萌(総合研究大学院大学 博士後期課程)
  ・木越俊介(国文学研究資料館)

国文学研究資料館では計画中の「データ駆動による課題解決型人文学の創成」の基盤の一つとして、日本古典籍のテキストデータインフラストラクチャの構築を計画している。本発表ではその構築へのケーススタディの一つとして『羇旅漫録』という紀行文を素材とし、TEIガイドラインに準じた電子化とその活用に向けての模索について報告を行う。

16:25-16:45
(18) 古典的な可読性指標の言語モデル複雑性としての解釈と多言語可読性指標等への応用

 ○江原遥(東京学芸大学)

 Flesch-Kincaid Gradel Level (FKGL)などの、テキストの読みやすさ(可読性)を計測するための古典的な可読性指標は、英語の可読性評価において広く用いられ、人文科学においても多用されてきた。しかし、それらの中では一文あたりの平均単語数などの、いかにも英語という特定言語だけに依存するように見えるヒューリスティックな式が用いられていた。このため、例えば、FKGLの他言語版などに実験的な有用性だけではなく理論的な意味づけを与えることや、指標の値を言語間で比較することが難しかった。一方、近年の計算言語学では大規模言語モデルの研究が進み、テキストの難しさ(複雑性)を表す指標も、パープレキシティなどの言語モデルから算出される指標を用いることで、特定の言語に依存しない形でテキストの複雑性を表現できる。本研究では、古典的な可読性指標の式に対して、ある簡単な言語モデルの複雑性としての解釈を与える。この解釈により、例えばFKGLの日本語版など、古典的な可読性指標の他言語への拡張に理論的な意味付けを与えることが可能となり、可読性指標の他言語化などに応用できる事を示す。本研究は、言語依存のヒューリスティクスに依存していた従来の可読性指標の再構築に向けた、重要な一歩と位置付けられる。

16:55-17:15 閉会

情報交換会

お問い合わせ先

ch-madoguchi■jinmoncom.jp(@を■に変更しています)


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS