いつかの日報。

Asuka Ishii
Jan 20, 2021

Asuka Ishii and members of “Daily Report.”

作品について

作者の石井が所属する「日報。」というライングループは、メンバーの日記を共有するための場所である。「日報。」には石井を含め高校の同級生5人が所属し、それぞれがその日に言いたいことを連ねてその日の日報としてグループに投稿している。高校2年生の冬から今日に至るまで2年以上続く「日報。」には合計40万字、2100件を超える日報を投稿されており、男子高校生のくだらない話から大学受験、コロナに対する思い、恋愛についてのことなど様々な気持ちと考えが蓄積されている。ある日の日報。では、文章生成モデルであるGPT-2を 「日報。」の全投稿を元に転移学習(ファインチューニング)を行い、現実には存在しない「ある日」の日報を生成し、我々の誰かが今後体験しうる、ありえるかもしれない1日を描いている。

作品の意図

「最大公約数としてのAI」

いつかの日報。では私たち5人の「最大公約数」をAIを通して見ることが意図されている。AIは、学習のプロセスにおいてモデルがデータセットに頻出する単語や文脈を知ることで、生成された文章にもそれらの単語と文脈が頻繁に出現するようになる。このバイアスを避けるため通常AIの学習には大量のデータを必要とするが、今回の作品ではこの特徴を利用し、私たち5人が2年間でどのような事柄を重要視し、その思考にどのような共通項が存在するのかを可視化している。我々を知らない鑑賞者は、AIに抽出された特徴を通して我々5人がどのような人間であるのかを、1対5ではなく1対1で知るのだ。

「ありうる1日を創造する」

いつかの日報。では先述したように、日報のテキストデータから新しい日報を生成している。ある日の日報。では、この先の未来で我々5人のうちの誰かが、体験するかもしれない事柄や文章に起こすかもしれない思いを先回りして、ありえる1日や起こりうる悩み、それに対する結論を提示している。そこには、同世代の鑑賞者も共感できるものがあるのではないだろうか。

作品が意図していなかったこと

日報。のライングループに「ある日の日報。」で生成した文章を投稿し作品をレビューしてもらったところ、「どの文章が誰の日報から学習されていて、いつごろの記憶なのかがなんとなく分かる」という意見をもらった。これは「最大公約数」を抽出する意図から外れ、むしろ素因数分解された文章が誰の何の文章に由来しているのかが日報。のメンバーだけには分かる状態である。したがって、データセットとなった日報メンバーとそれ以外の鑑賞者では印象が大きく異なってくる。データセットが限られているからこそ、データセットになった我々はAIに盗まれた自分たちの特徴量を文章から垣間見ることができたのである。

レビュー

何を表現したくてそのメディアを使用するのか。どのようにメディアを「誤用」しているか。

作品の意図である「最大公約数としてのAI」と、「ありうる1日を創造する」をニューラルネットワークの特徴である学習と、データセットの偏りから生まれるバイアスを用いることで達成している。

いわゆる「心地いい表現」に縛られていないか。

データセットとなった日報メンバー側から考えると、我々の思考や日々の特徴を検出されそれをもとに文章が生成されるので、生成される文章に特定の個人の影響が強く出ている場合(「作品が意図していなかったこと」を参照)はAIが生成した架空のものであっても羞恥を感じる場合があった。一方、日報メンバー以外の鑑賞者はそのような感情は抱かないだろう。この、鑑賞者とデータセットとなる人間の間に起こる分断、思考が裸にされている感覚の有無は興味深い点である。

制作過程

GPT-2を日本語に対応させたgpt2-japaneseを利用。さらに、既存の学習済みモデルを「日報。」のテキストデータでファインチューニングする。「日報。」はLINEのグループトークであるため、そこからtxtをダウンロードし必要部分を抽出、BPEEncorderでベクトル化してデータの前処理を行った。

今後の展望

・学習がMacのローカルCPUランタイムだとあまりにも時間がかかりまだ完全に学習を終えているわけではないので、まずはファインチューニングを完了させる。

・潜在空間を3次元や2次元に変形してデータビジュアライゼーションのインスタレーションを製作したい。

20/01/20

--

--