PR
PR

人工知能が写真で一句 「AI一茶くん」札幌で開発中 来月、試作版をお披露目

 北海道の花鳥風月から一句―。写真を「見て」俳句を詠んでくれる人工知能(AI)の開発が札幌で進んでいる。名付けて「AI一茶(いっさ)くん」。俳句は、Haikuとして英語圏でも通用するソフトコンテンツ。「札幌オリジン(起源)の挑戦」を掲げ、開発に必要なデータ作成に市民の手を借りながら、最終的に「ネットを駆使し、世界中が参加できるプロジェクト」が目標だ。将棋や囲碁の世界のように、AIは文芸でも人間を驚かすことができるか。(メディア委員=東京駐在 田中徹)

 雪の残る3月の札幌。日差しが強くなり「春うらら」という表現がぴったり合う。さっぽろ産業振興財団専務理事の酒井裕司さん(62)はそんな風景を見て、ふと思った。「日差しの強さ、気温といったさまざまなデータから、機械に季語を定義させるとどうなるだろうか」

 「残雪」は仲春(3月上旬の啓蟄(けいちつ)から4月上旬の清明まで)の季語とされる。しかし、人によって残雪の感じ方、あるいは表現の方法は異なる。データによる定義は可能だろうか。

 酒井さんがこんな疑問とアイデアを、北大大学院情報科学研究科の川村秀憲教授(44)に投げかけると、前向きな答えが帰ってきた。「それは面白い。考えてみたい」。酒井さんの発想は、後に川村教授らが俳句のプロジェクトを手掛けるきっかけになった。

 英語圏では既に、写真を機械が読み込んで、キャプション(説明文)を自動的につくる技術がある。しかし日本語の分野は発展途上という。写真から自動的に俳句をつくろうという試みは、一気にそのレベルを引き上げるものだ。

 川村教授は「状況や情景と、そこに身を置いた人間の心情との関係を、画像データと言葉で、主観的な視点で結びつけることはAI研究にとって重要。俳句の五七五には心の動きや感動の情報が詰まっていて、人間の感情や感性を理解するには最適な素材」という。

 将棋や囲碁などボードゲームは論理的推論の競争だ。正解、あるいは最善手を探り、勝つことを目的とする。将棋や囲碁で機械が人間を負かしたように、主に機械の性能向上により、従来は不可能と考えられていたことが可能になっている。

 一方、俳句のような文芸は論理的推論ではなく、正解や勝ち負け、客観的評価が難しい世界。川村教授は「どういうものを美しいと人間は感じるのか。(感性・感情に関するAI研究は)ハードルは高いが、現実的に実現可能性のある挑戦しがいのある分野」という。

 さっぽろ産業振興財団や札幌市、北大などによる産学官の連携組織「札幌AIラボ」が設立されたのは6月。川村教授がラボ長に就いた。「一茶くん」はラボで初めての共同プロジェクトとなった。

 「一茶くん」の名の通り、モデルは生涯2万を超える句を残した小林一茶(1763~1828年)。開発にアドバイスしている北大メディア・コミュニケーション研究院の伊藤孝行准教授(40)=国語学=は「一茶の句は、日常生活の一場面を思い浮かべて感じられる句が多く、時代を超えて理解、共感しやすい。(AI開発には)抽象度の高い作者より、現実的で生活のにおいのする一茶から始めるのが一案ではないかと考えた」という。

 「一茶くん」は10月に札幌で開かれる映像・音楽・ITの国際的複合イベント「No Maps」で試作版がお披露目される予定。ただ、川村教授は「その段階ではまだ、人間が見れば俳句とも言えないようなものが出てくる可能性がある」という。ちょうど、初期の将棋ソフトが初心者にもバカにされたようにだ。

 ただ、技術進歩の速度を考えれば、数年で人間を感心、感動させる句ができる可能性がある、とも。「一茶くん」に完成はなく、データが増えていく限り学習し続ける。

 AI研究では、翻訳といった分野で、人間が使う自然言語を処理、生成する技術へのニーズが高まっている。開発メンバーの一人、札幌のIT企業テクノフェイスの石田崇社長(43)は「写真キャプションの自動作成はもちろん、メモを整った書式にする、音声データを整理して文書にする、デザインからキャッチコピーをつくるなど応用範囲は広そう」とプロジェクトの成果に期待する。

 句の感じ方、評価は人によって異なる。とはいえ、専門家による評価や、会員制交流サイト(SNS)に投稿してエンゲージメント(「いいね」やリツイートなど)の質や量をフィードバックさせたりして、さらに機械に学習させ、より良い句とは何かを追究していくこともできそう。

 将棋や囲碁では、人間が驚くような指し手・打ち手が機械によって発見されている。まずは10月、「一茶くん」はどんな句を詠んでくれるだろうか。

 ■市民ら入力大量のデータから学び詠む
 「一茶くん」はどうやって俳句を詠むのか。

 まずは小林一茶の句と、句のイメージに近い画像を関連付けた「教師データ」から学習する。将棋や囲碁で言えば棋譜。著作権をクリアしたインターネットの「グーグル」で検索した画像を使う。

 句と関連付けられた画像との組み合わせを一つのセットとして、AIラボのサーバーに蓄積。5~10万セットがそろった段階で、ディープラーニングといわれる技術を使い、句にある言葉や言葉同士のつながり、関連付けられた画像との特徴やパターンを学習する。そうして学習した成果を基に、新たに読み込んだ画像からオリジナルの句を詠む。

 開発にはボランティアが欠かせない。「教師データ」作成は、人の手で入力する必要があるためだ。一つのデータセット作成はほんの数秒で終わるが、それが5万~10万セットとなると、相当な労力がかかる。

 開発メンバーは「市民が面白がって参加できるものにしたい」と考えている。札幌をAIの先進地にしたいというAIラボにとって、俳句という一般になじみのある素材で、市民参加も求められる「一茶くん」は最適なプロジェクトだ。

 一茶くんの学習データ作成に期限や定員などはない。興味を持ったら、アクセスできる。

 参加者全員が「一茶くん」の育ての親になれる。

残り:230文字/全文:2683文字
全文はログインまたはお申し込みするとお読みいただけます。
どうしん電子版のご案内
北海道新聞 購読の申し込みはこちらから
道新おためし読みアンケート
ページの先頭へ戻る