コルビジェネレーター(学習・生成・演算)の試行

こちらで紹介している内容を少し発展させたものを情報シンポ2018で大野くんが発表しました!原稿はこちら(2019/01/24 追記)


卒論生の大野耕太郎くんが「Deep Learningを用いた画像生成AIの建築都市デザイン分野への適用可能性」と題して「ジェネレーティブデザインAI」に取り組んでいます。

先端的な内容のため,一緒に試行錯誤ですが,視覚的に表現できる成果ができましたので,紹介します。
なお「コルビジェ」+「ジェネレーター」=「コルビジェネレーター」は,大野くんのこだわりの命名です(笑)

山田:大野くん,ミースは?
大野くん:え,ダジャレにできなくなっちゃうんで
山田:(・ω・)b グッ

それでは,紹介です。


・研究の契機と目標

まず,使っている技術はコンテンツ生成AIの一種である対立的生成ネットワーク「GAN(DCGAN)」,と呼ばれる技術です。
次に,この技術を応用して目指しているのは,立面を学習して,立面を生成し,立面をデザイン演算するジェネレーティブデザインAIです。
「GAN(DCGAN)」を平易に表現すれば,「生成器と判定器が,対立的な関係の中で画像の生成精度を向上させていく手法」です。
「生徒と先生の関係で共に成長しながら対象を生成する」と表現することも可能で,教員の立場からすればこの視点からも興味深い手法です。(なので僕からすれば「協力的」かな?)
詳しくは下記の映像と論文をご覧ください。

https://youtu.be/XOxxPcy5Gr4
https://arxiv.org/abs/1710.10196

動画で写真のようであるが実在しない画像が無数に生成されている様子が見られます。
「おぉ,スゴイ! この技術で建築都市のデザインを生成することができるかもしれない」というのがこの研究の契機です。
研究野望「ジェネレーティブデザインAI」に対して位置付く研究意義は「特定の作家の感性を深層学習により保存・再生するAIが作れるか」の基礎研究です。
○○○らしさを学習できるのか,学習するだけでなく描画できるのか」ということです。
例えば,「コルビュジェらしさを学習し,コルビュジェらしい描画ができるのか」です。
他にも,この研究の判定器を例にすれば。ニューヨークのようなとか,京都駅みたいな,と言った読み替えも可能です。

使い方を想定すれば,「デザインの発散を支援するAI」です。
「デザイン発散の革新的な迅速化」「計算可能な想定外の可視化による発散領域の拡張」です。使い方を想定するのは余り好きではありませんが。
デザインを進めるときには既往のデザインをソースにすることが度々あります。
「今回の建物はコルビジェを参照してみよう」「現状案を少しコルビジェを参照しながらスタディをしてみよう」などでしょうか。
このような時に,デザイナーが案を外部化する速度を遥かに上回る速度で「○○○してみよう」を視覚的に発散してくれるAIということです。
玉石混合,中には???な画像も産まれますが,それにも価値があります。
「偶然産まれた案はデザイナーの事前認知を超えた案(超認知)」かもしれません!
さらに大袈裟に言えば,もしかすると,新しいコルビジェ作品が産まれるかもしれません!
・・・つい,飛躍してしまいました。

・内容の紹介(概要のみ)

ということで,コルビジェAI,「コルビジェネレーター」の試行を紹介します。
今回は視覚的な紹介,画像のみです。学習モデルの詳細は後日。

学習データ
学習したのは「サボォア邸」「ロンシャンの礼拝堂」の立面です。

水増しを含め,もっと多くの枚数を使用していますが,一部を掲載しています。なお320*320の正方形画像です。

生成画像

試行錯誤の結果,生成に成功しました。差し当たり画像のみ紹介します。学習構造は後日。

サボォア邸

ロンシャンの礼拝堂

いかがでしょうか?
本当は沢山生成されていますが一部を紹介しています。
それぞれ,それなりに「学習データの立面に近似した画像だけれど,そのものではない画像」が生成された,と言えるのではないでしょうか?
これだけでも一枚一枚を見て行けばデザイナーに「気づき」が産まれるかもしれません。

デザイン演算

次に「デザインの演算」です。
「GAN(DCGAN)」では,画像を表現するn次元のベクトルが生成されています。
平たくいえば,デザインが数の塊になっているということです。
人がパッと見ただけでは意味不明ですが,このベクトルがRGBデータに変換されて画像になります。
ですので,このベクトルを比較することで,特定のデザイン要素を操作する特徴量を把握することができます。
例えば,「屋根」や「窓」をコントロールする部分(特徴量)を把握することができれば,屋根を足したり,窓を引くことができます。
つまり「デザインの演算が可能」ということです。
これによる,【「ロンシャンの礼拝堂の屋根」+「サボォア邸の立面」=「???」】が,下記です。

「ロンシャンの礼拝堂の屋根」+「サボォア邸の立面」=「???」

いかがでしょうか?(右下は違う演算+ただ混ぜ混ぜした感もありますが,,,)
 *但し,実は,今回は厳密には今回の画像はデザイン演算【風】です。正確な部位・要素毎の特徴量の把握には至っていません,まだ試行錯誤中です。

この取り組みが,新たなデザインの創世,過去の偉人の新作,デザインするAI,建築家コロス,となるには,技術的な課題のみならず,「デザインとは何か?」という深遠な問いに対する太古から続く問答とも対決しなければなりません。

少し気張り過ぎかもしれませんが,雲海を切り弘く,が研究全体の大義です。
と言っても何事もはじめの一歩から。
デザイン発散の革新的な迅速化,人にとって計算可能な想定外の可視化,人とAIが共創するデザイン環境,これだけでも十二分に大変で挑戦的です。
研究面も忘れずに,目指せ,着実かつ大胆な一歩!!

・おまけ

最後におまけ?です。
立面デザインを表現するn次元のベクトルは数字ですので,連続的に変化させることができます。
この様子を画像で表現した動画です。

「サボォア邸の異なる立面をつないだもの」

「ロンシャンの礼拝堂の異なる立面をつないだもの」

「両作品をつないだもの」表示に少し時間が掛かるかもしれません。

不思議な動画です。モーフィングににていますね。
あと,何故かずっと見ていられます。謎のヒーリング効果があるような気も(笑)

以上で紹介終わります。
細かい学習モデルの設定などについては「日本建築学会 情報シンポ 2018」にて大野くんが4年生ながら発表予定です,頑張ろう。
また紹介できるような成果を目指して,大野耕太郎くん,一緒にがんばりましょー