Google 文化研究所のコーダー アートの内部

機械学習とアート - Google I/O 2016

機械はクリエイティブになれますか? Google はそう考えており、私たち感情的な人間にもう少し似た世界の見方を機械に教えることに専念するチーム全体を抱えています。

コンピューターを子供であるかのように考えてみると、プログラマーがどのようにコンピューターに学習を教えるのかを理解するのは簡単です。 人工知能は、最初は非常に基本的で単純です。 人間のモデレーターがコンピューターに指示を出し、コンピューターに思考方法、つまり自己学習方法を示します。 ただし、プログラマーが基本を教えてしまえば、その知識はすぐに拡張できます。

「700 万点のデジタル アーティファクトで何ができるでしょうか?」

Google カルチュラル インスティテュート フランスのパリでは、検索大手が何世紀にもわたって人間の芸術的功績を記録した 700 万枚の画像を分類する方法を機械に教えています。 同研究所にはウェブサイトのほか、アプリもある。 iOS そして アンドロイド 世界中のさまざまな美術館の芸術作品を検索できます。 芸術のカタログを作成するには、研究所に常駐しているコード アーティストがコンピューターに次のことを教えなければなりませんでした。 人間が人類の歴史を通じて芸術の正確なデジタルアーカイブを作成するのと同じ方法で画像を表示します。

歴史をカタログ化することは十分に良いことですが、コンピューターが分類やファイリングから学習しているスキルの一部は、実際にコンピューターをより創造的にしています。 滞在中のアーティストたちは現在、コンピューターを実験し、機械知能と、つなぎ合わせた 700 万枚の画像のカタログを使用して、新しい芸術作品を作成しています。 Google I/O 2016 の期間中、 シリル・ディアニュ そして マリオ・クリンゲマン 人間と同じように芸術を見ることを機械にどのように教えてきたのか、また機械が創造的になるようにどのように訓練してきたのかを説明しました。

コンピュータにABCを教える

子供に最初に教えることの 1 つは言語です。 西洋文化では、それはABCを学ぶことを意味します。 ドイツ出身の自称コードアーティスト、マリオ・クリンゲマンは、機械に次のことを教え始めました。 古い文書から様式化された文字を識別し、何千もの異なる外観の As、B、C などを認識できるようにコンピュータに教えることができるかどうかを調べる の上。 それは人間と同じように画像を分類する方法を機械に教える短期集中コースでした。

コンピューターが蔓や花で覆われた様式化された文字 B を見ると、ある種の植物が見えるかもしれませんが、5 歳の子供でも、その画像が植物ではなく文字 B であるとすぐに識別できます。 クリンゲマン氏は、コンピュータに ABC を認識できるように教えるために、様式化された文字の画像を何千枚も入力しました。 彼は、右または左にスワイプして文字の推測が正しいか間違っているかを機械に伝える、Tinder のようなインターフェイスを作成しました。

レターマシン

結局のところ、機械はABCを非常に早く学習します。 彼らはあらゆるものに文字が見られるようになりました。 人間が雲の中に顔を見たり、抽象的な芸術作品の中に画像を見たりするのと同じように、彼のコンピュータは全く無関係な画像の中に文字を見ました。 クリンゲマン氏がコンピューターに廃墟の建物の絵やエッチングを見せたところ、代わりに文字 B が見えました。

クリンゲマン氏は、コンピューターを 1 セットの画像のみでトレーニングすると、すべてにおいてその種類の画像のみを認識し始めると説明しました。 だからこそ、彼の機械は廃墟の中にある手紙を見たのだ。

コンピュータに 700 万枚の画像を分類するよう教える

デジタル インタラクション アーティストのシリル ディアニュが文化研究所に加わったとき、Google は彼に「700 万のデジタル アーティファクトで何ができるでしょうか?」というかなり気の遠くなるような質問をしました。

ディアニュはその質問に圧倒され、すべての画像を見事に巨大な図表にまとめました。 正弦波, 以下で見ることができます. その波は後に、プロジェクトが機械学習で達成したいと考えているすべてを美しく表現することになりました。 ディアニュの正弦波は実際に検索可能であるため、Google 文化研究所が作成したデジタル アーカイブ内のすべての画像をサーフィンすることができます。 画像はカテゴリごとにグループ化されており、俯瞰的に見ると点の海にしか見えません。 中に入ると、子犬、農場、人物など、共通のテーマを持つ特定の画像が表示されます。

13

検索して、必要な画像を見つけることもできます。 注意深く探せば、ディアニュの言う「肖像画の海岸」に遭遇するかもしれません。 そこには人々の顔の画像がすべて集まっています。

アーカイブ内のすべての画像の検索可能なマップを作成するために、ディアニュと彼のチームは、マシンに何が何であるかを教えるために、すべてのカテゴリを作成する必要がありました。

700 万点の遺物を分類することは、その多くには複数のカテゴリがある場合があり、簡単な作業ではありません。 チームは、常識にとらわれないものを考え出す必要がありました。 物事をその本質に基づいて分類するだけでは十分ではありません。 また、画像が呼び起こす感情のカテゴリーを作成する必要もありました。

機械に人間の感情を教えることは、機械をより創造的にするための重要なステップです。

そうすることで、「穏やか」な画像を検索すると、夕日や穏やかな湖など、穏やかな雰囲気を呼び起こす画像がコンピューターに表示されます。 驚くべきことに、機械は人間の感情を識別する方法を非常に高いスキルで学習し、人間の立場に立って、特定の画像が人間にどのような感情を与えるかを検討できるようになりました。

機械に人間の感情を教えることは、機械をより創造的にするための重要なステップです。 結局のところ、現代美術の多くは人間の感情を視覚的に表現したものです。

しかし、機械は創造的になることができるでしょうか?

創造性と芸術性は、私たち人間が自分だけのものだと考えたがるものです。 動物は芸術を作りませんし、機械も芸術を作りません…まだ。 GoogleのDeep Dreamプロジェクト 機械は芸術を創造できないという概念を覆そうとしました。 検索大手はコンピューターを訓練して画像を操作し、奇妙でサイケデリックな芸術作品を作成しました。 Google が作成した画像 ディープドリームエンジン きれいではないかもしれませんが、確かにユニークで非常に創造的です。 機械の作品には、サイケデリックな色、ナメクジ、奇妙な目、未定義の空間で渦巻く実体のない動物が含まれています。

機械が既存の画像を単に組み合わせたり、ひねったり、極端な色に浸したりしているだけでは、本当の芸術ではないと主張する人もいるかもしれません。 Google も意見を異にするだろうし、コードアーティストのクリンゲマンも同様だろう。

「人間には独創的なアイデアを生み出す能力がありません」と彼は説明した。

18

有名な絵画であっても、以前の芸術作品の要素が含まれていると彼は指摘しました。 ピカソの 1907 年の傑作 アヴィニョンの娘たち, たとえば、次のような影響を受けます。 アフリカの芸術 キュビストの先駆者たち ポール・セザンヌ. さらに言えば、既存の画像を芸術的な方法で組み合わせるコラージュも、確立された芸術形式の 1 つです。 ピカソ、アンディ・ウォーホル、マン・レイなどが風変わりなコラージュで知られていますが、なぜ機械で作られたコラージュも芸術として成立しないのでしょうか?

クリンゲマンは、Google 文化研究所での研修を開始するずっと前から、デジタル アートの限界を押し広げ、クリエイティブなマシンがどのように進化できるかを確認したいと考えていました。 クリンゲマンは、自分のそれほど強力ではないマシンを使用して、インターネット アーカイブと Google のマシンをいじり始めました。 TensorFlow デジタルコラージュを作成するための機械学習ソフトウェア。

彼はエルンストと呼ばれる機械学習ツールを作成しました。エルンストという名前は、シュールレアリストでコラージュアーティストの名前にちなんで付けられました。 マックス・エルンスト. クリンゲマンはエルンストの作品から一連のオブジェクトを特定し、同じ要素で異なるコラージュを作成するようにコンピューターに指示しました。 その結果は、しばしば超現実的で、時には面白く、時にはまったくひどいものでした。

「人間は独創的なアイデアを生み出すことができない。」

クリンゲマンは、自分のマシンが生成する混沌とした画像をもっと制御したいと考え、マシンに新しいことを教え始めました。 彼は「人間にとって何が面白いのか?」と自問した。 クリンゲマンは、何を探すべきかをシステムに訓練し、人間のアーティストと同じようにすべての要素を表示する方法をシステムに教えなければならないことを知っていました。

出来上がったアートワークはゴージャスで、まったくユニークなものです。 クリンゲマンは明らかに古い画像を使用して作品を作成しましたが、それらは新しいコンテキストで表示され、それが大きな違いを生み出します。

現時点では、コンピューターの創造性は、興味深いコラージュと、どの画像がうまく組み合わせられるかを理解することに限られています。 機械はまだ独自のアートを作成していませんが、機械を動かしているコードアーティストは、その過程でクリエイターというよりキュレーターになりつつあります。

人間が機械の創造力をどこまで拡張できるかはまだ分からないが、それを見るのは確かに興味深い。

編集者のおすすめ

  • Google Bard は話せるようになりましたが、ChatGPT をかき消すことができるでしょうか?
  • ChatGPT のライバルである Google の Bard を試すことができるようになりました
  • Google の新しい Bard AI は、ChatGPT を心配させるほど強力である可能性があります - そしてそれはすでに存在しています
  • Google Meet または Zoom? もうすぐ、関係なくなるよ
  • Google Japanの奇妙な新しいキーボードは(文字通り)バグもキャッチできる