カテゴリー: IT

  • Runwayで犬と小鳥の動画を生成

    Runwayで犬と小鳥の動画を生成

    生成AIで犬と小鳥の動画をつくった

    この生成AIの仕組みは、今回(2024年度)のノーベル物理学賞と関係があるのです。ここであえて映像生成AIと言わないで、生成AIというのは、機械学習や深層学習が、映像に限らず、社会活動のかなりの分野で、すでに活用されているからです。多量のデータを処理して意味あるアイデアを引き出すのが生成AI。映像は100万というレベルのピクセルの色情報を処理するので、コンピューターの処理能力がやっと追いついて、今現在がある、という状況です。今後さらに進化すれば、2次元から3次元へと舞台は移行するのではないでしょうか。
    今回のRubwayというソフトは、数あるなかの画像生成AIの一つですが、その操作は以下のとおり、とても簡単。

    1 Runwayにログインする

    runway

    Runwayにログインをすると上のようなサイトが出てくる。いくつものエフェクトを選ぶことが出来るが、今回は”Generative Video”をクリックする。すると下のような生成画面になる。

    2 画像をアップロードする

    画像をアップロードするようにうながすボタンが出てくるので、希望の画像ファイルを選択するか、その場所にドロップダウンする。すると数秒でその画像が左側に表示される。
    これ以後行うのは次の4つのステップだ。まず、最終的な画像のサイズを横長か、縦長のどちらにするか選択肢が出てくるので、私の場合今回は横長を選んだ。次に、枠内に画像の主要な部分がはまるように上下あるいは左右に画像を動かして決まったら、”Crop”ボタンをクリックする。
    次は、生成される映像の長さを決める。下に”10sec”と表示されているところがあるので、クリックするとプルダウンメニューで5secか10ecを選べる。今回は10secを選んだ。最後にその横に表示される”Generate”のボタンをクリックすれば完了。
    そして待つこと数秒程度、下のような映像が生成されて思わずすごい!とつぶやいた。
    それではもう一度映像をどうぞ!

    3 注意点もある

    この映像は約10秒だが、よく見ると中跳びしている箇所がある。またもう一羽の鳥が突然あらわれたり消えたりしている。不自然な点は多々あるが、それ以上に出来栄えがすごいと思った。
    注意点として、10secより5secの方がバグが少ないかもしれない点と、もう一つは頻繁に有料バージョンへのアップグレードが促される点。そして、本来なら5つまで無料で生成できるはずが、このことによってじっさいには一つがやっとだった。だが、それでもやった価値は十分にあったと思う。

    ちなみに、昨日ノーベル物理学賞がジョン・ホップフィールド氏とジェフリー・ヒントン氏に与えられた。二人は、人工知能の基礎になる機械学習と深層学習の基礎を築いた人たちだ。なんと1980年代からはじめている。なかでもヒントン氏はその後、画像生成AIに深くかかわっている。今回のように画像の生成や映像の生成をこうして経験することが出来たのも二人の研究があってこそだと思うと、こうしてその成果を試してみることが出来たのもなにかの縁と感慨深くなる。


  • ImageFXで犬と小鳥の画像生成

    ImageFXで犬と小鳥の画像生成

    ImageFXで犬と小鳥の画像生成

    1 まずはお手本を一部かえただけ

    まずは犬を生成する基本的なプロンプト(他のサイトからコピペ)で、犬の部分を「ゴールデンレトリバー」に変えて生成してみる。ImageFXの操作画面は上の写真のとおりだが、プロンプトの語順などは、生成しやすいようにImageFXが変えてる。オレンジ色の枠で主要な単語が強調されているが、この部分はクリックすると、プルダウンメニューが出てきて他の選択肢が現れる。たとえば、”tiny”の部分をクリックすると”big”とか他の単語も試すことができる。

    2 好みのバックにする

    バックをまずは明るく清潔な感じにしたかったので、追加のプロンプトを入力した。”On the background”のあとに「白枠の窓があって、その向こうに緑の木々や芝生の庭が見える」といった内容で英語を入力する。すると、右側に新しい4つの生成画像が現れた。
    ちなみにおススメは、日本語をDeeplやChatGPTなどで英語に翻訳したものをプロンプトとして入力することだが、私は自分の英語力の範囲でやってみた。なので、間違った英語を入力してしまっている。上の画面左側のプロンプトをよく見ていただくと、私が書き込んだ”looking throuw”や”lown”がそのまま記述されている。正しくは”looking through”や”lawn”だ。こうした間違い英語をImageFXがどう扱っているのか不明だが、この例でいうと、”looking throuw”はかろうじて解釈されて”lown”は無視されているようにも見える。
    いずれにせよ、バックの改変は成功である。

    3 緑の小鳥を呼び込んでみる

    しずかな雰囲気の良い感じの写真ではあるが、さびしい気もするので、小鳥が遊びにきた設定にしてみたい。追加で「緑の小鳥が舞い込んできて、遊びたいかのように犬を見つめる」という内容のプロンプトいれる。私の英語では”Tiny green bird has flew in and came aside the dog and watch as if it wants to play with the dog.”(間違っていたらスミマセン)。すると、上の写真のように4つの新しい画像が生成された。これまた成功!
    実は、小鳥は少しぼやかして、犬に焦点をあてる写真にしたかったので、”The bird is out of focus.”と最後に入力したが、この部分は無視されたか、あるいは、そのImagwFXの限界かもしれない。
    こうした作業をあと一二回繰り返して、気に入りの画像ができた。

    さらにImageFXに繰り返しを指示してついに好みの画像にたどりついた。

    まったく初めての体験だったがとても楽しかった。ただチャレンジングでもあって、こちらの能力が試されてもいると感じた。
    ちなみに、この画像は生成AI的にいうと、唯一無二で、厳密な意味でまったく同じものは出来ないはずである。
    著作権は画像をつくった人に帰属するようである。また商用にも今のところ利用できるらしい。ただし、それぞれの画像にはデジタル透かし技術でIDが振られているということだ。