マジセミドライブ
ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。
AIツール実験室
2023.10.17
【AIツール実験室】アバタートーク動画生成AIツール「 Creative Reality Studio 」①Web編🗣
コンテンツ
はじめに
ごあいさつ
日本全国の「アバター動画生成ファン」のみなさま、
おつかれさまです。
タイムリープ系アニメTOP3
→“タイムリープ系”アニメといえば? 3位「STEINS;GATE」、2位「サマータイムレンダ」、1位は…<23年版>
■3位「STEINS;GATE」
「Dメールを送信してしまうと、大変なことになるよ!」という科学アドベンチャーで、
「複雑で緻密なプロット」「時間改変パラドックス」「科学と倫理の問題」などなどあり、
素晴らしい作品です。
SF好きなら、何周も見ておきたい作品です。
■2位「サマータイムレンダ」
とある島で発生した謎の怪奇事件にまつわるホラーミステリーです。
やや話が複雑であり、1周しか見ていないので、ぼんやりとしている部分もあります。
キャラの作画が素敵です。
■1位「???????」
この作品は、見てなかったやつでした。
見ないとダメなやつですね。
■まとめ
まあ、でも、いやしかし、
タイムリープ系ということならば、
やはり「シュタゲ」を1位に推したい、
マジセミ担当者Aでございます。
今回の作戦
今回は、
アバタートーク動画生成AIツール「Creative Reality Studio」
を、いじってみたいと思います。
「素敵な動画」を生成できたらよいなと思います。
ご注意点
※本記事は、担当者Aの主観により作成されていますので、なにとぞ、そういうことでよろしくお願いします。
※サービスについては、最新情報をご確認ください。
アバタートーク動画生成AIツール「Creative Reality Studio」まとめ
「Creative Reality Studio」とは
「Creative Reality Studio」は、
「アバターを使った動画コンテンツ」を簡単に作成できるAIツールです。
「画像」や「イラスト」をアップロードし、
喋らせたい言葉を入力するだけで、
「テキストを読み上げる動画」を作成してくれます。
サービス提供
・提供企業 = イスラエルのAI企業「D-ID社」
・リリース日 = 2022年12月13日
主な特徴
・「画像」+「テキスト」で、簡単にアバター動画を作成できる
・アバターにテキストを読み上げさせることができる
・多言語対応(100言語超)
・API経由でのサービス利用も可能
・商用利用も可能 ※有料プラン
主な機能
・アバター作成機能 :画像からアバターを作成
・音声合成機能 :アバターにテキストを読み上げさせる
・動画生成機能 :アバターを用いた動画を生成
ユースケース
・企業内コミュニケーション強化
・マーケティングコンテンツ強化 :カスタマーエンゲージメント
・オンライントレーニング動画 :教育、研修
・エンターテインメントコンテンツ作成 など
使用時の注意点
・使用する画像のプライバシー保護に十分な配慮が必要
オフィシャルサイト
料金プラン
無料プランの場合
・無料トライアル期間=14日間
・商用利用NG
・最大5分間の動画を生成できる
・ウォーターマークが入る
【しゃべらせ動画①】「マジセミちゃん(仮)」の自己紹介動画
作戦
絶賛模索中の「マジセミちゃん(仮)」に、
自己紹介をしてもらおうと思います。
マジセミ【非公認】イメージキャラクター「マジセミちゃん(仮)」 前回までのあらすじ
→【AIツール実験室】画像生成AIツール「 Emi 」(前編)
「DALL·E 3」リリース記念
新しい画像生成機能「DALL·E 3」で画像を作成してみます。
「ChatGPT4経由」+「Bing経由」でやってみます。
アニメ調イラストは断念😢
アニメ調イラストで、動画作成してもらおうとしたものの、
「顔を特定できません」エラーとなり、
読み込んでもらえませんでした。
※証明写真のような感じが必要なようです。
画像生成プロンプト
■指示
画像を作成してください。
■作成オーダー
・フォトリアル調
・背景は白色無地
・登場人物の数=1名
・画像中央に直立している
・カメラ目線
・手には何も持っていない
・口を閉じている
・口元を隠さない
・画像サイズ=正方形
■作成キャラクターのイメージ
①女子生徒
・日本の学校に通う 女子生徒
画像できました!
Bing版で成功
微妙なAI感はあるものの、
なかなかナイスですね。
このレベルのフォトリアル画像を、
チャットAIでちょいと作ってくれてしまうというのは、
すごいご時世です。
しゃべらせ動画→作成準備
①「D-ID Creative Reality Studio」ページを開きます
②ログインします
左下の「Guest」をクリックして、
ログインします。
Googleで認証 などをします。
③「Create Video」をクリックします
しゃべらせ動画→画像設定
「Choose a presenter」の「+ADD」をクリックして、
作成した画像を登録します。
しゃべらせ動画→テキスト音声設定
①言語設定
「Language」で「Japanese(Japan)」を選択します。
②スクリプト入力
しゃべらせたいテキストを入力します。
(サンプル)
みなさん、こんにちは。
絶賛模索中の、
マジセミ非公認イメージキャラクター「マジセミちゃん(仮)」です。
いつの日か、公認キャラクターになれるように、がんばりたいと思います。
③声の設定
4つから選択できました。
④スタイル設定
「Nanami」の場合だけ、選択できました。
・chat
・customerservice
・cheerful
⑤読み上げ確認
「スピーカーマーク」をクリックして、
読み上げを確認します。
しゃべらせ動画→「GENERATE VIDEO」
①動画タイトル設定
左上の「Untitled video」をクリックして、
動画タイトルを設定します。
②「GENERATE VIDEO」をクリックします
③作成確認
クレジット20のうち、1つ使って、
15秒の動画ができるようです。
「GENARATE」をクリックします。
しゃべらせ動画→できました!
10秒くらいで、出来上がりました。
速いですね。
ファイルダウンロードできました。
・MP4形式
・2.9MB
シェアもいろいろできるようです。
それでは、初めてしゃべる「マジセミちゃん(仮)」をご覧ください
まとめ
思ってたより、ちゃんとしっかり、しゃべってくれました。
日本語テキストの読み上げ
やはり「AIぽさ」はあるものの、
結構自然な感じに聞こえます。
いろいろ自然に動く
・◯:口が動く
・◎:リップシンクしている
・◯:まばたきをする
・◯:顔の向きが動く
・◯:顔を動かしても、目の焦点はカメラ目線
これは、なかなかすごいですね〜。
【しゃべらせ動画②】とある紳士「T.Aniki」の解説ショート動画サンプル
作戦
実在する人類の写真データを使用して、
何かをしゃべってもらいます。
とある紳士の写真データ
とある紳士より、写真データを提供してもらいました。
まいど、ご協力ありがとうございます。
出典ページ
できました!
クレジットを2つ消費して、
30秒の動画ができました。
それでは、とある紳士「T.Aniki」の「Creative Reality Studio」解説ショート動画 をご覧ください
→「Creative Reality Studio」解説動画
解説してくれました
しゃべりスピードも良い感じで、
聞きやすいですね。
【反省会】なぜ、ほんのちょっとだけ不気味な感じになってしまったのか?
ベースとなった写真データが「やや斜めに写っているタイプ」であるため、
顔全体を認識できないようですね。
その状態で動かそうとすると、
やや不気味なモーションになってしまうのでは?
という推論が成り立つと思います。
もう少し賢くなってしまうと、
「斜め写真でも全然OKですよ!」になってくれそうですね。
期待しましょう。
【推奨】真正面から写っている写真データを使用しましょう
現段階では、斜め写真はやめておくのが無難です。
クレジットを無駄に消費してしまわないようにお気をつけください。
【歌わせ動画】「マジセミちゃん(仮)」が「マジセミのうた」を歌う
作戦
音声データのアップロードもできるようなので、
「マジセミちゃん(仮)」に、
お歌を歌ってもらおうと思います。
マジセミのうた
以前、
楽曲作成ツール「Suno AI」で作った、
♪「マジセミのうた」〜夢と希望と光が強め版〜♪
を、使ってみます。
作成の様子
→【AIツール実験室】楽曲作成ツール「 Suno AI 」〜AI生成ミュージックフェス〜
「マジセミのうた」〜夢と希望と光が強め版〜
楽曲データをアップロード
2MBほどのMP4ファイルを
アップロードしてみました。
楽曲を再生できるので、
読み込めたようです。
GENERATE
35秒の動画ができるようです。
3クレジットかかります。
もしかして、1クレジット=15秒 とかですかね?
できました
30秒くらいで、できました。
それでは、「マジセミちゃん(仮)」が歌う「マジセミのうた」を聴いていただきましょう
【アンコール曲】新生フルリメイク「いぬのおまわりさん」
まとめ
◯:歌ってくれました
話し言葉だけではなく、
「歌わせ」も、いける感じです。
◎:前奏の間は、口を動かさない
「伴奏パート」と「ボーカルパート」を分けて、
認識できているのですね。
△:リンプシンクが不安定 ←しょうがない
伴奏パートも一緒に混ざっているので、
リップシンクが不安定になっています。
ボーカルパートだけ抜き出して、アバター動画を作成して、
その後に、伴奏パートを重ねれば、
いい感じのリップシンクになりそうです。
最後にまとめ
今回のAIツール「Creative Reality Studio」ですが、
なかなかすごいツールでした。
◯:「写真データ+テキスト」だけで「しゃべらせ動画」ができる
(真正面からの)写真データをデフォルトで使うようにすれば、
テキストを放り込むだけで、
しゃべらせ動画を作成できてしまいます。
特に、
「いろいろ解説する動画を作る用事がある人」などは、
課金してでも使う価値はあるかもですね。
◯:アバターがほどよく動く
アバターの「口」「顔」「目」が、
結構動きます。
完全にビタッと止まっている静止画よりも、
アクティブ感が出て、
とてもよいと思います。
◯:日本語もバッチリOK
日本語テキストも、普通に読み上げてくれます。
歌わせることもできます。
日本語ユーザーには、ありがたいですね。
◯:ビジネス用途で使えそう
・サービス紹介ページでのサービス概要紹介動画
・お客様相談室ページの説明動画 など、
活用できそうです。
また、APIも使えるようなので、
生成スピードがUPすれば、
「FAQテキストを読み込ませて、リアルタイムで回答動画生成」なども、
いけるようになるかもしれませんね。
ためしに「しゃべらせ動画」を作ってみてください
お試し無料版でも、
そこそこ試せるので、
いろいろと、いじったりしてみてください👍
②API編に続きます
→【AIツール実験室】アバタートーク動画生成AIツール「 Creative Reality Studio 」②API編🗣
【お知らせ】AI関連 記事リストポータル
こちらのページでは、
【ChatGPTプラグイン探訪】および【AIツール実験室】の記事一覧を参照できます。
【お知らせ】「マジセミ」のご紹介
「マジセミ」では、日々、多くのIT関連セミナーを開催しています。
多くのセミナーの中から「ご自身のスキルやビジネスを強化できるセミナー」を見つけて、ぜひ1度、参加してみてください。
マジセミ関連プラットフォーム
プラットフォーム | 説明 | URL |
---|---|---|
マジセミ | マジセミで実施されるさまざまなセミナーの開催情報を確認できます。 「IT関連セミナー」「製造業関連セミナー」など、ご自身のビジネスを強化できるセミナーを検索できます。 |
→majisemi.com |
マジセミサービス | 「セミナーを開催したい方」向けの情報を確認できます。 トライアルからの利用が可能です。 |
→majisemi.com →service |
マジセミドライブ | 「IT関連コンテンツ」などを紹介しています。 | →majisemi.com →topics |
マジセミFacebook | 毎日「マジセミ関連情報」や「IT関連ニュース」などを紹介しています。 ★フォローお願いします。 |
→facebook.com →OSSNews |
マジセミTwitter | マジセミFacebookと同様に、 毎日「マジセミ関連情報」や「IT関連ニュース」などを紹介しています。 ★フォローお願いします。 |
→twitter.com →Majisemi_it |
※「ご意見」「ご感想」「誤字がありましたよ」「こんな使い方もあるみたいですよ」などありましたら、
マジセミSNS(Facebook or Twitter)まで、お知らせください。
この記事のタグ一覧
フリーワード検索
カテゴリー一覧
アクセスランキング
- 🏆ランク1位🏆
【無料で使える】「 OCR 」ツールまとめ - 🏆ランク2位🏆
【OSS情報アーカイブ】fping - 🏆ランク3位🏆
【OSS情報アーカイブ】Puppet - 🏆ランク4位🏆
【OSS情報】LaTeX代替エディタ「 Typst 」 - 🏆ランク5位🏆
【OSS情報アーカイブ】Apache CouchDB - 🏆ランク6位🏆
【OSS情報アーカイブ】CephFS - 🏆ランク7位🏆
【OSS情報アーカイブ】WSO2 API Manager - 🏆ランク8位🏆
【OSS情報アーカイブ】Wireshark - 🏆ランク9位🏆
【OSS情報アーカイブ】Ruby - 🏆ランク10位🏆
【OSS情報アーカイブ】Lua