マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2023.05.15

【OSS情報】リアルタイムボイスチェンジャー「 VC Client 」

【OSS情報】リアルタイムボイスチェンジャー「 VC Client 」

【OSS情報】リアルタイムボイスチェンジャー「 VC Client 」

VC Clientのイメージ

VC Clientの「概要」

「VC Client」とは、「リアルタイム音声変換」ソフトウェアです。

対応プラットフォーム

・Windows
・Mac(M1)
・Linux
・Google Colab (MMVCのみ)

VC Clientの「特徴」

リモート利用が可能

・ネットワークを介した利用も可能
・「音声変換処理の負荷」を外部にオフロードできる
・利用例:ゲームなどの高負荷アプリケーションとの同時使用

GPUサポートによる高速変換

・GPUを使用すると、ほぼタイムラグなく変換可能
・GPUが無くても、高速CPUであれば、十分動く可能性がある

→github.com →w-okada →voice-changer →リアルタイム性(MMVC)

サポート音声変換AI

■MMVC_Trainer
→github.com →isletennos →MMVC_Trainer

■SoftVC VITS Singing Voice Conversion
→github.com →svc-develop-team →so-vits-svc

■Retrieval-based-Voice-Conversion-WebUI
→github.com →RVC-Project →Retrieval-based-Voice-Conversion-WebUI

■DDSP-SVC
→github.com →yxlllc →DDSP-SVC

MMVCトレーニング用音声録音アプリ「Corpus Voice Recorder」

・「GitHub Pages」上で実行できる
・ブラウザから利用可能
・録音したデータはブラウザ上に保存される :外部に漏れることはない

■アプリサイト:
→w-okada.github.io →voice-changer

■解説:
→github.com →w-okada →voice-changer →レコーダー(トレーニング用音声録音アプリ)

VC Clientの「利用方法」

①「Google Colaboratory」(MMVC)

・Google提供の機械学習プラットフォーム「Colaboratory」上で実行
・MMVCモデルのトレーニングが完了している場合、事前準備は必要無し
・ボイスチェンジャーのタイムラグが大きくなる傾向 :「ネットワーク環境」「Colaboratoryの利用状況」など

→github.com →w-okada →voice-changer →(1) Google Colaboratory での利用(MMVC のみ)

②事前ビルド済み実行形式バイナリ

・「Windows版」および「Mac版」を提供
・「content vec」のモデルが必要となる場合あり
・「DDSP-SVC」の動作には「hubert-soft」「enhancer」のモデルが必要

→github.com →w-okada →voice-changer →(2) 事前ビルド済みの Binary での利用

③環境構築して利用:「Docker」「Anaconda」など

・リポジトリをクローンして利用
・多くの環境においてこの方法が一番高速で動作する
・Windowsでの環境構築が必要 :「WSL2」「Docker もしくは Anaconda」
・Macでの環境構築が必要 :「Anaconda」など

→github.com →w-okada →voice-changer →(3) Docker や Anaconda など環境構築を行った上での利用

VC Clientの「オフィシャルサイト情報」

GitHubページ

→github.com →w-okada →voice-changer

主要開発元

VC Clientは「VC Client開発コミュニティ」が中心となり開発が進められています。

→github.com  →w-okada →voice-changer →graphs →contributors

ライセンス情報

VC Clientのライセンスは「MIT License」です。

詳細について、こちらを参照ください。

→github.com →w-okada →voice-changer →LICENSE

【お知らせ】ITセミナー「マジセミ」のご紹介

「 マジセミ 」では、日々、多くのIT関連セミナーを開催しています。

参加者のみなさまのために「本当に役立つ情報の提供」を目標としています。

また、「 マジセミ 」を通じて、デジタル関連プロダクト(サービス)との「新たな出会いの場」「新たな体験の場」を創造することで、「IT業界の発展」「製造業の発展」「エンジニアの活躍促進」の実現を目指しています。

多くのセミナーの中から「ご自身のスキルやビジネスを強化できるセミナー」を見つけて、ぜひ一度、ご参加ください。

マジセミのイメージロゴ

参考サイト
→github.com →w-okada →voice-changer

おすすめの記事

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

経済産業省による「 生成AI 利活用ガイドブック 」は、企業やクリエイター向けに、安心して「生成AI」を利用するための、「指針」「実例」「注意点」を明示しています。「業務効率化」や「新しいアイデア創出」の支援を目的としています。

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

「 2029年問題 」とは、高校でのデジタル教育改革により、新入社員と既存社員間でデジタルスキル格差が拡大する懸念を指します。企業は早急に対応が求められています。この格差は、企業競争力や業務効率にも、影響を及ぼす可能性があります。

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

「 VMWare 」の仮想化技術は、「ITインフラの効率化」に大きく貢献する技術ですが、Broadcomによる買収後のライセンス変更が大きな問題として注目されています。柔軟で慎重な契約見直しが今後の鍵となります。