マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2023.05.08

【OSS情報】AIネイティブ埋め込みデータベース「 Chroma 」

【OSS情報】AIネイティブ埋め込みデータベース「 Chroma 」

【OSS情報】AIネイティブ埋め込みデータベース「 Chroma 」

Chromaのイメージ

Chromaの「概要」

「Chroma」(クロマ)とは、オープンソースのAIネイティブ「埋め込みデータベース」です。
「埋め込み」を使用して、「Python」または「JavaScript」で、AIアプリケーションを構築できます。

開発目標

・シンプル
・開発者の生産性向上
・検索機能
・分析機能
・高速動作
・多くのユースケースに対応できる柔軟性

ポイント

・シンプル
・完全型付け
・統合 :「Python」「JavaScript」
・API :「Jupyter Notebook」で実行されるAPIと同じ
・豊富な機能 :「クエリ」「フィルタリング」「密度推定」など
・完全に文書化

主な機能

・「埋め込み」および「メタデータ」を保存
・「ドキュメント」と「クエリ」を埋め込む
・「埋め込み」を検索

ユースケース

・「LLM」(Large Language Models)アプリの構築
・データベースにドキュメントを追加 :「独自埋め込み」「埋め込み関数」
・自然言語で関連ドキュメントを照会
・LLMコンテキストウィンドウにドキュメントを作成 :「追加」「要約」「分析」

オンラインデモ

→colab.research.google.com →Chromadb example

Chromaの「特徴」

動作モード:「インメモリモード」と「クライアントサーバモード」

■インメモリモード
・Pythonで動作
・終了時に保持
・開始時にロード
・プロトタイピングワークロード向き

■クライアントサーバモード
・Pythonで動作
・JavaScriptで動作
・オンディスクデータベースを使用
・Dockerコンテナを実行

→docs.trychroma.com →usage-guide

埋め込み機能

■「埋め込み」とは
・AIネイティブ化の方法の1つ
・あらゆる種類のデータを表現する :「テキスト」「画像」「オーディオ」「ビデオ」
・「ローカルで使用」もしくは「APIを呼び出し」

■Chromaの埋め込み機能
・一般的な埋め込みプロバイダーに軽量ラッパーを提供
・アプリで簡単に使用できる
・Chromaコレクションを作成するには「埋め込み関数を設定」もしくは「自分で直接呼び出す」

→docs.trychroma.com →embeddings

統合

・LLMライブラリ「LangChain」
・LLM用構造化データライブラリ「LlamaIndex」
・クラウド型AIプラットフォーム「OpenAI API」 など

→docs.trychroma.com →integrations

サーバデプロイ

・Chromaをサーバにデプロイして、リモートで接続することも可能
・「AWS EC2」に Chromaをデプロイして実験するための「AWS CloudFormationテンプレート」を提供

→docs.trychroma.com →deployment

Chromaの「オフィシャルサイト情報」

オフィシャルサイト

→trychroma.com

GitHubページ

→github.com →chroma-core →chroma

主要開発元

Chromaは「Chroma社」が中心となり開発が進められています。

→docs.trychroma.com →about

ライセンス情報

Chromaのライセンスは「Apache License 2.0」です。

詳細について、こちらを参照ください。

→github.com →chroma-core →chroma →LICENSE

インストール

→docs.trychroma.com →usage-guide

【お知らせ】ITセミナー「マジセミ」のご紹介

「 マジセミ 」では、日々、多くのIT関連セミナーを開催しています。

参加者のみなさまのために「本当に役立つ情報の提供」を目標としています。

また、「 マジセミ 」を通じて、デジタル関連プロダクト(サービス)との「新たな出会いの場」「新たな体験の場」を創造することで、「IT業界の発展」「製造業の発展」「エンジニアの活躍促進」の実現を目指しています。

多くのセミナーの中から「ご自身のスキルやビジネスを強化できるセミナー」を見つけて、ぜひ一度、ご参加ください。

マジセミのイメージロゴ

参考サイト
→github.com →chroma-core →chroma
→trychroma.com
→docs.trychroma.com

おすすめの記事

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

「 2029年問題 」とは、高校でのデジタル教育改革により、新入社員と既存社員間でデジタルスキル格差が拡大する懸念を指します。企業は早急に対応が求められています。この格差は、企業競争力や業務効率にも、影響を及ぼす可能性があります。

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

「 VMWare 」の仮想化技術は、「ITインフラの効率化」に大きく貢献する技術ですが、Broadcomによる買収後のライセンス変更が大きな問題として注目されています。柔軟で慎重な契約見直しが今後の鍵となります。

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

経済産業省による「 生成AI 利活用ガイドブック 」は、企業やクリエイター向けに、安心して「生成AI」を利用するための、「指針」「実例」「注意点」を明示しています。「業務効率化」や「新しいアイデア創出」の支援を目的としています。