TOP /  情報共有/コンテンツ管理 /  社内やクラウドに散在する文書を、自動的に整理、分類、タグ付けして、価値ある「ナレッジ」に変換する方法

社内やクラウドに散在する文書を、自動的に整理、分類、タグ付けして、価値ある「ナレッジ」に変換する方法 | 情報共有/コンテンツ管理

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該イベントの主催・共催・協賛・講演企業とも共有させていただき、 当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

メールアドレス


法人様向けの資料のため、フリーアドレスをご利用の場合は、会社名、お名前を入力してください。
会社名
お名前

社内やクラウドに散在する文書を、価値ある「ナレッジ」に変換しなければならない理由  (株式会社ヴィセント )

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該イベントの主催・共催・協賛・講演企業とも共有させていただき、 当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

メールアドレス


法人様向けの資料のため、フリーアドレスをご利用の場合は、会社名、お名前を入力してください。
会社名
お名前

セミナー全体の評価と、参加者からのコメント

参加者によるこのセミナーの評価は、
3.4 でした!(5点満点中)
セミナー名 社内やクラウドに散在する文書を、自動的に整理、分類、タグ付けして、価値ある「ナレッジ」に変換する方法
講演企業 株式会社ヴィセント 、株式会社ヴィセント
開催日 2019年06月11日
匿名の参加者
内容を今後のツールの1つとして参考にしたい
金融業・保険業・証券業 30代 男性 の参加者
文書管理とECMの明確な違いをもっと明示いただければわかりやすかったです
製造業 50代 男性 の参加者
コメントなし
運輸・倉庫業 40代 男性 の参加者
コメントなし
匿名の参加者
デモンストレーションの時間がもう少しあると良いと思います。
匿名の参加者
コメントなし
匿名の参加者
コメントなし
匿名の参加者
オンプレ、クラウドでの、Alfrescoのっ具体的なインフラアーキテクトを詳しく知りたかった。
匿名の参加者
コメントなし
製造業 50代 男性 の参加者
コメントなし

Confidential
Alfresco セミナー
社内文書を自動整理して価値ある「ナレッジ」に変換する方法
Confidential
Alfresco
Data Flow
Alfrescoデータフロー
Confidential
Alfrescoドキュメントデータフロー全体イメージ
スマートフォン
WEBブラウザ
WEBブラウザ
Windows Explorer
テキスト&
WEBページ
Alfrescoモバイルアプリ
iPhone/Android
Office
ファイル
メール&添付
ファイル
インターネット メールサーバ
(WEB)
αクローラ
スキャナ・複合機
SMTP
FTP / CIFS / Webdav
Adobe
ファイル
Adobe PDF
文字情報なし
画像
ファイル
音声
ファイル
動画
ファイル
全ての種類のファイルと文字情報を抽出
α OCR パッケージ
α Image OCR
Google Cloud API
α Sound OCR
α Video OCR
Amazon
API
ドキュメント情報抽出
ファイル名/ファイル全文情報/ドキュメントパス/作成者情報/更新者情報/その他付帯情報
αフィルタ(ルール)
テキスト分類
Other
OCR Solution
テキストクラスタリング
ドキュメント分類情報抽出
グルーピング情報/カテゴリ・ラベル情報/パラグラフ化情報/依存性マッピング情報
Alfresco API
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
3
Confidential
File Import
Method
ファイルインポート方法
Confidential
Alfrescoドキュメントデータフロー全体イメージ
スマートフォン
WEBブラウザ
WEBブラウザ
Windows Explorer
テキスト&
WEBページ
Alfrescoモバイルアプリ
iPhone/Android
Office
ファイル
メール&添付
ファイル
インターネット メールサーバ
(WEB)
αクローラ
スキャナ・複合機
SMTP
FTP / CIFS / Webdav
Adobe
ファイル
Adobe PDF
文字情報なし
画像
ファイル
音声
ファイル
動画
ファイル
全ての種類のファイルと文字情報を抽出
α OCR パッケージ
α Image OCR
Google Cloud API
α Sound OCR
α Video OCR
Amazon
API
ドキュメント情報抽出
ファイル名/ファイル全文情報/ドキュメントパス/作成者情報/更新者情報/その他付帯情報
αフィルタ(ルール)
テキスト分類
ファイルインポート
部分 OCROther
Solution
テキストクラスタリング
ドキュメント分類情報抽出
グルーピング情報/カテゴリ・ラベル情報/パラグラフ化情報/依存性マッピング情報
Alfresco API
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
5
Confidential
From WEBブラウザ
Alfrescoでは、WEBブラウザ上から簡単にドキュメントのアップロード、ダウン
ロードが可能です。
ドラッグ&ドロップ
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
6
Confidential
From エクスプローラ
Alfrescoでは、「WebDAV」、
「CIFS」、「FTP」といった形でク
ライアントPCからファイルサー
バとしてアクセスさせることも
可能です。
⇒つまり、「Windows Explorer」
からの直接アクセスが可能
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
7
Confidential
From モバイルアプリ
外出先での編集と共同作業:
パワフルで簡単なドキュメント検索とプレビュー
同期を使用してドキュメントにオフラインでアクセスする
' レビュー ' と進捗状況を追跡し、コンテンツに関するコメント
ネイティブアプリを使用して編集する (例えばマイクロソフトワー
ド)
シンプルなカスタマイズと統合:
ユーザープロファイルに基づいて表示されるメニューを簡単に変
更できます。
オープンソースアプリをスタートポイントとして使用してカスタム
アプリを開発する
モバイル SDK-カスタム構築されたアプリからのAlfrescoコンテン
ツにアクセスします。
安全な滞在:
モーションおよび静止時の暗号化
モバイルデバイス管理によるサポートmobileironそしてairwatch
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
8
Confidential
From スキャナ・複合機
スキャナや複合機が対応しているものであれば、「FTP」
「WebDAV」「CIFS」といったプロトコル(通信規格)で、スキャ
ンした文書をAlfrescoに、登録することが可能です。
FTP
WebDAV
CIFS
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
9
Confidential
From インターネットWEBページ
インターネット上に公開されている文書を、設定に応じて
自動的にWEBクローラが取得します。(※現段階で、本機
能は今後開発が見込まれる機能となります。)
WEBクローラ
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
10
Confidential
From メールサーバ
特殊な設定をAlfrescoに施すことで、特定のメールアドレ
スに送付されたメールをAlfrescoに登録することができます。
尚、メールに添付されたファイルも抽出して管理ができます。
SMTP
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
11
Confidential
From その他各種システム
「REST API」「CMIS API」を利用することで、異なるシステム
間でのデータのやり取りが可能になります。
REST API
CMIS API
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
12
Confidential
Text
Extraction
Method
全文テキスト抽出方法
Confidential
Alfrescoドキュメントデータフロー全体イメージ
スマートフォン
WEBブラウザ
WEBブラウザ
Windows Explorer
テキスト&
WEBページ
Alfrescoモバイルアプリ
iPhone/Android
Office
ファイル
メール&添付
ファイル
インターネット メールサーバ
(WEB)
αクローラ
スキャナ・複合機
SMTP
FTP / CIFS / Webdav
Adobe
ファイル
Adobe PDF
文字情報なし
画像
ファイル
音声
ファイル
動画
ファイル
全ての種類のファイルと文字情報を抽出
α OCR パッケージ
α Image OCR
Google Cloud API
α Sound OCR
α Video OCR
Amazon
API
ドキュメント情報抽出
ファイル名/ファイル全文情報/ドキュメントパス/作成者情報/更新者情報/その他付帯情報
αフィルタ(ルール)
テキスト分類
Other
OCR Solution
テキストクラスタリング
ドキュメント分類情報抽出
グルーピング情報/カテゴリ・ラベル情報/パラグラフ化情報/依存性マッピング情報
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
テキスト情報 API
Alfresco
抽出部分
14
Confidential
全文テキストの抽出について
以下の文書は、Alfrescoの標準機能で全文検索が可能
テキスト&
WEBページ
Office
ファイル
メール&添付
ファイル
Adobe
ファイル
Adobe PDF
文字情報なし
画像
ファイル
音声
ファイル
動画
ファイル
以下の文書は、αOCRパッケージで全文検索を可能に
テキスト&
WEBページ
Office
ファイル
メール&添付
ファイル
Adobe
ファイル
Adobe PDF
文字情報なし
画像
ファイル
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
音声
ファイル
動画
ファイル
15
Confidential
Alfrescoアドオン製品
αOCRパッケージ
製品元: VICENT
可能な
OCRタイプ
画像(α Image OCR)
製品形態: Alfrescoアドオン
販売形態: 現在検討中 ラベル取得
テキスト取得
顔検出
観光名称
企業ロゴ
機能概要: 音声(α Sound OCR)
対応バージョン: ACS 5.X EE(※)
Alfrescoに保管されたドキュメントのOCRを実施
音声の文字変換(日本語)
音声の文字変換(英語)
Google Vision APIを利用(現状)
画像ファイルのOCR
文字情報のないPDFファイルのOCR
音声ファイルのOCR
動画ファイルのOCR
※CE対応については現在検討中
動画(α Video OCR)
ラベルの分析
シーンの変更時間
不適切なコンテンツの分析
オブジェクトトラッキング
テキストの認識
音声文字認識
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
16
Confidential
αOCRパッケージ処理フロー概要
文書アップロード フォルダルール OCRバッチ起動 OCR結果付与
Alfrescoの特定の 予め手順に従って フラグが付いたド 対象ドキュメントのメ
フォルダにドキュメン ルールを設定してお キュメントに対して、 タデータとして、OCR
トをアップロード。 くことで、対象ドキュ OCR APIに連携し、 結果を整形して付与
メントにフラグを持た OCR処理を実行する。 する。
せる。
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
17
Confidential
Google Vision APIが解か?
現在のパッケージはGoogle Vision APIの精度に依存
利用するAPIをカスタマイズで変更することは可能
手書き文字は、クラウドサービス「Tegaki.ai」との連携を検討中
もちろんオンプレミスのOCRソフトとの連携も可能
つまり、Google Vision APIのみが解ではない
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
19
Confidential
Text
Classification
Method
全文テキスト抽出方法
Confidential
Alfrescoドキュメントデータフロー全体イメージ
スマートフォン
WEBブラウザ
WEBブラウザ
Windows Explorer
テキスト&
WEBページ
Alfrescoモバイルアプリ
iPhone/Android
Office
ファイル
メール&添付
ファイル
インターネット メールサーバ
(WEB)
αクローラ
スキャナ・複合機
SMTP
FTP / CIFS / Webdav
Adobe
ファイル
Adobe PDF
文字情報なし
画像
ファイル
音声
ファイル
動画
ファイル
全ての種類のファイルと文字情報を抽出
α OCR パッケージ
α Image OCR
Google Cloud API
α Sound OCR
α Video OCR
Amazon
API
ドキュメント情報抽出
ファイル名/ファイル全文情報/ドキュメントパス/作成者情報/更新者情報/その他付帯情報
αフィルタ(ルール)
テキスト分類
Other
OCR Solution
テキストクラスタリング
ドキュメント分類情報抽出
グルーピング情報/カテゴリ・ラベル情報/パラグラフ化情報/依存性マッピング情報
Alfresco API
テキスト
分類部分
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
21
Confidential
文書自動分類へのアプローチ方法
単純ベイズ tf-idf 潜在意味解 サポートベク
分類器 析 ターマシン
ニューラル k近傍法 決定木(例え コンセプトマ
ネットワーク ばID3) イニング
※上記は手法の例となります。
弊社では現在上記手法の一部の開発に取り組んでいます。
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
22
Confidential
分類辞書登録画面イメージ
×
「顧客」辞書登録画面
「/」で各単語を区切ってください。改行ごとに一つの用語辞書として登録されます。
既存の辞書から選択する:
顧客辞書
株式会社ヴィセント/株式会社VICENT/VICENT
株式会社OSS活用研究所/OSSラボ/活用研究所
製品辞書
人名辞書
事業部名辞書
●●●辞書
■■■辞書
キャンセル
登録
※本機能は現在開発中の機能になります。
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
23
Confidential
Word 2 Vecを利用した文書分類イメージ
長野
サラダ
ラーメン
ステーキ
ピザ
神奈川
山形
予め登録しておいた
おにぎり
ハンバー

日本
音楽
数学
美術
教科/科目
国語
都道府県
石川
料理
餃子
東京
熊本
アメリカ
体育
科学
社会
テニス
水泳
スペイン

ドイツ
サッカー
陸上
スポーツ
キーワードに
ベルギー
イタリア
近いキーワードを持つ
ラグビー
バスケットボール
野球
「Word 2 Vec」というOSSにより、あるキー
ワードに近いキーワードを取得することが
可能になります。
全ての文書に
自動タグ付けを
実行します
※本機能は現在開発中の機能になります。
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
24
Confidential
Summary
まとめ
Confidential
Alfrescoドキュメントデータフロー全体イメージ
スマートフォン
WEBブラウザ
WEBブラウザ
Windows Explorer
テキスト&
WEBページ
Alfrescoモバイルアプリ
iPhone/Android
Office
ファイル
メール&添付
ファイル
インターネット メールサーバ
(WEB)
αクローラ
スキャナ・複合機
SMTP
FTP / CIFS / Webdav
Adobe
ファイル
Adobe PDF
文字情報なし
画像
ファイル
音声
ファイル
動画
ファイル
全ての種類のファイルと文字情報を抽出
α OCR パッケージ
α Image OCR
Google Cloud API
α Sound OCR
α Video OCR
Amazon
API
ドキュメント情報抽出
ファイル名/ファイル全文情報/ドキュメントパス/作成者情報/更新者情報/その他付帯情報
αフィルタ(ルール)
テキスト分類
Other
OCR Solution
テキストクラスタリング
ドキュメント分類情報抽出
グルーピング情報/カテゴリ・ラベル情報/パラグラフ化情報/依存性マッピング情報
Alfresco API
クリエイティブ&
ビジネスロジックゾーン
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
26
Confidential
Alfresco事例リスト
公開文書スクレイピング 多拠点ファイルサーバ
某法律事務所様事例 大手配送業様事例
WEBコンテンツ管理 図版・設計書管理
某新聞会社様事例 大手電子機器メーカー様事

ナレッジシェア
大手広告代理店様事例
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
27
Confidential
導入上&運用上の注意点
Alfrescoをナレッジシェア用のプラットフォームとして、利用
する場合の注意点。
あくまでDXプラットフォーム
公開範囲(権限設定)に考慮が必要
NGワード、機密情報のフィルタリングが必要
COPYRIGHTVICENT CO.,LTD. ALL RIGHT RESERVED.
28
Confidential
EOF

他のカテゴリから探す

IT業界の改革にご協力いただけませんか?

本サイトは、株式会社オープンソース活用研究所がプロデュースする、中小IT企業による”本気”の情報提供セミナー「マジセミ」の結果レポートページです。「マジセミ」は、次を目的として活動しています。

我々はITエンジニアが、今よりももっと「誇り」と「喜び」をもって仕事をし、今よりももっと企業や社会に貢献できる、そんなIT業界を創りたいと考えています。

そのためには、技術をもった中小のIT企業がもっと元気になる必要がある。その為には、技術をもった中小のIT企業を、もっと皆様に知って頂く必要がある、と考えました。

株式会社オープンソース活用研究所
代表取締役所長 寺田雄一

本当かウソか、あなたが見極めてください。

もし、我々のこの活動にご賛同していただけるのであれば、ぜひ下のセミナーに参加してください。

「なんだ、結局ただの売り込みセミナーじゃないか」

もしそう感じたら、アンケートなり、あなたのFacebookなりに、そのままお書き頂き、拡散して頂いて構いません。

参加者からのお褒めの言葉、お叱りの言葉が、我々中小IT企業を成長させ、それが日本のIT業界を変えていくのだと、強く確信しています。

あなたの行動が、日本のIT業界を変えるのです。

「マジセミ」のFacebookページ

今後のセミナー情報などを提供させていただきたますので、「マジセミ」のFacebookページに「いいね!」をお願いします。

日本のIT業界を変えるためのアクション、ありがとうございました!