TOP /  人工知能 /  人工知能をどうビジネスに活用するか?~オープンソースのディープラーニング「TensorFlow」の活用例から考える~

人工知能をどうビジネスに活用するか?~オープンソースのディープラーニング「TensorFlow」の活用例から考える~ | 人工知能

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該イベントの主催・共催・協賛・講演企業とも共有させていただき、 当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

メールアドレス


法人様向けの資料のため、フリーアドレスをご利用の場合は、会社名、お名前を入力してください。
会社名
お名前

Tensorflowとディープラーニング、ビジネスでの活用例  (株式会社KSKアナリティクス  高木 宏明・渡邊 輝)

機械学習の中でのディープラーニングの位置づけを解説するとともに、TenssorFlowのメリット、課題、ビジネスでの活用例をご紹介いたします。

いち早く人工知能テクノロジーを取り入れた 製品・サービスを市場に展開するには?  (株式会社クラスキャット 佐々木 規行)

人工知能や機械学習の本質とそれらの背景と共に最新の市場動向を把握し、自社における機械学習の活用ならびに機械学習を取り入れた新規ビジネス実現のためのステップを解説いたします。

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該イベントの主催・共催・協賛・講演企業とも共有させていただき、 当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

メールアドレス


法人様向けの資料のため、フリーアドレスをご利用の場合は、会社名、お名前を入力してください。
会社名
お名前

セミナー全体の評価と、参加者からのコメント

参加者によるこのセミナーの評価は、
3.7 でした!(5点満点中)
セミナー名 人工知能をどうビジネスに活用するか?~オープンソースのディープラーニング「TensorFlow」の活用例から考える~
講演企業 株式会社KSKアナリティクス 、株式会社クラスキャット 、株式会社XEENUTS
開催日 2017年01月18日
その他 50代 女性 の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 40代 男性 の参加者
AIの状況がよくわかりました。
企業に対してITを提供する企業(ベンダー、SIerなど) 50代 男性 の参加者
もやもやしてたのがすっきりした
ニフティ株式会社 金岡亮さん
ビジネス適用の視点が多く、実践的でした。
匿名の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 60代以上 男性 の参加者
公演を行って、質疑を行った点、非常に有意義であった 公演よりも的を得た討論ができ、日頃の疑問点がはっきりした。
匿名の参加者
AIに関して、多岐にわたるトピックスで、興味深かったです。
製造業 40代 男性 の参加者
良いところ: 講師の方が丁寧に説明して下さり、わかりやすかった 悪いところ: 時間が限られているので、駆け足だった
金融業・保険業・証券業 40代 男性 の参加者
「誇大広告」というお言葉もありましたが、DLが適する分野、レガシーで対応できる分野、それぞれの概念を今日整理することができました。
匿名の参加者
コメントなし
出版・放送・その他メディア 50代 男性 の参加者
幅広い話が聞けました。有難うございました。
その他のIT関連業 40代 男性 の参加者
パネルディスカッションは、参加者側の知りたい所や、想いも知れてよいものでした。 前半は、いまいち… ディスカッションだけの回があってもいいかも。
製造業 30代 男性 の参加者
Tensorflowを紹介してもらったのはいい。 自分が機械学習、ディープラーニングを導入する場合のイメージがしやすかった。
アルティザンエッジ合同会社 井上 研一さん
1つ1つのセッションが短い印象ですが、ディスカッションが良かったのではないかと思います。
企業に対してITを提供する企業(ベンダー、SIerなど) 30代 男性 の参加者
ディープラーニングの理解が深まった。
製造業 40代 男性 の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 40代 女性 の参加者
Tensorflowの話(特に自然言語処理)をもっと聞きたかったです。 機械学習やディープラーニングの基本的な内容も知りたいので、資料を早く共有して頂けると嬉しいです。
匿名の参加者
講演時間は、もう少し時間を割いても良かったと思う。
金融業・保険業・証券業 40代 男性 の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 40代 男性 の参加者
コメントなし
匿名の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 40代 男性 の参加者
活用例がテーマだったが、あまりその話が無かった。 パネルでは、少しその話があったので、良かった。
企業に対してITを提供する企業(ベンダー、SIerなど) 30代 男性 の参加者
機械学習とディープラーニングの違いが、明確になった。
企業に対してITを提供する企業(ベンダー、SIerなど) 30代 男性 の参加者
大変わかりやすく説明頂き、満足しました。
匿名の参加者
実例が参考になりました。ありがとうございました。
匿名の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 20代 男性 の参加者
QAの内容により、各社の目指している所や、目的が分かって良かった。 今後も、セミナー案内があれば、送って頂きたい。
その他のサービス業 20代 男性 の参加者
Tensorflowの具体的な使用方法を学べるかと思っていたが、改めて概要をお聞きできて、勉強になりました。
企業に対してITを提供する企業(ベンダー、SIerなど) 30代 男性 の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 30代 男性 の参加者
データ分析とAIの違いが良く分からなくなってきた
その他 50代 男性 の参加者
ビジネスに役立つというタイトルの割には、ビジネス適用の話が少ないように感じました。
消費者に対してITを提供する企業(Webサービス、ゲームなど) 30代 男性 の参加者
具体例が聞けてよかった。ビジネスにどうやって結びつけるのかがイメージがつかなかったため。
金融業・保険業・証券業 40代 男性 の参加者
コメントなし
製造業 30代 男性 の参加者
Q,A、セッションが本当に面白かったです。これを売りにされた方がいいのでは? 業界さまざまな方の質問とその答えが良かったです。
企業に対してITを提供する企業(ベンダー、SIerなど) 30代 男性 の参加者
コメントなし
金融業・保険業・証券業 50代 男性 の参加者
資料がないとメモを取るのが大変 トイレ休憩なしで2時間きつい。 時間をまもれ、押したら急げよ!
企業に対してITを提供する企業(ベンダー、SIerなど) 50代 男性 の参加者
コメントなし
その他のIT関連業 30代 男性 の参加者
AIのビジネス活用について、事例が学べたので、良かったです。
その他 60代以上 男性 の参加者
関心を持っていましたが、今OOもっと知る必要があると強く感じました。
匿名の参加者
コメントなし
企業に対してITを提供する企業(ベンダー、SIerなど) 40代 男性 の参加者
ユーザー企業側が困っている所と、主催者側の提案(解決策)を実際に聞けたところが良かった。
製造業 50代 男性 の参加者
人口知能が実際のBizですでに使われており、今からスタートするのは遅いぐらいとの話を聞き、少しあせりました。
製造業 30代 男性 の参加者
ラストのディスカッションが有意義で良かったです。
匿名の参加者
コメントなし

Tensorflowとディープラーニング、
(機械学習)ビジネスでの活用例
株式会社KSKアナリティクス
セールス・マーケティング本部 部長
データソリューションプランナー
高木宏明
本日のアジェンダ
 機械学習とは
 深層学習(ディープラーニング)とは
 従来の機械学習と深層学習の違い
 TensorFlow紹介
 何でもかんでもディープラーニング?
© KSK Analytics Inc.
2
本日のアジェンダ
 機械学習とは
 深層学習(ディープラーニング)とは
 従来の機械学習と深層学習の違い
 TensorFlow紹介
 何でもかんでもディープラーニング?
© KSK Analytics Inc.
3
データ分析の活用例





機械・設備の故障予測、異常検知
サービス解約顧客の予測
商品のレコメンデーション(推薦)
新商品の需要予測
クレーム要因の特定
「機械学習」の手法を適用
※弊社サイトに一部事例を掲載
http://www.ksk-anl.com/#!casestudy/cfxt
© KSK Analytics Inc.
4
機械学習
データに潜むパターンや規則性を発見すること
入力データ
機械学習の
「手法」
・機械の稼働ログ
・センサ
・顧客マスタ
・購買履歴
・アンケート
・・・など
学習モデル
入力データの
パターンや規則性
機械に「学習」させる
© KSK Analytics Inc.
5
機械学習の手法(アルゴリズム):全体像
回帰分析 クラスタリング
クラス分類 パターン抽出
教師あり学習 教師なし学習
© KSK Analytics Inc.
6
機械学習の手法(アルゴリズム):全体像
回帰分析 クラスタリング
クラス分類 パターン抽出
教師あり学習⇒予測
© KSK Analytics Inc.
7
教師あり学習から予測へ
例:機械・設備の正常/故障を予測
正常/故障が判明しているデータ
(正解を持つデータ)
(A)
正常/故障が判明していないデータ
(正解を持たないデータ)
(B)
© KSK Analytics Inc.
8
教師あり学習から予測へ
例:機械・設備の正常/故障を予測
正常/故障が
判明しているデータ
(A)
機械に「学習」させる

機械学習の「手法」
(クラス分類)

学習モデル

正常/故障が
判明していないデータ
データ(A)の
パターンや規則性

正常/故障を
予測したデータ
(B)‘
(B)
© KSK Analytics Inc.
9
対象
変量
種類
説明性
分析手法
◎ ヒストグラム
○ 検定
○ 推定
主成分分析(PCA)
◎ 相関分析
○ アソシエーション分析
△ コレスポンデンス分析
○ 階層型クラスタリング
○ K-meansクラスタリング
自己組織化マップ
協調フィルタリング
◎ 決定木分析
○ K近傍法
○ ナイーブベイズ
◎ 線形回帰分析
○ 分散分析
× ニューラルネット
サポートベクターマシン
× ロジスティック回帰
×
機械
学習
(教師あ
り・
予測型)
度数集計




◎ ×





機械
学習
(教師な
し・
発見型)
要約統計量

推測
統計
◎ △
1


分布と
代表値
事例
品質管理
RFM分析
ロングテール
判別分析
実験計画法
臨床試験
価格最適化
マーケットバスケット分析
顧客セグメンテーション
クロスセル・アップセル
系統樹(生命科学)
アンケート分析
レコメンデーション
顧客離反防止
倒産予知モデル
キャンペーンの効果測定
店舗別売上予測
広告効果測定
ソーシャルメディア分析
クレジットカード不正検知
物流最適化
設備の予防保全
画像解析
※1:構造化データサイエンスモデル[SDSM] (工藤卓哉氏, 2013)より修正加筆。※2:分析手法(太字)は弊社RapidMinerトレーニングに含む。
© KSK Analytics Inc.
10
データ分析で使う手法の体系
(人工知能)
© KSK Analytics Inc.
11
本日のアジェンダ
 機械学習とは
 深層学習(ディープラーニング)とは
 従来の機械学習と深層学習の違い
 TensorFlow紹介
 何でもかんでもディープラーニング?
© KSK Analytics Inc.
12
ニューラルネット
脳の最小単位の構造をもとに作られた「回帰」と
「分類」のアルゴリズム。
教師あり学習のため予測が可能。
神経網
神経細胞
http://www.scj.go.jp/omoshiro/kioku2/index.html
© KSK Analytics Inc.
13
ディープラーニング(深層学習)
ニューラルネットの学習において使用する「層」を
多く(深く)重ねて学習するアルゴリズム。
複数層ある
© KSK Analytics Inc.
14
例:機械・設備の正常/故障の分類モデル
(センサ(数値)データを対象)
電圧
状態
「正常」
回転
状態
「故障」
圧力



学習フェーズ
© KSK Analytics Inc.
15
ディープラーニングとは
• ネットワーク状の複雑な演算処理
• 主要な設計ファクター
1.
2.
3.
4.
5.
ネットワーク構成 = 使用用途
隠れ層の数
ノード数
活性化関数
最適化アルゴリズム
• 隠れ層 = 特徴量の自動計算?
© KSK Analytics Inc.
ニューラルネットがベースなので、分類問題と
回帰問題を解くことができ、従来の機械学習の手法
と比較し高精度に学習できる。
画像認識、音声認識の分野で特に効果を発揮する。
自動運転
© KSK Analytics Inc.
ロボット
音声検索
17
Deep Learningの難しさ
1. ネットワーク構成は日進月歩

次々と新しい論文が発表されている
2. 鬼門パラメータチューニング


State of Artの職人技
構成、層・ノード数、活性化関数、最適化
3. 日本語の情報源が少ない
© KSK Analytics Inc.
18
本日のアジェンダ
 機械学習とは
 深層学習(ディープラーニング)とは
 従来の機械学習と深層学習の違い
 TensorFlow紹介
 何でもかんでもディープラーニング?
© KSK Analytics Inc.
19
前から一人の人間(大人)が歩いてきます。
男性でしょうか?女性でしょうか?
ただし
データだけで判断してください。
© KSK Analytics Inc.
20
見分ける(分類)に使える特徴(変数)は?
年齢 43歳
出身地 東京都
身長 162cm
体重 58kg
右視力 1.2
左視力 1.0
好きな番組は バラエティ
よく聞く音楽は サザンオールスターズ
© KSK Analytics Inc.
21
見分ける(分類)に使える特徴(変数)は?
髪の毛の長さ 38cm
スカートを履いている YES
ハイヒールを履いている YES
喉仏の凹凸

答え:女性
© KSK Analytics Inc.
22
機械学習と深層学習の違い
従来の機械学習 入力
・髪の長さ
・スカート着用
・咽喉の凹凸
etc
ディープラーニング
入力
特徴抽出
特徴抽出+
パラメータ学習
パラメータ学習
データの特徴を自動で抽出!
© KSK Analytics Inc.
23
なぜディープラーニングか
非構造化データの一般化に優れている


「特徴」を抽出し識別
https://www.tensorflow.org/
© KSK Analytics Inc.
24
画像認識(活用イメージ)
例:製品検査工程においてキズあり製品を検出したい
© KSK Analytics Inc.
25
画像認識(活用イメージ)
例:製品検査工程においてキズあり製品を検出したい
異常検出
学習モデル作成
モデル適用
:正常画像
正常/異常の画像データ
© KSK Analytics Inc.
:異常画像
26
本日のアジェンダ
 機械学習とは
 深層学習(ディープラーニング)とは
 従来の機械学習と深層学習の違い
 TensorFlow紹介
 何でもかんでもディープラーニング?
© KSK Analytics Inc.
27
ディープラーニングを使える分析ソフト
 TensorFlow
Google社が提供するDL、最もポピュラー
 CNTK
Microsoft社が提供するDL、2015年の画像認識コンペで優勝
 Theano
アカデミックで最も使用されているDL
 Caffe
UCバークレー発のDLフレームワーク
 Chainer
Preferred Networks及びPreferred Infrastructure社が提供する
フレームワーク
© KSK Analytics Inc.
28
TensorFlowとは
• オープンソフトウェア・ライブラリ
 ソフトウェアを開発するための部品の集まり
 Apache 2.0 open source license
 Google Brain Teamが開発
• プログラミング言語
 Written by: C / C++
 API ready for: C++ / Python
© KSK Analytics Inc.
29
TensorFlowとは
• 「グラフ」という概念
 ノード = 演算処理
 エッジ = データの流れ
 Tensor = 多次元配列
• つまるところ
https://www.tensorflow.org/
 ×:Deep Learningを構築するためのもの
 ○:機械学習アルゴリズムを柔軟に実装するもの
 ◎:複雑な算術演算を柔軟に実装するもの
© KSK Analytics Inc.
30
TensorFlowの難しさ
1. プログラミング
• TensorFlow + Python = メタ・プログラミング
• 柔軟性が高い = 難易度も高い
2. 数学

微積分と線形代数
3. 機械学習

統計的な考え方
https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83
© KSK Analytics Inc.
31
分析プロセスの可視化
TensorBoard機能を使って、学習状況の確認や
モデルの可視化を行える。
© KSK Analytics Inc.
32
本日のアジェンダ
 機械学習とは
 深層学習(ディープラーニング)とは
 従来の機械学習と深層学習の違い
 TensorFlow紹介
 何でもかんでもディープラーニング?
© KSK Analytics Inc.
33
数値データを使った分類モデルの精度は?
従来の機械学習(決定木) ⇒ 83.55%
ディープラーニング 82.33%
© KSK Analytics Inc.

34
KSKアナリティクス会社紹介
・補足資料
株式会社KSKアナリティクス
セールス・マーケティング本部 部長
データソリューションプランナー
高木 宏明
w w w . k s k - a n l . c o m
36
KSKアナリティクス
会社紹介
Copyright © KSK Analytics Inc. All rights reserved
37
KSKアナリティクス ビジョン
Data Analysis for Everyone !
誰もが当たり前にデータを分析・活用できる社会
数万年前、ヒトは言葉により知識を伝えるようになりました
数千年前、文字により後世に知識を残せるようになりました
数十年前、Webにより、世界中が知識を検索・共有できるようになりました
数年前から、それらはデータを産み、新たな知識を創造できるようになりました。
一方で、どれだけのヒトがこれらのデータを本当に活用できているでしょうか?
データの活用は、一部の特別なスキルや知識を持った個人・組織に限られ、
多くの人々が自らの問題解決のためにデータを使うことができていません。
KSKアナリティクスのビジョンは、
優れたアナリティクスの「オープンソース・ソフトウェア」と、
現場と協働する「アナリティクス・サービス」で、
誰もが当たり前にデータを分析・活用できる社会を作ることです。
これにより企業・個人の生産性が向上し、より多くのイノベーションが生まれ、
わたしたちの暮らしが物心ともに豊かになる、そんな未来作りを目指しています。
Copyright © KSK Analytics Inc. All rights reserved
38
KSKアナリティクス ビジネス領域
Big Data・AI時代の新しい情報インフラベンダ
大規模DB構築〜データ分析コンサルティングまで幅広く対応
ソリューション例
分析コンサルティング
BI・BAソフトウェア
分析基盤・大規模DB構築
・データ活用した新規ビジネス開発
・社内データアナリスト育成支援
・統計/機械学習アルゴリズム実装
・企業業績モニタリング
・ダッシュボード・スコアカード
・予実管理・地域顧客別分析
・Tera・Petaデータ対応DB構築
・DWH構築/ETL定義
・機械学習ライブラリ
Copyright © KSK Analytics Inc. All rights reserved
39
KSKアナリティクス ヒストリー
優れたオープンソース発掘、先駆的に日本総代理店へ
日本語ローカライズ、日本におけるマーケティング活動を推進
弊社の取り組み
2006年
2007年
2008年
2010年
2011年
2012年
2013年
2014年
2014年
2014年
2015年
2016年
2017年
大阪にて創業
Pentaho (大規模BI 米国)
東京拠点 開設
Infobright (カラム型DB カナダ)
RapidMiner (機械学習BA 米国)
Jedox (エクセルベースBI ドイツ)
データ分析事業開始
Revolution R (商用版R 米国)
Cloudera (商用版Hadoop 米国)
NYSOL (前処理高速化 日本)
オフショア分析(ベトナム)
TensorFlow (Google AI 米国)
OSS系分析プラットフォーム(予定)
Copyright © KSK Analytics Inc. All rights reserved
40
KSKアナリティクス メンバー紹介
メンバー約25名、少数精鋭の多彩なタレント集団
東京・大阪に拠点あり、各国のオープンソースを日本語サポート
代表取締役 シニアデータアナリスト シニアコンサルタント 外部分析アドバイザー
英ブラッドフォード大(MBA)、 RapidMiner認定アナリスト、 Pentaho認定BIコンサルタ 関西学院大学経営戦略研究科
中小企業診断士、Pentaho認 EMC認定データサイエン ント、オープンソースを活 准教授
定BIコンサルタント、 ティスト(EMCDSA)、ス 用したBI/BAシステムや
RapidMinerアナリスト クラムマスター(アジャイル データ基盤の設計、構築の
開発)、MBA、統計士 経験豊富
森本
好映
北島

久保田
道之
社内資格累計
・BI・BAソフト認定資格
8名
・DB・機械学習エンジニア 10名
(TensorFlow ・ Hadoop ・Spark etc)
羽室 行信
OR学会事例研究賞(2005, 2008,
2015)、データ解析コンペティ
ション最優秀賞(2006, 2013)など
受賞多数。大規模データ分析基盤
NYSOLの開発リーダー。著書
『データマイニングとその応用』
・語学(TOEIC900over)
・MBA
Copyright © KSK Analytics Inc. All rights reserved
3名
4名
41
分析事例:センサーログからの事前故障予測
大手医療機器製造会社~サービス部門
モデリング
機器内の
各種センサー
データ
フィードバック
アナリティクスによる問題解決
ビジネス課題
・機器から送付されてくる様々なセン
サーデータから、機器のメンテナンス必
要時期と交換が必要パーツを予測したい。
・不必要な訪問やパーツ交換を省いてコ
ストを削減したい。
予測レポート
• 過去2年蓄積分のセンサーデータの分析、属性の
絞り込み、関連性をモデル化。
• 予測モデルの作成とレポーティングにより、メン
テナンス担当者への自動通知。
• さらに、予測レポート結果のフィードバックを取
り込むことで、より予測精度の向上を継続的に高
めていくように仕組みを作成。
分析事例:統計予測モデルを活用した需要予測
大手楽器メーカー~製造調達部門
過去の出荷
実績データ
予測数量
予測モデル
ビジネス課題
・サプライチェーンにおける流通在庫を最
適化したい。タイムリーな需要予測により、
多様な製品にかかわる部品在庫を削減した
い。
・部品ごとのリードタイムに応じて、安全
在庫を設定したい。
SCMシステム
アナリティクスによる問題解決
• 月次の売上数量をトレンドと季節傾向に分解し、
モデル式を作成。将来12ヶ月間の月別の売上を
予測。
• 予測は製品の発売前から適用可能に、機種別、
製品別など任意の単位で予測可能に。
• 予測モデルをパラメータ化、モデル作成時の傾
向が持続しないと予想される場合があるため 実
績データの蓄積に応じて予測を更新可能に。
43
大規模並列分散リアルタイム分析プラットフォーム構築
構築事例:サーバ70ノード、約200TByteの分析基盤の構築
Sparkを中心にした高速多用途データ活用クラスタシステム
Copyright © KSK Analytics Inc. All rights reserved
44
補足:
テクノロジー進化
45
様々な機械学習アルゴリズム
分類モデルのアルゴリズム例









決定木(Decision Tree)
最近傍法(k-NN)
線形回帰
ロジスティック回帰
ランダムフォレスト
サポートベクターマシン(SVM)
Gradient Boosted Trees
ニューラルネットワーク
ディープラーニング
Copyright © KSK Analytics Inc. All rights reserved
46
年々複雑化するDeep learningのレイヤ構造
画像分類コンテスト
ImageNet Challenge
Copyright © KSK Analytics Inc. All rights reserved
47
年々複雑化するDeep learningのレイヤ構造
AlexNet [Krizhevsky et al. 2012] ⇒
8layers
GoogLeNet [Szegedy et al., 2014] ⇒
Copyright © KSK Analytics Inc. All rights reserved
22layers
48
年々複雑化するDeep learningのレイヤ構造
分類精度が向上していくも指数関数的にレイヤ構造が複雑へ
⇒必要マシンリソースが増大
Copyright © KSK Analytics Inc. All rights reserved
49
ネットワーク進歩:次世代通信規格5G(2020年予定)
ストレージやネットワーク等も指数関数的に増大していく(通信速度は30年で1万倍へ)
次世代5Gでは3.8GBのHD映画をダウンロードするのに計算上約3秒で完了
出所:NTT/総務省資料などより抜粋
50
IoTによる爆発的なデータ増大、2020年には40ZByteへ
出所: 総務省 27年度 情報通信白書より
原典「The Digital Universe of Opportunities:Rich Data and the Increasing Value of the Internet of Things」Sponsored by EMC(2014年4月)
51
補足:
ビジネス活用へのポイント
52
企業内でデータ分析を推進する必要条件
データサイエンティストの3要素を組織能力として獲得する必要がある
トップダウンで横断的にデータ統合、ビジネス企画を推進し全体最適へ
分析に必要な要素
データ活用の企画力
(ビジネス力)
分析リテラシー
(情報処理・統計・機械学習
アルゴリズム力)
データの蓄積
(データエンジニア力)
出所:Amazon社プレスリリース・特許情報

・現状のビジネスへの深い理解
・データを活用したビジネスモデルを
一から構築できる企画力
・基本的な統計スキル
・情報処理・統計処理・機械学習など
アルゴリズム理解
・一元的に社内・社外データへアクセス
できるデータ統合環境
・数十Tera以上のデータに対応した高速処理DB
出所:一般社団法人データサイエンティスト協会資料を参考に作成
53
企業内でデータ分析を推進する必要条件
データサイエンティストの3要素を組織能力として獲得する必要がある
トップダウンで横断的にデータ統合、ビジネス企画を推進し全体最適へ
データ活用の企画力
(ビジネス力)
分析リテラシー
(情報処理・統計・機械学習
アルゴリズム力)
データの蓄積
(データエンジニア力)
出所:Amazon社プレスリリース・特許情報

・現状のビジネスへの深い理解
・データを活用したビジネスモデルを
一から構築できる企画力
・基本的な統計スキル
・情報処理・統計処理・機械学習など
アルゴリズム理解
・一元的に社内・社外データへアクセス
できるデータ統合環境
・数十Tera以上のデータに対応した高速処理DB
出所:一般社団法人データサイエンティスト協会資料を参考に作成
54
分析テーマ選び例:製造工場
どちらの分析テーマに重点を置くべきか?
「機械の故障予測」
現状:機器(単価1千万円)故障に備
えて部品保管・定期メンテナンス
テーマ:稼働ログデータから機器の
故障を予測し壊れる前に部品交換
「製品の外観検査」
現状:毎日10万点を超える製品
を検品従事者10名で目視確認
テーマ:「正常」画像と「異常」画像
をDeepLearningで分類
55
分析テーマ選び
・「分析目的」をハッキリさせる
-売上向上? -コスト低減? -効率向上? -試験・検証?
・ビジネスインパクトはどの程度あるのか?
-意味のないデータ分析は予測精度が良くても意味がない
・分析に必要なコストを事前に見積もる
-データは既に取れているのか? or これから?
-データの中に特徴量は含まれているのか?
(特徴量=取得しているデータの中に相関・因果がある)
-分析の難易度(アルゴリズム)
-データ取得コスト、データ保管コスト
-運用時:計算量、サーバ・ストレージ・ネットワークコスト
56
アジャイル(反復型)分析
設定した期間毎に分析内容の優先順位を変更しながら進める
(プロジェクト後半の修正変更が容易に受け入れ可能)
プロジェクトで取り組む
分析項目をリスト化
「ビジネス価値」を生む
優先順に並び替え
順位の高い
手順確認
項目から
タスク分割
反復型の分析
おおよそ
の分析規
模を見積
共有
結果を踏まえ優先
順位を再検討
加工・分析
資料化
アクション
(結果の活用)
57
企業内のデータ分析テーマ例
全社レベルではなく、単一部署内のさらに”担当者レベル”の分析テーマが
非常に多い。全社横断的に分析テーマを考える必要あり。
分析テーマ案
(例)化粧品メーカ イシューツリー
店舗販売増
売上増
Web販売増
既存事業の利益増
調達コスト減
製造コスト減
Gr全体の利益増大
コスト減
人件費減
販管費減
資本コスト減
新規事業
・購買データのレポーティングビジネス
・顧客動向に基づく株式運用
・関連ビジネス、周辺店舗への送客支援
・顧客属性クラスタリング
・時間帯別・年代別クロス集計・併売分析
・Beaconによる店舗内動線分析
・商圏分析、周辺地域流出入
・DAU増・コンバージョン率増
・リテンション率増
・仕入れ窓口集約化
・季節変動予測、一括購買
・サプライチェーン最適化
・ボトルネック検出、アイドルタイム減
・設備異常検知、故障予測
・開発・製造リードタイム短縮化
・在庫最適化による長期在庫減
・人財ハイパフォーマー分析
・ターゲット絞り込みによる採用コスト減
・間接処理自動化による間接人員削減
・TV CM広告効果測定・ブランド価値測定
・非稼動設備・ソフトウェアの売却/解約
・CCCレート改善
・与信精度向上による貸倒金の削減
58
分析テーマ例:現状の製造業の設備・機器予防保全の問題点
現状の問題点
突然の機器故障
事前部品交換
部品在庫コスト
定期点検・
メンテナンス
■ラインが止まり工場全体の稼働率が低減
■故障を予防するために定期的に部品を交換
(ただし、非常に高額な部品も経験と勘で交換)
■突然の故障に備えて部品を自前で保管
(購入コスト・保管コストが大きい)
■上記のような事態を防ぐために、短い周期での
定期点検・メンテナンスを人手で実施している。
(点検コスト
大)
59
分析テーマ例:現状の製造業の設備・機器予防保全の問題点
トータルで数億円以上のコストが発生している
⇒これらを機械学習/DeepLearningで軽減
突然の機器故障 ⇒1時間稼働停止毎に数千万円の損害
事前部品交換 ⇒1部品が数百万円超
部品在庫コスト
定期点検・
メンテナンス
⇒数千万~億円の部品在庫保有
⇒高度エンジニアの人件費
500~1000万円 /一人当たり年間
工場の中にある様々なデータ例
「センサーデータ」
「ログデータ」
・熱 ・温度 ・湿度 ・設置日 ・メンテナンス日
・速度 ・加速度 ・回転数 ・稼働時間/稼働件数
・音声 ・振動 ・電流 ・電圧 ・障害履歴(テキスト)
etc etc
⇒ビッグデータより”障害の因果”を見つけることが
データ分析の最大の課題
60
61
匠の知見をデータ分析で活かす
「熟練エンジニア」
「データ・アルゴリズム」

機械の故障予測、障害検知は熟練した
現場エンジニアの技で現状実現
⇒なぜ故障が起こるか因果は理解して
いるが経験と勘が大きく、ノウハウと
して伝承・精度向上が難しい
データサイエンティストは分析のため
のデータ操作とアルゴリズムに強い
⇒しかし、現場知識が無いため、やみ
くもにデータを収集・解析する恐れ
現場の熟練エンジニア(匠の知見)を活かして
統計・機械学習アルゴリズムで実現
機械学習の種類
主な分析アルゴリズム
分類(2値) 回帰分析 グループ分け
分類 異常検知 パターン発見
(3値以上)
62
故障予測の種類
機械の「正常」or「故障」
分類して予測
分類
正常
故障
63
機械・設備の故障予測イメージ
使用アルゴリズム例:
Decision Tree
アルゴリズムによる
予測結果出力イメージ:
「故障」or「正常」が表示
64
異常検知の種類
主な異常検知アルゴリズム
外れ値検出
他のデータ点から
外れた値を検出
変化点検出
異常部位検出
他のデータの挙動と 他のデータの部位と
異なる時点を検出
異なる部位を検出
65
外れ値検出
センサー異常値の検出
センサーデータの外れ値検出による異常検知
外れ度合い

円の大きさ
66
変化点検出
不良品の急激増加を検知
変化点検知(センサーの値の急激増加の変化点を検出し、
異常発生を早急に発見する)
累積数
時間
67
変化点検出
不良品の急激増加を検知
変化スコア 累積数
変化点
変化点
変化点
時間
68
異常部位検出
他のデータの部位と異なる部位を検出
異常検知の種類
69
異常部位検出
不良品の急激増加を検知
異常スコア
異常部位
異常部位
時間
70
71
補足:
テクノロジーによる
業界構造変化
72
参考:法人向けコンピュータ業界のレイヤー構造
時間経過とともに競争軸が上位レイヤーへ移行(データ活用ビジネスそのものが主軸へ)
現在はクラウド化によりOS・ハードなど下位レイヤーの優位性が薄れている
(差別化要因がなくなりコモディティ化されユーザ側も意識しなくなる)
ビジネス
コンテンツ
ソフトウェア ソフトウェア
データベース データベース
ミドルウェア ミドルウェア
クラウド
OS
OS OS ハード ハード ハード
ネットワーク ネットワーク ネットワーク
出所:早稲田大学ビジネススクール根来研究室著「IoT時代の競争分析フレームワーク」を参考に作成
73
参考:農業耕作メーカの業界領域変化・巨大なビジネス機会
農業耕作機器メーカが事業領域を拡大し、農業経営をトータルサポートへ。機器単体の価値か
ら「農業エコシステム全体」の価値へシフト
耕作メーカが農業関連インダストリ全体へ進出し、関連インダストリの収益を(携帯アプリ
の様に)プラットフォームとして得ることも可能となる
製品
製品システム トラクター
種まき機
農業関連の複合エコシステム
農業機械
システム
農業機械
システム
耕運機
農家間
の連携
灌漑
システム
・現場センサー
・灌漑地域
・灌漑アプリ
農業経営
システム
播種
システム
気象
システム
・降雨量/気温/湿度
センサー
・天気図・天気予報
・気象データアプリ
・農家経営データベース
・種子データベース
・播種選択最適化アプリ
出所:M.E.ポーター「IoT時代の競争戦略」(How Smart Connected Products Are Transforming Competition)を参考に作成
74
自動車業界のレイヤー構造・激しい異業種間競争
車両は「ハードウェア」として意識されなくなりコモディティ化される、上位レイヤーである
自動運転OSの安全性や次世代テレマックスによる情報提供サービスがこれからの競争軸となる
(上位レイヤーへGoogleなど超高度IT企業からの参入が相次ぎ激しい異業種間競争へ)
さらにUberなどシェアリングサービスも胎動し、自動車関連インダストリ(タクシー、ト
ラック長距離運輸、給油、パーキングなど)の業界構造も劇的な構造変化を迎える
次世代
テレマックス
車載器
(カーナビ、タブレット)
車両制御
(ECU)
車載OS
(ECU)
車両 車両
インフラ インフラ
(道路、ガソリンスタンドetc)
(さらにセンサーデバイスの配備)
出所:早稲田大学ビジネススクール根来研究室著「IoT時代の競争分析フレームワーク」を参考に作成
75
自動車業界から、「新モビリティー産業へ」
自動車業界ではなく「新モビリティー産業」として業界領域の垣根を越えて関連業界へ大きく
進出していく。車内広告や小口商品の自動配達など新しいビジネスが次々と生まれてくる。
広告産業
エンドユーザ向け
マス広告・デジタル
広告など
公共交通産業
(長距離)電車・バス
・新幹線・飛行機など
車内広告・
データ外販
タクシー・(短距離移
動手段)電車・バス
情報・エネルギー
の流通
ヒト・モノ
の流通
分散型
エネルギー供給
系統依存型
エネルギー供給
小口配達・
宅配スーパー
新モビリティー産業(領域拡大)
エネルギー産業
事業者向け
出所:デロイト トーマツ コンサルティング (著)「モビリティー革命2030」より抜粋
大型貨物輸送・
ショッピング
センターなど
物流・小売産業
76
Thank you for your kind attention!
データ活用に関してお気軽にご相談ください
株式会社KSKアナリティクス
セールス&マーケティング本部
sales@ksk-anl.com
www.ksk-anl.com
東京オフィス 03-6228-4932
大阪オフィス 06-6131-6656

他のカテゴリから探す

IT業界の改革にご協力いただけませんか?

本サイトは、株式会社オープンソース活用研究所がプロデュースする、中小IT企業による”本気”の情報提供セミナー「マジセミ」の結果レポートページです。「マジセミ」は、次を目的として活動しています。

我々はITエンジニアが、今よりももっと「誇り」と「喜び」をもって仕事をし、今よりももっと企業や社会に貢献できる、そんなIT業界を創りたいと考えています。

そのためには、技術をもった中小のIT企業がもっと元気になる必要がある。その為には、技術をもった中小のIT企業を、もっと皆様に知って頂く必要がある、と考えました。

株式会社オープンソース活用研究所
代表取締役所長 寺田雄一

本当かウソか、あなたが見極めてください。

もし、我々のこの活動にご賛同していただけるのであれば、ぜひ下のセミナーに参加してください。

「なんだ、結局ただの売り込みセミナーじゃないか」

もしそう感じたら、アンケートなり、あなたのFacebookなりに、そのままお書き頂き、拡散して頂いて構いません。

参加者からのお褒めの言葉、お叱りの言葉が、我々中小IT企業を成長させ、それが日本のIT業界を変えていくのだと、強く確信しています。

あなたの行動が、日本のIT業界を変えるのです。

日程を確認していただき、ご興味のあるセミナータイトルをクリックしてください。

「マジセミ」のFacebookページ

今後のセミナー情報などを提供させていただきたますので、「マジセミ」のFacebookページに「いいね!」をお願いします。

日本のIT業界を変えるためのアクション、ありがとうございました!