11/27(水) は「JDDStudy #7 JDDのデータサイエンティスト集団「M-AIS」の取り組み」に参加してきました。
japan-d2.connpass.com
会場は Japan Digital Design株式会社 さんのイベントスペース。
以前来たときと少しレイアウトが変わって、スクリーンが見やすくなった気がします。
目次
JDDStudy とは
Japan Digital Design株式会社 さんが取り組んでいるFintechを中心に、ブロックチェーン、AI、DevOps、セキュリティなど、広く発信するための勉強会です。
過去に3回ほど参加していて、そのうち2回の参加報告を書いているのでそちらもどうそ。
kabukawa.hatenablog.jp
kabukawa.hatenablog.jp
前回は仕事の都合で参加できなかったので、半年ぶりの参加になりました。
内容
イベント概要にある通り、今回は MUFG AI Studioの活動についての内容でした。メガバンクグループが持つデータを活用してどのようなことをやっているのか、とても興味深い内容ですね。
MUFGグループ独自の機械学習モデルを開発・研究するために設立された「MUFG AI Studio」(「M-AIS」 呼称:アイス)があります。
今回のJDD Studyでは、MUFG各社が持つ膨大なデータを収益力強化やサービス向上に繋げる「M-AIS」の活動を紹介致します。
当日のTweetはトゥギャられていますので、そちらもどうぞ。(今回は自分のTweet割合が多めな気が、、、汗)
togetter.com
【オープニング】Japan Digital Designについて
JDD CEO 上原 高志 さん
[スライドは公開されたら追記します]
オープニングはJDDのCEOの上原さんから。JDDが最近どんなことをやっているのか、今回のテーマとどのような関わりがあるのかについて。
直近だとこんなサービスを始めたとのこと。
medium.com
銀行口座のトランザクションデータから与信情報を導き出すという形でお金の貸し出しをするというサービスとのこと。
銀行の持っているデータを活用したものとして、面白い取り組みだなぁと思いました。
どんなことをやっていて、どこへ向かおうとしているのかというのが聞けるので、個人的にはこのオープニングを結構楽しみにしていたりします。
「M-AISのVisionとMission」
JDD 平山 元清 さん
www.slideshare.net
「MUFG AI Studio」(「M-AIS」 呼称:アイス)の概要について。
japan-d2.com
R & D & B Research & Development & Business
R:Research
- 最先端の探求
主要な4つのカンファレンスだけで3000本近くの論文発表
- 産学連携
共同研究 東京大学、スタンフォード大学のアフィリエイトにも参加
企業との連携
- 最適解の探求
持っているデータとそれをどう生かしていくか、そしてその蓄積
- 付加価値の探求
D:Development
- 分析環境
マネージドサービスの活用
databricksを使っている
- ML DevOps
B:Business
- 与信判断
- 市場取引判断
- 顧客行動予測
- 人事
- 不正検出
そのための技術
- eta Learning / Few-Shot Learning
…などなど
機械学習を受託業務で行うことの課題
- 人月ビジネスになりがち
- いずれ委託者と受託者で利益相反
- データがない
- 出口となるエンドユーザーとつながっていないのでスケールしない
M-AISの強み
- MUFGメンバーとして大局的な利害が一致
グループ各社と補完関係
- MUFGからデータを集積
- MUFG各社のビジネスを出口に持つ
スライドがわかりやすく書かれているのでそちらを参照していただければと思います。
機械学習を受託業務で行うことの課題とM-AISの強みのところはなるほどなと思う反面、それ故の苦労もあるんだろうなと感じました。
興味深い取り組みだと思うので、引き続き注目していきたいと思います。
ビジネス事例紹介:「オンライン融資サービス『Biz LENDING』のスコアリングモデル」
JDD 澤木 太郎 さん
www.slideshare.net
Biz LENDING
中小企業向け融資サービス
- 決算書が不要
- オンラインで手続きが完結
- 申込みから入金まで最短2営業日
Biz LENDINGのスコアリングモデル
通常は過去データを用いて機械学習でスコアリングモデルを作成し、貸し倒れ確率を算出
口座の異動履歴をインプットとして利用
- 銀行にデータがあるので決算書などの書類が不要
- 粉飾などの不正をしにくい
教師あり学習でモデルを構築
スコアリングモデルで使われる 機柱学習モデル
- ロジスティック回帰
- 決定木
- ランダムフオレスト
- 勾配ブースティング(6 EDT)
- ディーブラーニング
モデルのホワイトボックス化
個人的には、スコアリングモデルでよく使われる機械学習モデルについての基本的な説明もあって、とてもありがたかったです。
また、モデルの検証の方法は以前から気になっていたのでとても参考になりました。
研究事例紹介:「メタ学習 〜ノーフリーランチ定理を超えてマルチタスクを解く〜」
JDD 林 祐輔 さん
[資料は公開されたら追記します]
メタ学習の研究に関する発表。
メタ学習とは
ディープニューラルネットワークなどの大容量モデルは、データが豊富なドメインで非常に強力な機械学習技術を可能にしました。 ただし、大容量の関数近似が一般化のために大規模なデータセットに大きく依存しているため、データが不足しているドメインは、このような方法では難しいことが証明されています。 メタ学習は、この問題の潜在的な解決策を提供します。以前の多くのタスクからデータ全体を学習することを学習することにより、数ショットのメタ学習アルゴリズムはタスク間の構造を発見し、新しいタスクをすばやく学習できます。
シングルタスク学習とマルチタスク学習
破滅的忘却
[1612.00796] Overcoming catastrophic forgetting in neural networks
ここでデモ。
arxiv.org
ノーフリーランチ定理
www.hellocybernetics.tech
正直に言うと話されている内容の半分もわからなかったけど、問題意識とそれを解決するための取り組みはまだまだやるべきことがあるんだな、という風に感じた。
でも、これがビジネスに落ちてくると色々面白いことが起きそうだな、というのが分からないなりに感じることができたのは良かったです。
懇親会
懇親会は少し早めに切り上げて帰りました。
取り組みの中でデータサイエンティストの話だけが出てきたので、データの前処理とか整備をするデータエンジニアはどの程度いるのかということを講演者の方に質問したところ、現状はデータサイエンティストが兼務している感じとのことでした。データエンジニアは専任で置いていないところが多いのかもしれませんが、このあたりの環境も大事なんじゃないかな、と感じました。
まとめ
今回はAI周りの話ということで色々期待して参加したわけですが、期待を上回る内容だったなと思います。
細かいところに踏み込まず概観的な説明をしながらというのもあって、苦労話とかはあまり聞くことができませんでしたが、少し時間を割いてそのあたりも聞けたら良かったなと思います。
最後になりますが、今回も講演者、スタッフ、参加者の皆様、ありがとうございました!