JDDStudy #7 JDDのデータサイエンティスト集団「M-AIS」の取り組み

11/27(水) は「JDDStudy #7 JDDのデータサイエンティスト集団「M-AIS」の取り組み」に参加してきました。

japan-d2.connpass.com

f:id:kabukawa:20191208145203p:plain:w600

会場は Japan Digital Design株式会社さんのイベントスペース。

f:id:kabukawa:20191208110647j:plain:w600

以前来たときと少しレイアウトが変わって、スクリーンが見やすくなった気がします。

JDDStudy とは
内容
まとめ

JDDStudy とは

Japan Digital Design株式会社さんが取り組んでいるFintechを中心に、ブロックチェーン、AI、DevOps、セキュリティなど、広く発信するための勉強会です。過去に3回ほど参加していて、そのうち2回の参加報告を書いているのでそちらもどうそ。

kabukawa.hatenablog.jp

前回は仕事の都合で参加できなかったので、半年ぶりの参加になりました。

内容

イベント概要にある通り、今回は MUFG AI Studioの活動についての内容でした。メガバンクグループが持つデータを活用してどのようなことをやっているのか、とても興味深い内容ですね。

MUFGグループ独自の機械学習モデルを開発・研究するために設立された「MUFG AI Studio」（「M-AIS」呼称：アイス）があります。今回のJDD Studyでは、MUFG各社が持つ膨大なデータを収益力強化やサービス向上に繋げる「M-AIS」の活動を紹介致します。

当日のTweetはトゥギャられていますので、そちらもどうぞ。(今回は自分のTweet割合が多めな気が、、、汗)

togetter.com

【オープニング】Japan Digital Designについて

JDD CEO 上原高志さん

[スライドは公開されたら追記します]

オープニングはJDDのCEOの上原さんから。JDDが最近どんなことをやっているのか、今回のテーマとどのような関わりがあるのかについて。直近だとこんなサービスを始めたとのこと。

medium.com

銀行口座のトランザクションデータから与信情報を導き出すという形でお金の貸し出しをするというサービスとのこと。銀行の持っているデータを活用したものとして、面白い取り組みだなぁと思いました。

どんなことをやっていて、どこへ向かおうとしているのかというのが聞けるので、個人的にはこのオープニングを結構楽しみにしていたりします。

「M-AISのVisionとMission」

JDD 平山元清さん

www.slideshare.net

「MUFG AI Studio」(「M-AIS」呼称：アイス)の概要について。

japan-d2.com

R & D & B Research & Development & Business

R:Research

最先端の探求
主要な4つのカンファレンスだけで3000本近くの論文発表
産学連携
共同研究　東京大学、スタンフォード大学のアフィリエイトにも参加
企業との連携
最適解の探求
持っているデータとそれをどう生かしていくか、そしてその蓄積
付加価値の探求

D:Development

分析環境
マネージドサービスの活用 databricksを使っている
ML DevOps

B:Business

与信判断
市場取引判断
顧客行動予測
人事
不正検出

そのための技術

eta Learning / Few-Shot Learning

…などなど

機械学習を受託業務で行うことの課題

人月ビジネスになりがち
いずれ委託者と受託者で利益相反
データがない
出口となるエンドユーザーとつながっていないのでスケールしない

M-AISの強み

MUFGメンバーとして大局的な利害が一致
グループ各社と補完関係
MUFGからデータを集積
MUFG各社のビジネスを出口に持つ

スライドがわかりやすく書かれているのでそちらを参照していただければと思います。機械学習を受託業務で行うことの課題とM-AISの強みのところはなるほどなと思う反面、それ故の苦労もあるんだろうなと感じました。興味深い取り組みだと思うので、引き続き注目していきたいと思います。

ビジネス事例紹介：「オンライン融資サービス『Biz LENDING』のスコアリングモデル」

JDD 澤木太郎さん

オンライン融資サービス『Biz LENDING』のスコアリングモデル from 太郎澤木

www.slideshare.net

Biz LENDING 中小企業向け融資サービス

決算書が不要
オンラインで手続きが完結
申込みから入金まで最短2営業日

Biz LENDINGのスコアリングモデル

通常は過去データを用いて機械学習でスコアリングモデルを作成し、貸し倒れ確率を算出

口座の異動履歴をインプットとして利用

銀行にデータがあるので決算書などの書類が不要
粉飾などの不正をしにくい

教師あり学習でモデルを構築

スコアリングモデルで使われる機柱学習モデル

ロジスティック回帰
決定木
ランダムフオレスト
勾配ブースティング（6 EDT)
ディーブラーニング

f:id:kabukawa:20191208125025p:plain:w500

モデルのホワイトボックス化

f:id:kabukawa:20191208125126p:plain:w500

f:id:kabukawa:20191208125139p:plain:w500

f:id:kabukawa:20191208125149p:plain:w500

f:id:kabukawa:20191208125200p:plain:w500

f:id:kabukawa:20191208125212p:plain:w500

個人的には、スコアリングモデルでよく使われる機械学習モデルについての基本的な説明もあって、とてもありがたかったです。また、モデルの検証の方法は以前から気になっていたのでとても参考になりました。

研究事例紹介：「メタ学習　〜ノーフリーランチ定理を超えてマルチタスクを解く〜」

JDD 林祐輔さん

[資料は公開されたら追記します]

メタ学習の研究に関する発表。

f:id:kabukawa:20191208144452j:plain:w500

メタ学習とは

f:id:kabukawa:20191208144638j:plain:w500

ディープニューラルネットワークなどの大容量モデルは、データが豊富なドメインで非常に強力な機械学習技術を可能にしました。ただし、大容量の関数近似が一般化のために大規模なデータセットに大きく依存しているため、データが不足しているドメインは、このような方法では難しいことが証明されています。メタ学習は、この問題の潜在的な解決策を提供します。以前の多くのタスクからデータ全体を学習することを学習することにより、数ショットのメタ学習アルゴリズムはタスク間の構造を発見し、新しいタスクをすばやく学習できます。

データが多いときに成り立つのがこれまでの世界。
これからはデータが少なくても成り立つのがこれから必要なんじゃないか？というのが注目されている。
→メタ学習が注目されている
#jddstudy
— kabukawa (@kabukawa) November 27, 2019

シングルタスク学習とマルチタスク学習 f:id:kabukawa:20191208145814j:plain:w500 f:id:kabukawa:20191208145828j:plain:w500

少ない参考情報で学習をさせて精度を上げていく。
入力データを入れ替えて2クラス分類を行う
たくさんのタスクを実行することで、過去の経験から精度を上げていこうとする。
#jddstudy
— kabukawa (@kabukawa) November 27, 2019

破滅的忘却 f:id:kabukawa:20191208150025j:plain:w500

[1612.00796] Overcoming catastrophic forgetting in neural networks

ここでデモ。

現在 ACML2019 にて展示中の @Japan_D2 ブースでは， @hayashiyus さんたちが考案した機械学習モデルを使用したデモを試すことができます．(たぶん)
予めメタ学習タスクを行うことで学習と判定を一瞬で行うため，高速に結果を返します．
私は実装面を担当しました．https://t.co/JziW78bCLo pic.twitter.com/tawlo60zBR
— なかひこくん (@takanakahiko) November 18, 2019

arxiv.org

ノーフリーランチ定理

f:id:kabukawa:20191208174537j:plain:w500

www.hellocybernetics.tech

グローバル潜在変数 θ
何度も出てきたので多分とっても重要な値
#jddstudy
— kabukawa (@kabukawa) November 27, 2019

f:id:kabukawa:20191208175046j:plain:w500

正直に言うと話されている内容の半分もわからなかったけど、問題意識とそれを解決するための取り組みはまだまだやるべきことがあるんだな、という風に感じた。

カラクリの説明を聞いている
（なるほど分からん） 🤔#jddstudy pic.twitter.com/Ywae1mN2W1
— kabukawa (@kabukawa) November 27, 2019

でも、これがビジネスに落ちてくると色々面白いことが起きそうだな、というのが分からないなりに感じることができたのは良かったです。

懇親会

f:id:kabukawa:20191208175440j:plain:w600

懇親会は少し早めに切り上げて帰りました。取り組みの中でデータサイエンティストの話だけが出てきたので、データの前処理とか整備をするデータエンジニアはどの程度いるのかということを講演者の方に質問したところ、現状はデータサイエンティストが兼務している感じとのことでした。データエンジニアは専任で置いていないところが多いのかもしれませんが、このあたりの環境も大事なんじゃないかな、と感じました。

まとめ

今回はAI周りの話ということで色々期待して参加したわけですが、期待を上回る内容だったなと思います。細かいところに踏み込まず概観的な説明をしながらというのもあって、苦労話とかはあまり聞くことができませんでしたが、少し時間を割いてそのあたりも聞けたら良かったなと思います。最後になりますが、今回も講演者、スタッフ、参加者の皆様、ありがとうございました！

Above & Beyond

日々のアウトプット記録

JDDStudy #7 JDDのデータサイエンティスト集団「M-AIS」の取り組み

JDDStudy とは