Apache Arrow東京ミートアップ2018
会場について
会場は株式会社Speeeさんのラウンジ。ここに来たのは先月のRubyData Tokyo Meetupに続いて2度めです。
ちなみに、RubyData Tokyo Meetupの時の参加報告はこちら。
前回参加した時は椅子のみだったのですが、今回はコード懇親会も有るということでテーブル付きの椅子に。
こういう心遣いが素敵です。
今日は「Apache Arrow東京ミートアップ2018」です!コード懇親会もあるので机つきの椅子を揃えました♪ #ArrowTokyo pic.twitter.com/xjHky9PkzI
— Speee Developer team (@speee_pr) 2018年12月8日
会場説明。
会場説明中。 #ArrowTokyo pic.twitter.com/DpbcdsiEZZ
— kabukawa (@kabukawa) 2018年12月8日
こちらのラウンジではコーヒー飲み放題。しかも美味しいです。
そして、美味しいコーヒーも頂いてます。飲み放題!? #ArrowTokyo pic.twitter.com/8D3H6cmg7u
— kabukawa (@kabukawa) 2018年12月8日
OSS Daysについて
tech.speee.jpOSS活動支援をされている。業務時間内というのがいいですね! #ArrowTokyo pic.twitter.com/RKdQSnXTbU
— kabukawa (@kabukawa) 2018年12月8日
Apache Arrow東京ミートアップ とは
イベント概要から引用すると、
Apache Arrowの開発者およびApache Arrowを活用するとうれしくなりそうなプロダクトの開発者を増やすための集まりです。開発者を増やすための集まりです!ユーザーを増やすための集まりではありません。どーん。
ということです。OSSの開発者を増やしたいという意欲的な取り組みで、それは参加枠にも表れています。
- 開発に参加したい気持ちがある枠
- 開発に参加したい気持ちがなくはない枠
「開発に参加したい気持ちがなくはない枠」は、OSSの開発へ参加してみたいけど、いきなりというのは敷居が高そうという人向けの枠と理解しました。
僕はこの枠で参加申し込みをしました。
実際に参加して「OSSの開発へ参加」欲が高まったか?については後述します。
タイムテーブル
時間 | 内容 | 発表者 |
---|---|---|
13:00-13:30 | 開場 | - |
13:30-13:40 | イントロダクション | 須藤功平/@ktou 株式会社クリアコード |
13:40-14:20 | 発表: Apache Arrow |
須藤功平/@ktou 株式会社クリアコード/Apache Arrow PMCメンバー |
14:20-14:30 | 休憩 | - |- |
14:30-14:55 | 発表: Apache SparkとApache Arrow |
上新卓也/@ueshin Databricks/Apache Sparkコミッター |
14:55-15:20 | 発表: Multiple-Dimension-SpreadとApache Arrow |
井島洸二 Yahoo! Japan/Multiple-Dimension-Spread開発者 |
15:20-15:30 | 休憩 | - |- |
15:30-15:55 | 発表: RとApache Arrow |
湯谷啓明/@yutannihilation |
15:55-16:20 | 発表: RubyとApache Arrow |
畑中悠作/@hatappi 株式会社Speee/Red Data Toolsメンバー 橋立友宏/@joker1007 Repro株式会社/Asakusa.rbメンバー |
16:20-16:30 | 休憩 | - |- |
16:30-16:55 | 発表: PythonとApache Arrow |
堀越真映/@sinhrks 株式会社ARISE analytics |
16:55-17:20 | 発表:T ensorとApache Arrow |
村田賢太/@mrkn 株式会社Speee/Red Data Toolsメンバー |
17:30-20:00 | コード懇親会 | - |
20:00 | 終了 | - |- |
セッション
イントロダクション
「Apache Arrow東京ミートアップ2018」はじまりました!@ktouさんからはじめの挨拶! #ArrowTokyo pic.twitter.com/uQewQTdiyG
— Speee Developer team (@speee_pr) 2018年12月8日
最初に会の目的と進め方についての説明がありました。
目的
— kabukawa (@kabukawa) 2018年12月8日
開発者を増やす! #ArrowTokyo pic.twitter.com/Bm9VrhHih2
今日の内容
— kabukawa (@kabukawa) 2018年12月8日
前半 #ArrowTokyo pic.twitter.com/t4H23EoopT
今日の内容
— kabukawa (@kabukawa) 2018年12月8日
後半
#ArrowTokyo pic.twitter.com/ZqSDbvtSqe
前半でプロジェクトの状況などを聞いて、参加したいものを決めた上で後半のコード懇親会に臨む、という形です。
コード懇親会
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo pic.twitter.com/DAPMyR7wdk
今日のグループ候補 #ArrowTokyo pic.twitter.com/7lMxmfUOBw
— kabukawa (@kabukawa) 2018年12月8日
単なる「勉強会」ではなく「OSS開発」の入り口に立つ会ということが改めて示された訳ですが、会場の雰囲気としては
「よし分かった。頑張るぞ!」
という風に受け止めていると感じました。(参加枠の選択時点で、参加者は皆さんその気で参加しているので当たり前かもしれませんが)
この後のセッション中も、気になることは随時質問が飛んだりしていて「アツいな!」と思いました。
会場からバンバン質問が飛んでいて、インタラクティブ感凄い。
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
開発を積極的にしている方が多く、質問が飛び交って盛り上がっています(*'ω'*) #ArrowTokyo pic.twitter.com/9esiPODMI7
— Speee Developer team (@speee_pr) 2018年12月8日
各セッションの内容は資料を読んでいただければと思いますので、ツイートを貼り付ける形でまとめます。
Apache Arrow
須藤功平/@ktou さん(株式会社クリアコード/Apache Arrow PMCメンバー)
資料へのリンク:Apache Arrow
Apache Arrowの開発者を増やすため@ktouさんが熱弁中! #ArrowTokyo pic.twitter.com/bZEohY7lil
— Speee Developer team (@speee_pr) 2018年12月8日
Apache Arrowの最新情報(2018年9月版)https://t.co/H3CoogHkAF
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
RAPIDS cuDFhttps://t.co/Uu2aljGPkx
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
Gandivahttps://t.co/FVhhL1xyrn
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
休憩中☕☕☕ #ArrowTokyo
— kabukawa (@kabukawa) 2018年12月8日
Apache SparkとApache Arrow
上新卓也/@ueshin さん(Databricks/Apache Sparkコミッター)
資料へのリンク:Apache Arrow and Pandas UDF on Apache Spark
@ueshinさんから「Apache SparkとApache Arrow」についてのお話中♪ #ArrowTokyo pic.twitter.com/L1KmJubSqB
— Speee Developer team (@speee_pr) 2018年12月8日
Introducing Pandas UDF for PySparkhttps://t.co/zfO4NzIzBh
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
デモを実施中。
— kabukawa (@kabukawa) 2018年12月8日
軒並み10倍とか、Arrowを使うようにするだけで結構圧倒的な差。
をを~っ!!!
#ArrowTokyo
[SPARK-22216] Improving PySpark/Pandas interoperability - ASF JIRAImproving PySpark/Pandas interoperabilityhttps://t.co/aO5ktCq4hZ
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
Spark Developers Meetup passmarket.yahoo.co.jp
Hadoop / Spark Conference Japan 2019 hadoop.apache.jp
Spark+AI Summit 2019 databricks.com
コントリビュートの仕方などの情報がリンクとして資料のAppendixのところに纏められれていますので、そちらも是非参照してみてください!
Multiple-Dimension-SpreadとApache Arrow
井島洸二 さん(Yahoo! Japan/Multiple-Dimension-Spread開発者)
資料へのリンク:Multiple-Dimension-Spread と Apache Arrow
Yahoo!の井島さんがお話しているのは「Multiple-Dimension-SpreadとApache Arrow」についてです! #ArrowTokyo #speee_lounge pic.twitter.com/D1MXdKFKQo
— Speee Developer team (@speee_pr) 2018年12月8日
MDS (acronym of Multiple Dimension Spread)https://t.co/0rCqi5f3HQ
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
MDSのユースケース #ArrowTokyo pic.twitter.com/oyyvsHaikJ
— kabukawa (@kabukawa) 2018年12月8日
きゅーけい!☕😀 #ArrowTokyo
— kabukawa (@kabukawa) 2018年12月8日
RとApache Arrow
湯谷啓明/@yutannihilation さん
@yutannihilationさんから「RとApache Arrow」についてお話いただきます! #ArrowTokyo #speee_lounge pic.twitter.com/qsC7lvQJyi
— Speee Developer team (@speee_pr) 2018年12月8日
sparklyrhttps://t.co/VIw3Q3dx1s
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
RStudioの1.2からSQLを記述する部分のサポートが入りますね。https://t.co/2LrVxYUPmf
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
ALTREPhttps://t.co/I9Ai17Aa4i
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
WindowsではRToolsをインストールしてパッケージをビルドしたりするのですが、これに含まれているgccでArrow関連のビルドができない問題が有るようです。
GCC、なんか設定ファイルで対応規格の変更ができたような気が、、、
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
このことを聞いて、Rの部分になにか貢献できないかなと思ったわけですが。。。
RubyとApache Arrow
畑中悠作/@hatappi さん(株式会社Speee/Red Data Toolsメンバー)
橋立友宏/@joker1007 さん(Repro株式会社/Asakusa.rbメンバー)
「RubyとApache Arrow」のお話を@hatappiさんと@joker1007さんからお話いただきました(*'ω'*) #ArrowTokyo #speee_lounge pic.twitter.com/D5yi2iFIBZ
— Speee Developer team (@speee_pr) 2018年12月8日
OSS Gate東京ミートアップ for Red Data Tools in Speeehttps://t.co/4Z8ui0854Z
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
Red Arrowhttps://t.co/Iha0w7Slhl
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
もと西武線沿線住人としてはレッドアローという名前に親近感が(笑)
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
gobject-introspectionhttps://t.co/djXUZtZmfj
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
ccsv gemhttps://t.co/f4F5STulnT
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
PostgreSQL Foregin Data Wrapperhttps://t.co/PvPwtQzqxn
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
畑中悠作/@hatappi さん がブログエントリを上げられていたので、リンクを貼っておきます。 blog.hatappi.me
休憩中。お菓子がデプロイされました。 #ArrowTokyo pic.twitter.com/ECndey4eRb
— kabukawa (@kabukawa) 2018年12月8日
PythonとApache Arrow
堀越真映/@sinhrks さん(株式会社ARISE analytics)
「PythonとApache Arrow」については@sinhrksさんが登壇しています! #ArrowTokyo #speee_lounge pic.twitter.com/egJFUOKOZ3
— Speee Developer team (@speee_pr) 2018年12月8日
DASK DataFramehttps://t.co/MdXHqoJwIN
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
Pandas ExtentionArrayhttps://t.co/d7GF3MXD9B
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
RAPIDShttps://t.co/4m10uygPGM
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
Pandas2https://t.co/C9FdOXcS1Y
— kabukawa (@kabukawa) 2018年12月8日
#ArrowTokyo
TensorとApache Arrow
村田賢太/@mrkn さん(株式会社Speee/Red Data Toolsメンバー)
Speeeエンジニアの@mrknから「TensorとApache Arrow」についてお話ししています♪ #ArrowTokyo #speee_lounge pic.twitter.com/u1ZaIbKHtF
— Speee Developer team (@speee_pr) 2018年12月8日
コード懇親会
インストールで結構時間がかかってしまって本題にたどり着けなかった、、、、。
手順は再検証して、あとから始める人が困らないようにしたいのでエントリ分けます。
ということだと寂しいので写真を何枚か貼っておきます。
まとめ
前半戦についてしか纏められていませんが、前半だけでもかなりたくさんのことが学べて、とても良い会でした。
後半戦はもうちょっと頑張りたかったけど、PCのバッテリーが切れてしまったので断念。
バッテリーはメチャ持つPCなので、電源持っていかなかったのですが、それが切れるくらい色々やったということで。。。
いざというときに備えて、電源は持ち歩かないとと思いました(今更???)