Python、Pandas、そしてSpark / Parquetでデータ分析

講師: 玉川竜司 氏 (Sky株式会社)

お酒を片手にテクノロジーを学ぶ会@大阪 = 「三木会」

* 本勉強会の受付は終了いたしました。

開催概要

主催 株式会社インサイトテクノロジー
開催日時 2016年12月15日(木) 18:30 – 20:30 (受付開始 18:15)
開催場所 株式会社インサイトテクノロジー 大阪支店
大阪市北区大深町3-1 グランフロント大阪 ナレッジキャピタルタワーC 11F
参加費 無料

プログラム

18:15 受付開始
18:30 ご挨拶 / 乾杯

「Python、Pandas、そしてSpark / Parquetでデータ分析」

そこそこの量のデータを分析する上で、PythonとPandasはとても強力なツールです。一方、Sparkも2.0になり、これまでよりもさらに強力なツールになってきました。特に列指向データフォーマットのParquetと合わせて使えば、数十億から数百億レコードのデータを比較的手軽に扱えます。最近のこのあたりの様子を、実際に分析をしながら紹介していきます

Pythonが騒がれているのを横目で見ながらなんとなく気になっているデータベース技術者の皆さんの、素朴な疑問にできる限りお答えできればと思います。

20:30 終了
※プログラム内容、タイトルは予告なしに変更する可能性があります。

講師紹介

玉川竜司氏 (Sky株式会社)

本業の傍ら、オライリージャパンから技術翻訳書多数。近刊は、「初めてのSpark」「ヘルシープログラマ」「Google BigQuery」など。来年「SRE サイトリライアビリティエンジニアリング」発売予定。