まえちゃんろぐ

日々の生活の中での気付き、学んだこと、体験したことをアウトプットするブログ(雑記多めです)| プログラミング 本 ワークアウト 茶道

データ弄りに慣れるために「Kaggle」で遊んでみる

time 2018/02/26

データ弄りに慣れるために「Kaggle」で遊んでみる

とりあえず「Kaggle」でデータを弄って遊んでみる。

sponsored link

Kaggleとは

世界中から40万人を超える「データサイエンティスト」が集まる場所が、「Kaggle(カグル)」だ。

Kaggleは企業と、データ分析のプロであるデータサイエンティストをつなぐプラットフォームだ。企業がコンペ形式で課題を提示し、賞金の提供と引き換えに最も精度の高い分析モデルを得る。ある種クラウドソーシングに近い仕組みである。

世界規模で見ると、Amazon、Facebook、Walmartといった名だたる企業がコンペを実施しているKaggle。

日本ではまだまだ知名度は低いが、2015年7月には日本で初めて株式会社リクルートホールディングスがデータ予測コンペティション「RECRUIT Challenge – Coupon Purchase Prediction」を共催するなど、徐々に認知が拡大している。

via: 世界のデータサイエンティストが集う「Kaggle」とは?ビッグデータ分析を競い合え! – SELECK

実行環境

実行環境は「Anaconda」を使ってサクッと作る。

使用したデータセット

アメリカのシアトルで1948~2017年の69年間で雨がどれ位降ったのかを記録したデータセット。

データで遊ぶ

やっていることは至極簡単で、新しい列を追加してそれをプロットしているだけ。

その新しい列は、気温が20度以上の場合は”True”それ以外は”False”が格納されたもの、文字列型で季節が入力されたものの2つ。

おわり

手始めに門を叩いてみたKaggle。多種多様のデータセットがあってそれを見ているだけでも面白い。

他のユーザーの解析方法などが拝見できたり、データ解析で分からない・気になるところは議論したりできる。

こういう世界観好きです。

どんどんKaggleっていこうと思う。

販売中チケット

プログラミング、Webサービスの作り方教えます

自分のスキルを販売しております。お困りの方はご遠慮なくご連絡頂ければと思います。

down

コメントする




スポンサードリンク

書いてる人

maechan

maechan

ベンチャー企業、フリーランス、スタートアップを経験。開発業務、人事業務に従事していました。現在は農業系スタートアップ企業でエンジニアとして働いています。リモートワークをしているノマドサラリーマンです。詳しいプロフィールはこちら。 [詳細]

販売中チケット

プログラミング、Webサービスの作り方教えます 一人で悩まず!お気軽にご相談ください!

その他のチケットはこちら

Instagram