今期中にKaggleExpertになろうと思うんですが質問ありますか?

Kaggle
しぃたけ
しぃたけ

自分にプレッシャーかけるため意思表明しときます。

言いたい事

標記の通り、今期中(21年3月末まで)にKaggleExpertを目指そうと思います。

詳しくは後述しますが、Kaggleに登録して5か月ほど経ちましたが、コンペに参加しても真面目に上位を狙いに行ったことがないので、そろそろ本気で結果を出すために、意思表明を残そうと思って記事にしました。


今のところ仲間はいないので、ひとまずソロで目指します。(チーム組んでもいいよって方おられたら連絡ください。)

経過は追って記事書いていこうと思うので、暖かく見守っていただければと思います。


ちなみにKaggleExpertって何?って方はカレーさんの下記の記事がまとまってたのでご参照ください。


詳細

今回記事を書くに至った理由をつらつらと書いていこうと思います。

多少自分語り入るので、苦手な方はスルーしてください。

まずは自分の経歴について、少し紹介します。

経歴

学歴は某大学理工学部修士卒(非情報系)です。

研究室では専攻の分野とは異なる、画像処理や特徴量エンジニアリング関係の研究をしてました。

当時、機械学習という分野について何も知らなかった自分はk-means clusterのような基本的なアルゴリズムにも感動してた記憶があります。

現在は某日系大手メーカーで生産技術と呼ばれる部門に所属しており、一部で工場のデータを分析する業務を担当しております。

特に意識していたわけではないですが、何の因果かデータサイエンスに恵まれた経歴をたどってきているなと、この文を書いてて感じました。

KaggleExpert目指す理由

理由は大きく下記の2点です。

  • 強い方々の分析手法などを学んで、自分の技術力を上げたい。
  • 世間に認めてもらえる実績が欲しい。


近年のDX化の影響で、自分が属している製造業においても工場のIoT化,AI化の流れが生まれており、社内でデータサイエンティストを育成しようというよな会社も多く表れております。

(事例:ブリヂストン)

ビッグデータを活用するデータサイエンティスト育成への取り組みをご紹介します! 【ブリヂストンのデジタルシリーズ第3弾】 | Bridgestone Blog
データサイエンティストとは、データから価値を創出し、ビジネス課題を解決するスペシャリストです。当社は、2017年よりデータサイエンティスト育...

弊社も似たような流れにはなってるのですが、実際に機械学習のアルゴリズムを業務に利用することは稀で、ほとんどの場合、線形回帰、有意差検定など簡単な統計の知識で解決できてしまうものが多いです。

そのため、業務であまり技術力が培われてる感じが得られず

「世間の流れに置いて行かれてるのでは?」「社内でしかこのスキルは使えないのでは?」みたいな考えが付きまとうことになりました。

どうしたもんかと思っていたらKaggleの存在を知りました。

自分では太刀打ち出来ないようなつよつよな人がたくさんいる事や、コンペでいい結果を出すと、世間に認められる実績につながる事を知り、やる気になりまくってました。


なんでわざわざ記事書くのか

記事にまとめるのは、

誰もが見えるところに宣言をして逃げられない状況を作りたかったからです。

Kaggleに登録してみたものの、誰かのNotebookをコピペして適当に満足感を得ることしかしてない現実がありました。

このままでは一生何もしないので、決意表明しておくことでやらざるを得ない環境を作ろうと思い、記事を書きました。

学生時代も、研究で結果が出る前に学会に登録されて、2か月以内に結果を出さないと死ぬ みたいな状況が一案成果出た覚えがあります。

凡人は急かされないと結果出せないので、自分を追い込みたいと思います。

よくある議論

最後にKaggle界隈(あと競プロとか)でよく言われていることについて持論を書いていみます。個人の意見なので参考までに。

Kaggleなんか実務に使えないよw

直接実務には使えないかもですが、Kaggleでの実績が現実世界で認められていることも事実です。

求人情報を見ると「データ分析コンペで入賞の実績がある方」みたいな求人が多く見受けられます。

実務に使えなかったとしても、Kaggleでの実績が世間的に市民権を持っているということは間違いないと思うので自分はそれでいいかと思ってます。

G検定、E検定の方がいいんじゃないの?

いずれ取りたいなぁと思ってますが、まずは実際のデータ分析の経験を積みたいのでKaggle優先したいです。

G検定は学習時間30時間程度でOKみたいなので、中だるみして来たら検討しようかなぁ。

E検定 費用高すぎ わろえない。

データサイエンスよりもインフラ、サーバー周り学んだほうが稼げるよw

分析基盤とかインフラ周りはもちろん勉強したいです。

ただ、まだその分野は未経験なので、まずはある程度業務経験のあるデータサイエンスを伸ばしてから次のステップとして勉強します。

器用貧乏だめ、絶対。

AutoMLでAIエンジニアはいらなくなるよw

AIエンジニアがコモディティになるなら、現職でやってるようなビジネス課題解決業務に移るか、インフラ周り勉強するか逃げ道はあるんじゃないですかね。

分析ツールがPythonなのか、AutoMLなのかになるだけだと思うんで、分析経験があれば柔軟にやりようはあるんじゃないでしょうか。知らんけど。

まとめ

決意表明の意味を込めて、今期中にKaggleExpertになります宣言をしました。

現状はよわよわなので、この半年間で精進していきたいです。

ひとまず直近は現在参加しているMoAコンペでメダル獲得を目標に頑張ろうと思います。

Mechanisms of Action (MoA) Prediction | Kaggle
Can you improve the algorithm that classifies drugs based on their biological activity?


最初に記載した通り、チームメンバー探しておられる方、一緒に精進していただける方は募集してるのでもしよければ、DM、問い合わせからご連絡ください。


コメント

タイトルとURLをコピーしました