データサイエンスコンペプラットフォームNishika、リリースしました。
起業して早数ヶ月。
おそらく通常のベンチャーがあまり経験していないであろう苦難が幾度かありましたが、本日漸く、サービスリリースにこぎつけました。
やりたいことの30%もできていない状態ではありますが、兎にも角にも自分たちの目指すものを形にして世に出せたこと、嬉しく思います。
さて、このNishikaというサービスを一言で言うと、
データサイエンティストと、データサイエンスを活用する人を繋ぐコミュニティプラットフォーム
です。
データサイエンスとビジネスを繋ぐサービスとして、形の異なる3つの柱を考えていますが、まずは
データサイエンスコンペティション
を主に展開していきます。
データサイエンスコンペのプラットフォームとしては、世界で圧倒的な知名度・権威を誇るKaggle、日本の先人であるSIGNATEが存在しますが、
そんな中で我々Nishikaは、2つの点を大事にしながら、コンペを世に生み出していきます。
目指すのは、データサイエンスコンペが"社会の当たり前"になること
データサイエンスコンペ、特にKaggleは、データサイエンティストや一部エンジニアにとってみれば知らない人はいないというほどの存在ですが、
当然ながら、コンペには課題を解く側だけでなく課題を提供する側も必要です。
ここ数ヶ月、企業を中心に営業に回り、データサイエンスコンペの存在と、その中で享受できるメリットについてお話しして回ってきましたが、直面した現実は
一般のビジネスパーソンで、データサイエンスコンペという存在を知っている人はほとんど皆無
ということでした。
私自身データサイエンティストとして日々アンテナをはっていると、Kaggle、SIGNATEをはじめデータサイエンスコンペの話を聞かない日はないのですが、
それが機械学習による課題解決のソリューションの1つとして当たり前の存在になっているかというと、程遠いというのが実感です。
そこで我々は、
データサイエンスコンペによる課題解決のユースケースを多く生み出し、コンペを社会の当たり前にすること
を目指していきます。
エッジの効いたコンペももちろんやっていきますが、それ以上に大事にしていきたいのは、所謂テーブルコンペや、レコメンドや異常検知といった課題など、技術的には多少古いものが使われるかもしれないが、社会での適用例が多いユースケースにもしっかり目を向け、コンペ化していきます。
さらに、特定の課題や特定の業界にこだわるのでなく、様々な業界の方にとってコンペが自分事になるように、多種多様なコンペを生み出していきます。
そんな当たり前のことを、と思われるかもしれませんが、我々が先人がいる中でこの事業に取り組もうと思ったのも、まだまだ世の中には掘り出しきれていないコンペのニーズがあるのではないか、と考えたからです。
コンペの集合知の力をもっと世に知らしめていくこと
もう1点、大事にしていきたいことですが、これも営業の中で様々な方とお話しする中で、改めて感じたことになります。
よく言われることですが、コンペに対して課題やデータを提供する側にとっては、主にプライバシー保護や競合へのナレッジ流出のリスクを事由として、データを公開することへの不安感・拒否感があります。
その壁を乗り越えるのも簡単ではないのですが、それを超えた後にも壁があります。
データサイエンスコンペのプラットフォームにはディスカッションフォーラムというものが開設されることがあり、むしろKaggleではこれがデファクトとなっていますが、お題に対して参加者同士がコードを共有したり、データが示す規則性の発見などについてディスカッションできるようになっています。
三人よれば文殊の知恵、ならぬ千人いれば文殊の知恵で、最終アウトプットとなる機械学習モデルの性能をさらに高めることに繋がるわけですが、これについても、コンペのホスト側は必ずしも好ましく思わないケースがあります。
フォーラムが開設されないコンペが世の中にあるのは、このようなホスト側の事情に配慮したものではないかと思っています。(他のプラットフォームの話なので、推測に過ぎませんが)
正直なところ、私も大企業2社を経験してきていることもあり、ホスト側にこういった反応があるのはよく理解できます。
一方で、データサイエンティスト/コンペ参加者としての立場に立てば、ディスカッションフォーラムがあるコンペとないコンペではコンペ参加へのモチベーション・学びの度合いが全く異なり、実際により良い性能のモデルがアウトプットとなるメリットの方が大きいだろうと思うのですが、
2つの相反する気持ちが自分の中にあります。
結局、データサイエンティストにとってモチベーション高く参加できるコンペを増やすには、コンペにおける集合知の力が如何に優れたアウトプットを生み出すのかを、もっと世に知らしめていくしかない、と感じています。
我々Nishikaとしては、積極的にディスカッションフォーラム・集合知の価値を伝えていき、力の及ぶ限り、より魅力的なコンペを打ち出していこうと考えています。
今後
今日(19/12/4)時点では、Nishika自社開催のAIは芥川龍之介を見分けられるか?というコンペを開催しています。
難易度は決して高くなく、正直なところ、我々が面白くない?と思ったものをコンペにしてしまった部分が大きいですが(笑)、是非参加してみてください。
一部機能について、最終の動作確認中でアクティブにしていないものもありますが、お使いいただきやすく魅力的なプラットフォームになるよう、順次アップデートしていきます。
そして来週、クライアントがホストとなる1件目のコンペを開始する予定です。
内容は我々にとって身近で興味深い、一方で難易度としては(個人的には)歯応えのある、そんなコンペになっていると思います。
ご期待ください!