オットセイの経営日誌

データサイエンス系ベンチャーを経営してます。経営のこと、趣味のことつぶやきます。

データサイエンス

ウィズコロナ期のデータサイエンス周りのビジネス環境を推測してみる

GWが始まりましたね。ぼっち・インドアな私でもさすがに外に繰り出すか〜と思う期間ですが、まさかこんな形で始まるとは思いませんでした。 多くの皆さんは積読の解消や、Courseraなどオンラインの学習、はたまたデータサイエンスコンペに参加して腕を磨くな…

コロナ時代を生き抜くデータサイエンティストのキャリアビジョン:まとめ

表題の、以下勉強会が自分が考えていたことにタイムリーにミートしていたので、参加しました。 data-learning-guild.connpass.com 示唆に富んでいたので、私見も混じってますが、まとめます。 アジェンダ Withコロナ時代のデータサイエンティスト 長期化した…

VGG16アーキテクチャについて知りたい情報を1記事で

何だか、なろう系作品の語呂のタイトルになってしまいましたが、VGG16について軽いメモ記事です。 経緯 画像認識で使われる代表的なCNNモデルであるVGG16を扱っている中で、 kerasのmodel.summary()だと、Output Shapeとパラメタ総数は分かるが、フィルタの…

データサイエンス特化Q&Aサービスで解決したい2つの不幸

COVID-19により、猛烈な社会の変化に晒されている今日この頃、皆様如何お過ごしでしょうか。 弊社含めスタートアップ界隈もなかなかの逆風が吹いていますが、そんな中、昨日、Nishikaの2つ目のサービスであるデータサイエンス特化のQ&Aサービスをリリースし…

Cousera / Production Machine Learning Systems / Architecting Production ML Systems まとめ

プロダクション環境の機械学習システムを構築・運用する機会がなかなかないので、まずは座学から入ることにして、CourseraでGoogle Cloudが提供しているProduction Machine Learning Systemsを受講してみました。 Courseraは受講から1週間過ぎると月額課金に…

データサイエンスコンペプラットフォームNishika、リリースしました。

起業して早数ヶ月。 おそらく通常のベンチャーがあまり経験していないであろう苦難が幾度かありましたが、本日漸く、サービスリリースにこぎつけました。 Nishika やりたいことの30%もできていない状態ではありますが、兎にも角にも自分たちの目指すものを形…

AI・機械学習に限らない異常検知の手法

仕事をバリバリやりながらブログ記事を投稿するって、なかなかきつい。 しっかり定期的に更新できる方は、どういう時間術を駆使しているんだろう。 そんな悩みを抱えていた中、仕事で表題の件についてまとめる機会があり、ちょうど記事化できそうな内容なの…

Kaggleコンペ初心者が命削りながらなんとかメダル圏内に滑り込んだ話 (IEEE-CIS Fraud Detection)

前回のブログ記事投稿から約1ヶ月。この1ヶ月はKaggleのIEEE-CIS Fraud Detectionに人生を捧げると決めてブログを休んでいましたが、10/4にコンペが終了しました。 結果は、6381の参加チーム中、532位でした。上位10%に入ることができ、初Kaggle本気参戦で…

機械学習用データ公開におけるプライバシー保護に関する留意点

データサイエンスコンペの題材としてデータ公開する際、プライバシー保護は避けて通れない論点と考え「データ解析におけるプライバシー保護(佐久間淳)」を読んだのですが、非常によくまとまっていたので、重要と考えた点をまとめます。 そして願わくば、プ…

AutoMLで文学作品(日本語)の分類をしてみた

先日の記事で、創業記念で打ち出そうと考えているデータサイエンスコンペティションのアイデアをご紹介しましたが、 GoogleのAutoML Natural Languageが一応日本語の自然言語分類にも対応しているとのことで、同様のデータを元手に試してみました。 正確には…

AIは芥川龍之介を見分けられるか?

タイトルがいきなり何だ?という話ですが、 先日の記事でも言及した、創業記念で打ち出そうと考えているデータサイエンスコンペティションのアイデアをご紹介します。 この内容は、先日参加した技術アウトプットもくもく会でも発表させていただいたものです…