2022年を読んだ本とともにふりかえる

日記

2022年もおつかれさまでした。今年は3月に転職を行い、業務内容もデータサイエンスよりエンジニアリング（MLOps）に近い領域に変わりました。来年はさらに変わりそうな気配がしています笑。というわけで読んだ本をざっくり紹介しつつ、2022年を振り返ってい…

2021-03-12

ワンフレーズで本と出会うサービス「一文一会」を作りました

個人開発

ここ2週間くらい力を入れて開発していた「一文一会」というサービスが完成しました。本のフレーズや紹介文がつぎつぎ（ランダムに）表示されるサービスです。ビビッときたフレーズをクリックすると何の本なのか知ることができます。好きな本を紹介するこ…

#react #Next.js #個人開発

2021-02-26

【discord.py】Among Usのためにランダムに人を選ぶDiscord Botを作りました

Python 個人開発

現在このbotは公開を停止しています。申し訳ありません。 discord.pyを使ってDiscordのbotを2時間くらいで作った話を書きます。なんで作ったか Among Usはクルーメイト（村人）とインポスター（人狼）が争うゲームなのですが、MODを利用して「狂人」「てる…

#among us #discord.py

2021-02-22

【Next.js】Among Usが好きすぎて3日間でAmong Us用メモアプリを作りました【個人開発】

個人開発 Next.js

こんにちは。鈴木天音（@SakuEji）です。今日はこの間作ったAmong Us NoteというAmong Us用メモアプリについて書きます。 Among Usが好きすぎて、Among Usのメモを手軽に取れるWebアプリを作りました・遊びながらでもぽちぽち簡単メモ・信用できる人と怪し…

#個人開発 #among us #Next.js #Bulma #Vercel

2020-06-06

atmaCup #5に参加しました（Public2位→Private6位）

データ解析 atmaCup

先週土曜日から今週土曜日にかけて1週間、atma社が主催するatmaCup #5に初参戦しました。結果はPublic2位からのPrivate6位で、残念ながらメダルは逃す結果となりました( ´•̥×•̥` )ｸﾔｼｲ個人的には短期間のコンペで複数のモデルを試し、最終的にエレガントっ…

2019-09-25

初めて技術書典に出展して、新刊を300部売るまで

技術書典発表データ解析

9/22の技術書典7で『ハマって覚えるデータ分析・機械学習の罠』を頒布しました。 BOOTHでの同時販売を含めると、書籍とPDFで合計300部以上買っていただけました。買ってくださった方々、ありがとうございました。感想や改善点などはTwitterで@SakuEjiにメ…

2019-08-27

自作キーボード沼への第一歩。Lily58を組み立てました！

自作キーボード日記

みなさんは遊舎工房をご存知でしょうか？遊舎工房とは、秋葉原(御徒町)にある自作キーボードの専門店です。おそらく日本唯一の専門店で、かつ店内に工作スペースがあり、購入したキーボードを組み立てて帰ることができます。開店当初から行きたいと思って…

2019-07-29

ICNR: Sub-Pixel Conv使用時のcheckerboard artifactを防ぐ初期化

Python データ解析画像処理 PyTorch

ニューラルネットワークで画像を拡大(アップサンプリング)する際、Transposed ConvolutionやSub-Pixel Convolutionという手法を使います。しかし、これらの手法を用いた場合、拡大した画像に格子状の模様(checkerboard artifact)が発生することが知られてい…

2019-07-22

Sub-Pixel Convolutionについて#5【画像処理&機械学習】論文LT会！で発表しました

データ解析画像処理

エルピクセル株式会社で開催された #5【画像処理&機械学習】論文LT会！で発表しました。題材に選んだのはSub-Pixel Convolutionで、関連する論文をいくつか紹介したという感じです。ちょっと前だけど定番な論文から最新の論文まで、幅広い論文が紹介され…

2019-07-13

【質疑応答付き】Kaggle Tokyo Meetup #6 に参加しました

Kaggle

DeNAで開催された、Kaggle Tokyo Meetup #6の参加記です。YouTube配信の視聴を含めるとMeetup参加は3回目ですが、回を増すごとに情報量も発表内容の多様性も増しているように思います。本当にすばらしい発表を皆様ありがとうございました。僕も発表やLTでコ…

2019-07-06

「結局、Kagglerは何を必死にやっているのか？」というLTをしました

発表データ解析 Kaggle

弊社では毎週、新卒LT会が開催されています。エンジニアがメインですが、同期が職種を問わず広く集まる場になっています。僕もなにか話したいと思い、7/5(金)に発表しました。タイトルは「結局、Kagglerは何を必死にやっているのか？」です。スライドはS…

2019-06-30

なぜn_estimatorsやepochsをパラメータサーチしてはいけないのか

データ解析 Python LightGBM

ハイパーパラメータを探索するため、グリッドサーチやOptunaなどを利用することがあると思います。しかし、「ハイパーパラメータ探索してみた」のようなQiita記事などでは間違って書かれていることも多いのですが、XGBoostやLightGBMの n_estimators ( num_…

2019-05-12

Dockerでデータ分析環境を手軽に作る方法

Kaggle データ解析 Docker Python

何かデータ分析を行わなければいけないとき、手軽に分析環境を用意したいというニーズがあります。 Jupyter Notebook上でnumpy、pandas、matplotlib、scikit-learnあたりが使えれば十分でしょうか。XGBoostやLightGBMといったライブラリも使えるようにしてお…

2019-03-02

Kaggle Eloコンペの振り返り・上位解法まとめ

Kaggle データ解析

KaggleのElo Merchant Category Recommendationコンペに参加しました。僕は@kasuminkoさん、@hirokasさんとチームを組んで、ラスト2週間だけ参加しました。結果から書くと、Public 221位からのPrivate 2220位という乱高下で儚く散りました。手元に銀メダル…

2019-02-15

Quoraコンペの振り返りと上位解法まとめ

Kaggle データ解析

KaggleのQuora Insincere Questions Classificationコンペに参加しました。結果は121位で、銀メダルでした。これで銀メダルが3枚目です。わーい。 Public Leaderboardで692位と振るわず、コンペのdeadlineが修論発表の当日だったので直前ほとんど何も出来ず…

2019-01-10

決定木は本当に変換に依存しないのか？

Python データ解析

決定木をベースとしたモデル(RandomForestやXGBoost、LightGBMなど)は正規化などの前処理が必要ないと言われています。理由として挙げられるのは「決定木は特徴量の大小関係のみに着目しており、値自体には意味がないから」というものです。先日もkaggler-…

2018-12-31

2018年、たいへんお世話になりました。

日記

大晦日なので実家に帰っています。あまり酒を嗜んだりはしない両親とシャンパンを飲み、話しているうちにこんな時間になってしまいました。帰省する前は「親と話すことなんてそんなに多くはないよなぁ」と思っていましたが、24歳になって昔(中高時代など)を…

2018-12-20

コピペで使える。Kaggleでの実験を効率化する小技まとめ

Kaggle データ解析 Python

この記事はKaggle Advent Calendar 2018の20日目の記事です。当初の予定ではPLAsTiCCコンペの振り返りをするはずだったのですが、時空の狭間に吸い込まれた結果0サブミットでフィニッシュしてしまいました。何ででしょうね。そこで、代わりにKaggleで使える…

2018-11-30

2018年11月を振り返ってみる

日記

先月に引き続き11月の振り返りをやっていきます。やったこと毎日GitHubに草を生やした先月に引き続き毎日草を生やせました。授業のTAの一環で簡単なコンペを開催するツールを作った(公開準備中) 授業のTAやる過程で小規模データ分析コンペを開催するWeb…

2018-11-01

LightGBMのcallbackを利用して学習履歴をロガー経由で出力する

Python データ解析 Kaggle LightGBM

KaggleなどでLightGBMを使っていて学習履歴を見たとき、ログファイルにも残してほしいと思うことがあります。公式にはそのような機能は実装されていないようなので、LightGBMのコールバックで対応したいと思います。 LightGBMではfitメソッドの引数としてコ…

2018-10-31

2018年10月を振り返ってみる

日記

最近、Dynalistというサービスを使ってやったことをメモしていました。それを元に今月を振り返りをやっていきます。やったこと毎日GitHubに草をはやした前半はGoのツールで、後半はPLAsTiCCコンペでコミットを稼いだ。苦し紛れでAtCoderの適当な問題を埋…

2018-10-20

Goあんこ4kgでLTしました

Golang

知らない人にはGoあんこってなんだよって話だと思いますが。 GoあんことはGo(Un)Conferenceの略で、Go言語のゆるふわLT会のことです。4kgは4回目って意味です。かわいい。発表資料はこちらです。主催者は@deadcheatさんと@syossan27さんのおふたりで、株式…

2018-10-06

Golangでどうでもいい知識を教えてくれるCLIツールを作った

Golang

最近ghqの作者@motemenさんのインタビューや pecoの作者@lestrratさんのインタビューを読んでいてCLIツールを作りたい欲がむらむらと湧いていました。 @motemenさんのインタビューによると、普段から「これ不便だな。ツールにならないかな」とアンテナを貼っ…

2018-09-17

KaggleのHome Creditコンペで銀メダルを取った話と、チームで動く際のノウハウとか

Kaggle データ解析

書く書くといっておきながらなかなか書かないでいたらGoogle Analyticsコンペが始まってしまいました。慌ててこの参戦記を書いています。 Home Credit Default Riskコンペに参加し、166位で銀メダルを取りました！僕は同じ研究室の@sugawarya、東大松尾研の…

2018-07-06

Kaggleで使えるFeather形式を利用した特徴量管理法

データ解析 Kaggle Python

みなさま、Kaggle楽しんでいますでしょうか。僕は現在Home Credit Default RiskとSantander Value Prediction Challengeに参加しています。前回のKaggle記事ではpandasのテクニックについてまとめました。多くのアクセスをいただき、人生初のホッテントリ…