bonotakeの日記

元・ソフトウェア工学系研究者、今・AI系エンジニア

追記:ディープラーニングをやる人向け『仕事ではじめる機械学習』のオススメと注意点

一昨日、このような記事を書きました。 bonotake.hatenablog.com

そしたらまぁ、自分の想像を遥か超える勢いでバズりまして。1日も経たないうちにブクマが軽く100を超えてしまいました(これ書いてる時点で171)。 今まで、1記事につきブクマ1桁しかもらったことないんで、いやはや、びっくりです。

それ以外にも色々なところから反響ありました。

あのTJOさんに煽られました。

他、紹介した『仕事ではじめる機械学習』著者の方々からも。

ディープラーニングをやる人向け『仕事ではじめる機械学習』のオススメと注意点 - bonotakeの日記

本にも書きましたが古典的なMLは特徴エンジニアリングがDLはネットワーク設計が大事ですね。教師データは規模の違いはあれど両方重要かなあ

2018/01/08 07:18
b.hatena.ne.jp

いや、ありがとうございます。

しかし、何でこんなバズったんだろう……ベストセラー本に手をつけたから? 「ディープラーニング」ブームだから? 最後に「俺が本出すぜ」アピールしたから?

一緒に本の企画している編集者さん(私の過去いた界隈では知ってる人は知っている、Sさんです)曰く

あのブログの煽り力が秀逸ですw

煽ったつもりはなかったんですが……まぁいいや。

それはともかく、ちょいちょい気になる反応も頂いたんで、ここに追記という形で言及しておきます。

書いてることがおかしい

昨日の晩くらいに、会社のSlack経由で、同僚の1人から感想もらいました。曰く、

なんかだいぶDL案件への感覚が違いますね

ええ〜(;´Д`)

で、他の人も巻き込んでSlack上で議論してたんですが。とりあえず、その方から指摘されたのは2点。

  1. ネットワークを論文のまま使わないことはよくある。むしろそのまま使うことのほうが稀
  2. 一番時間がかかるのは学習ではない

1つめについては、その方曰く

だいたいベースラインとしては、公開されたネットワークを使いますが、その後は、あれこれネットワークの層を削ったり、レイヤーを変えてみたり、分岐の場所を変更したり、っていうのをよくしますね。

との事。なのでこれについては、僕の経験不足だったということで、前の記事を訂正しておきます。(既に前回の記事内にも訂正を入れています。)

2つめについては、これは僕の本意ではないです。確かに「極めて時間がかかる」とは書いたし、感覚としてMLよりはDLの方が時間かかると思ってますが、そこが「一番」時間を食うというつもりではなかったです。

じゃあ、何が時間がかかるか、というと、前処理と学習データ(教師データ)の作成、評価指標の選定とテストデータの作成、あたり。

この辺は僕としても全然異存はなくて。ただ、この辺はMLもDLも一緒で、『仕事ではじめる〜』にも書いてあることそのものなんですよね。僕は『仕事ではじめる〜』と「違う」ところを書こうとしたために、そっちばかりが強調されて読めてしまったのかもしれません。

とりあえず、学習に一番時間がかかるわけではないことと、前処理、学習データの作成、評価方法のセットアップが一番大変というのはここに強調しておきます。

『仕事ではじめる〜』は読む価値がない??

Twitter眺めてると、ごく少数ですが、僕の記事が『仕事ではじめる〜』を否定しているかのように捉えてる方がいましたが。

ぜんぜん違います。むしろみんな読めです。

肌感覚ですが、DLでも書いてあることの7割以上は通用すると思ってます。細かい個々の手法などはともかくとしても、プロジェクトの回し方や、ML/DLに対する基本的な考え方なんかはほとんど同じです。どうぞ誤解なきよう。

僕が企画してる本について

最後に、僕が今企画してる本ですが……皆さんがあまりに「『仕事ではじめるディープラーニング』読みたい!」とおっしゃってくださるので、若干気が引けてきました(笑)

一応お断りをしておきますが、そこそこ近い路線を狙ってはいますが『仕事ではじめるディープラーニング』そのものではないです。多少趣旨は変えているというか、違う攻め方をしたいと思っています。まぁそれなりにはタメになる本にしたいと思ってますので、どうか宜しくお願い致します。

今後、本の進捗などあれば、ここなどでちょくちょく書いていこうと思います。

注:bonotakeは、amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイト宣伝プログラムである、 Amazonアソシエイト・プログラムの参加者です。