Tabularデータ向けのサーベイ論文を読んだのでメモ

2022-07-17

#Table #Tabular #Deep Learning #深層学習 #TabNet #TabTransformer Tabularデータ向けのサーベイ論文を読んだのでメモ

Deep Learning(DL)を用いたテーブルデータ向けの手法は色々提案されており、度々、精度面で勾配ブースティング法を超えたとか超えないと話題になる気がします。
テーブルデータ周りのDL手法に詳しくない身からすると実際のところどうなのかというのは謎だったので、サーベイ論文を読んでみました。
読んだ論文：Deep Neural Networks and Tabular Data: A Survey

[Read more]

CANINEの論文を読んだメモ

2021-04-13

#Deep Learning #深層学習 #自然言語処理 CANINEの論文を読んだメモ

BERTの系列でCharacterレベルでのembedding手法であるCANINEが提案され、これに似たような手法が盛んになるのではという考えのもと論文を読んだメモを書いておきます。 CANINEってなんて読むべきなんでしょう？

[Read more]

画像認識モデルの性能をあげるためのTips

2021-03-13

#Deep Learning #深層学習 #画像 #EfficientNet #TensorFlow #PyTorch

画像分類モデルを作っているときに予測精度をあげるのに役に立ったなぁという方法の一覧のメモです。簡単にできるものから順に紹介しているつもりです。

[Read more]

貧乏人なのでPoor Man’s BERTを読んで解説

2020-06-21

#BERT #DeepLearning #自然言語 #蒸留 #高速化 #Transformer #深層学習

本記事はQrunchからの転載です。

最近自然言語処理をよくやっていて、BERTを使うことも多いです。 BERTの性能は高く素晴らしいのですが、実際使う上では、私のような計算リソース弱者には辛いところがあります。

[Read more]

BERTを軽量化したALBERTの概要

2019-12-28

#深層学習 #ディープラーニング #BERT #自然言語 #ALBERT BERTを軽量化したALBERTの概要

本記事はQrunchからの転載です。

BERTのパラメータの数を減らしたモデルであるALBERTについての概要を書いていきます。

参考論文：ALBERT: A Lite BERT for Self-supervised Learning of Language Representations

問題意識

2018年に提案されたBERTは自然言語界隈では非常に上手くいった手法です。先程論文の引用数を見たら、もう3000を超えていまして、この数字を見てもよくわかります。

[Read more]

ディープラーニングのモデルの特徴量の寄与を求めるDeepLift

2019-12-19

#深層学習 #ディープラーニング #寄与 #DeepLift #Integrated Gradients #SHAP

本記事はQrunchからの転載です。

ディープラーニングのモデルに対する特徴量の寄与を求める方法の1つである、DeepLiftについて今回は説明します。

[Read more]

ディープラーニング向けの特徴量の寄与を求めるIntegrated Gradientsの解説

2019-12-08

#深層学習 #ディープラーニング #寄与度 #feature importance #Integrated Gradients

本記事はQrunchからの転載です。

機械学習のモデルの出力に対する入力された特徴量の寄与を求める手法の1つに、Integrated Gradientsというものがあります。 Integrated Gradientsはディープラーニング向けの手法ですが、他のディープラーニング向けの手法では満たしていない公理（性質）をいくつも満たしているという点で優れています。今回はそんなIntegrated Gradientsを解説します。

[Read more]

CNNで画像中のピクセルの座標情報を考慮できるCoordConv

2019-11-30

#CNN #CoordConv #深層学習 #ディープラーニング #畳み込み #Keras #PyTorch CNNで画像中のピクセルの座標情報を考慮できるCoordConv

本記事はQrunchからの転載です。

CNNの表現能力の高さはすばらしいものがありますが、何でもうまくいくわけではありません。例えば、画像中の位置情報を考慮しないと解けないような問題は、通常のCNNではうまく対応できません（具体的な例はこの後説明します）。
このような問題に対応した手法としてCoordConvというものがあります。CoordConvは座標情報をCNNのなかに組み込む手法で、これを使うことで解けるようになるケースや性能が大きく改善されるようなケースがあります。また「効くか分からないけど、とりあえず組み込む」ということをしても、デメリットはそれほどありません。

[Read more]

BERTでおこなうポケモンの説明文生成

2019-11-07

#Python #BERT #PyTorch #ディープラーニング #深層学習 #自然言語処理

本記事はQrunchからの転載です。

概要

自然言語界隈では非常によく話題になるBERTですが、BERTを使った文生成を実装してみたので今回はその話をします。BERTの事前学習モデルが文生成のタスクで使えたら、比較的少なめの学習データでもそれっぽく文生成できたりしないかなぁと思ってやってみました。

[Read more]

Posts for: #深層学習

問題意識

概要