関数名と引数を含むリストを作成し、 rxEnsemble を使用して FastForest モデルをトレーニングします。
使用方法
fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
trainThreads = 8, randomSeed = NULL, ...)
論争
numTrees
アンサンブルで作成するデシジョン ツリーの合計数を指定します。 より多くのデシジョン ツリーを作成することで、より適切なカバレッジを得ることができますが、トレーニング時間は長くなります。 既定値は 100 です。
numLeaves
任意のツリーに作成できるリーフ (ターミナル ノード) の最大数。 値を大きくすると、ツリーのサイズが大きくなり、精度が向上する可能性がありますが、オーバーフィットするリスクがあり、トレーニング時間が長くなる可能性があります。 既定値は 20 です。
minSplit
リーフを形成するために必要なトレーニング インスタンスの最小数。 つまり、サブサンプリングされたデータから、回帰ツリーのリーフで許可されるドキュメントの最小数です。 "分割" とは、ツリー (ノード) の各レベルの特徴がランダムに分割されることを意味します。 既定値は 10 です。
exampleFraction
各ツリーに使用するランダムに選択されたインスタンスの割合。 既定値は 0.7 です。
featureFraction
各ツリーに使用するランダムに選択された特徴の割合。 既定値は 0.7 です。
splitFraction
各分割で使用するランダムに選択された特徴の割合。 既定値は 0.7 です。
numBins
機能ごとの個別の値 (ビン) の最大数。 既定値は 255 です。
firstUsePenalty
この特徴は、最初にペナルティ係数を使用します。 既定値は 0 です。
gainConfLevel
ツリーフィッティングゲイン信頼要件(範囲[0,1)である必要があります)。 既定値は 0 です。
trainThreads
トレーニングで使用するスレッドの数。
NULLを指定すると、使用するスレッドの数が内部的に決定されます。 既定値は NULL です。
randomSeed
ランダム シードを指定します。 既定値は NULL です。
...
追加の引数。