次の方法で共有


fastForest: fastForest

関数名と引数を含むリストを作成し、 rxEnsemble を使用して FastForest モデルをトレーニングします。

使用方法

  fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
    exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
    numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
    trainThreads = 8, randomSeed = NULL, ...)
 

論争

numTrees

アンサンブルで作成するデシジョン ツリーの合計数を指定します。 より多くのデシジョン ツリーを作成することで、より適切なカバレッジを得ることができますが、トレーニング時間は長くなります。 既定値は 100 です。

numLeaves

任意のツリーに作成できるリーフ (ターミナル ノード) の最大数。 値を大きくすると、ツリーのサイズが大きくなり、精度が向上する可能性がありますが、オーバーフィットするリスクがあり、トレーニング時間が長くなる可能性があります。 既定値は 20 です。

minSplit

リーフを形成するために必要なトレーニング インスタンスの最小数。 つまり、サブサンプリングされたデータから、回帰ツリーのリーフで許可されるドキュメントの最小数です。 "分割" とは、ツリー (ノード) の各レベルの特徴がランダムに分割されることを意味します。 既定値は 10 です。

exampleFraction

各ツリーに使用するランダムに選択されたインスタンスの割合。 既定値は 0.7 です。

featureFraction

各ツリーに使用するランダムに選択された特徴の割合。 既定値は 0.7 です。

splitFraction

各分割で使用するランダムに選択された特徴の割合。 既定値は 0.7 です。

numBins

機能ごとの個別の値 (ビン) の最大数。 既定値は 255 です。

firstUsePenalty

この特徴は、最初にペナルティ係数を使用します。 既定値は 0 です。

gainConfLevel

ツリーフィッティングゲイン信頼要件(範囲[0,1)である必要があります)。 既定値は 0 です。

trainThreads

トレーニングで使用するスレッドの数。 NULLを指定すると、使用するスレッドの数が内部的に決定されます。 既定値は NULL です。

randomSeed

ランダム シードを指定します。 既定値は NULL です。

...

追加の引数。