rxEnsemble을 사용하여 FastForest 모델을 학습시키는 함수 이름 및 인수가 포함된 목록을 만듭니다.
사용법
fastForest(numTrees = 100, numLeaves = 20, minSplit = 10,
exampleFraction = 0.7, featureFraction = 0.7, splitFraction = 0.7,
numBins = 255, firstUsePenalty = 0, gainConfLevel = 0,
trainThreads = 8, randomSeed = NULL, ...)
주장들
numTrees
앙상블에서 만들 의사 결정 트리의 총 수를 지정합니다. 더 많은 의사 결정 트리를 만들면 잠재적으로 더 나은 범위를 얻을 수 있지만 학습 시간이 증가합니다. 기본값은 100입니다.
numLeaves
모든 트리에서 만들 수 있는 최대 리프 수(터미널 노드)입니다. 값이 높을수록 트리의 크기가 증가하고 정밀도가 향상될 수 있지만 과잉 맞춤 및 학습 시간이 길어질 위험이 있습니다. 기본값은 20입니다.
minSplit
리프를 구성하는 데 필요한 최소 학습 인스턴스 수입니다. 즉, 하위 샘플링된 데이터에서 회귀 트리의 리프에서 허용되는 최소 문서 수입니다. '분할'은 트리(노드)의 각 수준에 있는 기능이 임의로 분할됨을 의미합니다. 기본값은 10입니다.
exampleFraction
각 트리에 사용할 임의로 선택한 인스턴스의 비율입니다. 기본값은 0.7입니다.
featureFraction
각 트리에 사용할 임의로 선택한 기능의 비율입니다. 기본값은 0.7입니다.
splitFraction
각 분할에 사용할 임의로 선택한 기능의 비율입니다. 기본값은 0.7입니다.
numBins
기능당 고유 값(bin)의 최대 수입니다. 기본값은 255입니다.
firstUsePenalty
이 기능은 먼저 페널티 계수를 사용합니다. 기본값은 0입니다.
gainConfLevel
트리 피팅 게인 신뢰도 요구 사항(범위 [0,1)에 있어야 합니다). 기본값은 0입니다.
trainThreads
학습에 사용할 스레드 수입니다. 지정된 경우 NULL 사용할 스레드 수가 내부적으로 결정됩니다. 기본값은 NULL입니다.
randomSeed
임의 시드를 지정합니다. 기본값은 NULL입니다.
...
추가 인수입니다.