%!s(int64=5) %!d(string=hai) anos · d1e963e426
--- a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Classification.java
+++ b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Classification.java
@@ -231,6 +231,7 @@ public class Classification implements DataFrameAnalysis {
 
															         return numTopClasses;
														
 
															     }
														
 
															+    @Override
														
 
															     public double getTrainingPercent() {
														
 
															         return trainingPercent;
														
 
															     }
														
--- a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/DataFrameAnalysis.java
+++ b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/DataFrameAnalysis.java
@@ -83,6 +83,12 @@ public interface DataFrameAnalysis extends ToXContentObject, NamedWriteable {
 
															      */
														
 
															     boolean supportsInference();
														
 
															+    /**
														
 
															+     * @return the percentage of data to use for training
														
 
															+     */
														
 
															+    default double getTrainingPercent() {
														
 
															+        return 100.0;
														
 
															+    }
														
 
															     /**
														
 
															      * Summarizes information about the fields that is necessary for analysis to generate
														
 
															      * the parameters needed for the process configuration.
														
--- a/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Regression.java
+++ b/x-pack/plugin/core/src/main/java/org/elasticsearch/xpack/core/ml/dataframe/analyses/Regression.java
@@ -178,6 +178,7 @@ public class Regression implements DataFrameAnalysis {
 
															         return predictionFieldName;
														
 
															     }
														
 
															+    @Override
														
 
															     public double getTrainingPercent() {
														
 
															         return trainingPercent;
														
 
															     }
														
--- a/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/action/TransportStartDataFrameAnalyticsAction.java
+++ b/x-pack/plugin/ml/src/main/java/org/elasticsearch/xpack/ml/action/TransportStartDataFrameAnalyticsAction.java
@@ -330,7 +330,7 @@ public class TransportStartDataFrameAnalyticsAction
 
															     private void validateSourceIndexHasAnalyzableData(StartContext startContext, ActionListener<StartContext> listener) {
														
 
															         ActionListener<Void> validateAtLeastOneAnalyzedFieldListener = ActionListener.wrap(
														
 
															-            aVoid -> validateSourceIndexHasRows(startContext, listener),
														
 
															+            aVoid -> validateSourceIndexRowsCount(startContext, listener),
														
 
															             listener::onFailure
														
 
															         );
														
@@ -359,7 +359,7 @@ public class TransportStartDataFrameAnalyticsAction
 
															         }
														
 
															     }
														
 
															-    private void validateSourceIndexHasRows(StartContext startContext, ActionListener<StartContext> listener) {
														
 
															+    private void validateSourceIndexRowsCount(StartContext startContext, ActionListener<StartContext> listener) {
														
 
															         DataFrameDataExtractorFactory extractorFactory = DataFrameDataExtractorFactory.createForSourceIndices(client,
														
 
															             "validate_source_index_has_rows-" + startContext.config.getId(),
														
 
															             startContext.config,
														
@@ -377,6 +377,9 @@ public class TransportStartDataFrameAnalyticsAction
 
															                             startContext.config.getId(),
														
 
															                             Strings.arrayToCommaDelimitedString(startContext.config.getSource().getIndex())
														
 
															                         ));
														
 
															+                    } else if (Math.floor(startContext.config.getAnalysis().getTrainingPercent() * dataSummary.rows)  >= Math.pow(2, 32)) {
														
 
															+                        listener.onFailure(ExceptionsHelper.badRequestException("Unable to start because too many documents " +
														
 
															+                            "(more than 2^32) are included in the analysis. Consider downsampling."));
														
 
															                     } else {
														
 
															                         listener.onResponse(startContext);
														
 
															                     }