Одним из самых популярных и часто используемых операторов для разделения множества на тестовую и обучающую выборки в языке программирования Python является функция `train_test_split`, которая является частью библиотеки `scikit-learn`.Для начала, необходимо установить библиотеку `scikit-learn`, если она ещё не установлена на вашем компьютере. Для этого существует несколько способов, но один из наиболее распространенных — использование `pip`, менеджера пакетов для Python. Откройте командную строку и введите следующую команду⁚
python
pip install -U scikit-learn
После успешной установки библиотеки `scikit-learn`, вы готовы использовать функцию `train_test_split`.Пример использования функции `train_test_split` выглядит следующим образом⁚
python
from sklearn.model_selection import train_test_split
# Входные данные
X [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
y [11, 12, 13, 14, 15, 16, 17, 18, 19, 20]
# Разбиение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2, random_state42)
print(″Размер обучающей выборки⁚″, len(X_train))
print(″Размер тестовой выборки⁚″, len(X_test))
В этом примере у вас есть входные данные `X` и `y`, которые представляют собой массивы или списки с числами. Функция `train_test_split` разделяет эти данные на обучающую и тестовую выборки с помощью параметра `test_size`, который определяет долю данных, которая будет использоваться для теста. В данном примере `test_size0.2` означает, что 20% данных будут отложены для тестирования, а 80% будут использованы для обучения модели.
После выполнения кода, в консоли вы должны увидеть вывод, показывающий размеры обучающей и тестовой выборок.
Итак, правильным ответом на ваш вопрос является вариант 4⁚ `train_test_split`.