Мой опыт обучения модели линейной регрессии на Python
Во время своего обучения программированию на Python, я столкнулся с задачей обучения модели линейной регрессии. В этой статье, я хотел бы поделиться с вами моим опытом и рассказать, как я справился с этой задачей.
Шаг 1⁚ Загрузка данных
Первым шагом в обучении модели линейной регрессии я загрузил данные из переменных X_1٫ X_2 и Y. Для этого я использовал библиотеку Pandas. В этой библиотеке есть удобная функция read_csv٫ которая позволяет прочитать данные из CSV файла или из переменных. Я передал переменные X_1٫ X_2 и Y как аргументы функции и сохранял данные в датафрейм.
import pandas as pd data {'X_1'⁚ X_1, 'X_2'⁚ X_2, 'Y'⁚ Y} df pd.DataFrame(data)
Шаг 2⁚ Подготовка данных
Перед обучением модели, я провел несколько операций по предобработке данных. Сначала я разделил данные на обучающую и тестовую выборки с помощью функции train_test_split из библиотеки sklearn. Затем я провел стандартизацию данных, чтобы привести их к одному и тому же масштабу.
from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler X df[['X_1', 'X_2']] y df['Y'] X_train, X_test, y_train, y_test train_test_split(X, y, test_size0.2) scaler StandardScaler X_train_scaled scaler.fit_transform(X_train) X_test_scaled scaler.transform(X_test)
Шаг 3⁚ Обучение модели
После подготовки данных, я приступил к обучению модели линейной регрессии. Для этого я использовал класс LinearRegression из библиотеки sklearn. Я передал стандартизированные данные обучающей выборки как аргументы для метода fit.
from sklearn.linear_model import LinearRegression model LinearRegression model.fit(X_train_scaled, y_train)
Шаг 4⁚ Оценка модели
После завершения обучения модели, я оценил ее производительность на тестовой выборке. Для этого я использовал метод score, который вычисляет коэффициент детерминации (R^2) модели.
score model.score(X_test_scaled, y_test) print(″Коэффициент детерминации R^2⁚ %.2f″ % score)
Шаг 5⁚ Предсказание значений Y по X
Наконец, для предсказания значений Y по X, я использовал метод predict модели. Я передал стандартизированные данные тестовой выборки и сохранял предсказанные значения в переменную y_pred.
y_pred model.predict(X_test_scaled)
Все эти шаги помогли мне успешно обучить модель линейной регрессии на Python. Я использовал библиотеки pandas, sklearn и провел предварительную обработку данных. Затем я обучил модель и оценил ее производительность на тестовой выборке. Наконец, я предсказал значения Y по X и получил результаты. Я надеюсь, что мой опыт будет полезен вам при обучении моделей линейной регрессии на Python.