В прошлом уроке мы получили файл со статистикой по стоимости интернета. Однако‚ некоторые столбцы содержат числовую информацию‚ но представляют собой строки. Нам необходимо получить столбцы с числовыми значениями‚ чтобы потом построить графики на их основе. Также мы должны удалить строки с пропусками из набора данных.Для начала‚ нам необходимо определить‚ какие столбцы содержат числовую информацию‚ хотя являются строками. Для этого мы можем использовать функцию pandas to_numeric. Данная функция позволяет преобразовать значения в столбце в числовой формат‚ если это возможно.Применение этой функции к столбцам с помощью цикла и проверка успешности преобразования можно выполнить следующим образом⁚
python
import pandas as pd
# Загрузка файла со статистикой
data pd.read_csv(‘статистика.csv’)
# Список столбцов‚ содержащих числовую информацию в строковом формате
numeric_columns []
# Цикл по столбцам для проверки числовых значений
for column in data.columns⁚
try⁚
pd.to_numeric(data[column])
numeric_columns.append(column)
except ValueError⁚
continue
Теперь‚ когда у нас есть список столбцов с числовыми значениями‚ мы можем использовать его для построения графиков. Для этого можно воспользоваться‚ например‚ библиотекой matplotlib. python
import matplotlib.pyplot as plt
# Построение графиков для столбцов с числовыми значениями
for column in numeric_columns⁚
plt.plot(data[column])
plt.xlabel(‘Номер строки’)
plt.ylabel(‘Значение’)
plt.title(column)
plt.show
Наконец‚ мы должны удалить строки с пропусками из набора данных. Для этого мы можем использовать функцию dropna библиотеки pandas. python
# Удаление строк с пропусками
data data.dropna
Теперь у нас есть набор данных без пропущенных значений‚ и мы можем использовать его для дальнейшего анализа и построения графиков.
В итоге‚ мы смогли получить столбцы с числовыми значениями из файловой статистики по стоимости интернета‚ преобразовав строки с помощью функции pandas to_numeric. Далее‚ мы построили графики на основе этих значений‚ используя библиотеку matplotlib. Наконец‚ мы удалили строки с пропусками из набора данных с помощью функции dropna библиотеки pandas.