Я недавно столкнулся с задачей обработки данных из CSV-файла, где мне нужно было извлечь информацию о марке и цене для каждой строки. Вместо того, чтобы делать это вручную, я использовал функции map и reduce, чтобы упростить и автоматизировать процесс.Начнем с использования функции map, которая позволяет применить определенную операцию ко всем элементам в списке. В моем случае, каждая строка CSV-файла представляла собой запись о товаре, содержащую марку и цену. Я написал функцию-маппер, которая извлекает марку и цену из каждой записи и возвращает их в виде кортежа.python
def mapper(row)⁚
brand, price row.split(‘,’)
return brand, float(price)
Здесь функция `split` разделяет строку на две части, используя запятую в качестве разделителя. Это позволяет мне получить отдельные значения для марки и цены. Затем я возвращаю эти значения как кортеж.Далее, я использовал функцию reduce, которая сводит список к одному значению путем применения функции аккумулятора к парам элементов списка. В моем случае, функция аккумулятора собирает данные по маркам и ценам товаров.python
from functools import reduce
def reducer(accumulator, item)⁚
brand, price item
if brand in accumulator⁚
accumulator[brand].append(price)
else⁚
accumulator[brand] [price]
return accumulator
Здесь, в зависимости от того, существует ли уже запись о марке в аккумуляторе, функция аккумулятора либо добавляет цену к существующей записи, либо создает новую запись с новой маркой и ценой.Наконец, я могу анализировать полученные данные для каждой марки, например, вычислить среднюю цену. Я могу сделать это, используя функцию map для преобразования данных и функцию reduce для вычисления среднего значения.python
data [
″Brand A,55.0″,
″Brand B,42.5″,
″Brand A,60;0″,
″Brand C,70.0″,
″Brand B,38.0″
]
mapped_data map(mapper, data)
reduced_data reduce(reducer, mapped_data, {})
average_prices {brand⁚ sum(prices) / len(prices) for brand, prices in reduced_data.items}
print(average_prices)
В моем примере, я использовал список `data` для демонстрации работы кода. В реальной ситуации, вы, вероятно, будете считывать строки из CSV-файла и передавать их в функцию `mapper` по одной.
В результате, я получил словарь, где каждая марка товара является ключом, а средняя цена ⏤ значением. Используя эту информацию, я могу проводить анализ данных и принимать инсайты о продуктах и их средних ценах.
Использование функций map и reduce для обработки данных из CSV-файла построчно оказалось очень полезным для меня. Они позволили автоматизировать процесс извлечения данных и вычисления средних цен для каждой марки.