Количество различных слов в тексте на языке Python
Я работал с задачей подсчета количества различных слов в тексте на языке Python‚ и хочу поделиться своим опытом.Для начала‚ мне понадобилась функция‚ которая будет принимать текст и возвращать количество различных слов. В языке Python для этого можно использовать словарь‚ так как он позволяет хранить уникальные значения.python
def count_unique_words(text)⁚
word_dict {}
words text.split
for word in words⁚
# удаляем символы пунктуации из слова
word word.strip(″‚.!?;⁚-″)
# приводим слово к нижнему регистру
word word.lower
if word not in word_dict⁚
word_dict[word] 1
return len(word_dict)
В этой функции я сначала инициализирую пустой словарь `word_dict`‚ который будет использоваться для подсчета уникальных слов. Затем‚ я разбиваю входной текст на слова с помощью метода `split`.
Далее‚ я прохожу по каждому слову‚ удаляю из него символы пунктуации и привожу его к нижнему регистру с помощью методов `strip` и `lower`. Затем‚ я проверяю‚ есть ли слово в словаре `word_dict`. Если слово уже есть‚ я ничего не делаю. Если слова нет‚ я добавляю его в словарь со значением 1.
Наконец‚ я возвращаю длину словаря `word_dict`‚ которая показывает количество различных слов в тексте.Пример использования функции⁚
python
text ″Привет‚ как дела? Я просто привет. Как‚ как дела?″
unique_words count_unique_words(text)
print(″Количество различных слов⁚″‚ unique_words)
Количество различных слов⁚ 5
На выходе я получаю количество различных слов в тексте‚ равное 5.
Вот как я справился с подсчетом количества различных слов в тексте на языке Python. Этот подход помогает мне эффективно решать данную задачу.