-
Notifications
You must be signed in to change notification settings - Fork 2
Expand file tree
/
Copy pathSearchText.py
More file actions
36 lines (27 loc) · 1.39 KB
/
SearchText.py
File metadata and controls
36 lines (27 loc) · 1.39 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
import requests
from bs4 import BeautifulSoup
# URL de la página que deseas analizar
url = 'https://www.ejemplo.com'
# Lista de palabras clave que deseas buscar
palabras_clave = ["IA", "machine learning", "inteligencia artificial", "algoritmo"]
# Realiza una solicitud HTTP para obtener el contenido de la página
response = requests.get(url)
# Verifica si la solicitud fue exitosa (código de respuesta 200)
if response.status_code == 200:
# Parsea el contenido HTML de la página
soup = BeautifulSoup(response.text, 'html.parser')
# Encuentra y extrae todo el texto de la página
texto_pagina = soup.get_text()
# Inicializa un contador para cada palabra clave
contador_palabras = {palabra: 0 for palabra in palabras_clave}
# Convierte el texto de la página en minúsculas para una búsqueda insensible a mayúsculas
texto_pagina = texto_pagina.lower()
# Itera a través de las palabras clave y cuenta sus ocurrencias
for palabra in palabras_clave:
contador_palabras[palabra] = texto_pagina.count(palabra.lower())
# Imprime los resultados
for palabra, contador in contador_palabras.items():
print(f'La palabra "{palabra}" aparece {contador} veces en la página.')
else:
# Si la solicitud no fue exitosa, muestra un mensaje de error
print(f'Error al obtener la página. Código de respuesta: {response.status_code}')