Limpiar listado de keywords con Python

Al realizar un keyword research necesitamos limpiar el listado de keywords obtenidas para eliminar duplicados, caracteres extraños, canibalizaciones, etc…

Si hemos realizado un keywords research masivo (es común para las webs automáticas), tendremos un listado con miles de palabras clave y la tarea de limpieza se nos complica.

Para facilitar la limpieza del listado de palabras claves obtenidas del keyword research, he creado un script en Python que automatiza la tarea.

El script está implementado en un cuaderno de Jupyter (clic aquí si no sabes lo que es). Aquí te dejo el botón de descarga.

*Iré actualizando el script añadiendo más funcionalidades.

Estas son algunas de las acciones implementadas:

  • Eliminar keyword duplicadas
  • Dado un listado de palabras, eliminar todas las keywords que las contengan
  • Reemplazar palabras en el listado de keywords por otra
  • Eliminar keywords por longitud, ejemplo: menores a 2 palabras y mayores a 6
  • Limpiar caracteres: eliminar emojis, espacios en blanco al inicio y fin…
  • Reemplazar las referencias a los años por el año actual: mejor cafetera 2016 -> mejor cafetera 2021
Vista del script en el cuaderno de Jupyter
👉  Scrapy

👇Tu comentario