DiffBot es una herramienta en línea que nos permite obtener en un formato JSON, los datos de una página web, más precisamente un artículo.

Para qué nos puede servir esta herramienta? En mi caso me sirve para obtener en formato JSON los datos de páginas de noticias para almacenarlos en una base de datos y así utilizarlos en una aplicación móvil que muestra las noticias de múltiples fuentes.

Precios

  • Free (14 días): 10,000 peticiones | $0
  • Standar: 250,000/mes | $299
  • Pro: 5,000,000/mes | $4999

Podemos obtener de http://blog.mcnallydevelopers.com/paquete-para-atom-que-cierra-etiquetas-html-de-forma-automatica/ el siguiente resultado: https://gist.github.com/paulomcnally/bbb96273ac96c6957f7f

Puedes hacer la prueba durante 14 días y analizar si es lo que necesitas.