Corrección scrapertools.cachepage y scrapertools.get_match

2019-04-03 17:19:52 +02:00
parent 867a14fe23
commit 550e67da94
33 changed files with 76 additions and 112 deletions
@@ -53,7 +53,7 @@ def videos(item):
    data = httptools.downloadpage(item.url).data
    itemlist = []

-    data = scrapertools.get_match(data, '<article.+?>(.*?)</article>')
+    data = scrapertools.find_single_match(data, '<article.+?>(.*?)</article>')

    # Patron
    patron = '(?s)<div class="thumb-list__item.*?href="([^"]+)".*?src="([^"]+)".*?alt="([^"]+)">.*?'
@@ -87,7 +87,7 @@ def categorias(item):

    data = httptools.downloadpage(item.url).data

-    data = scrapertools.get_match(data, '(?s)<div class="all-categories">(.*?)</aside>')
+    data = scrapertools.find_single_match(data, '(?s)<div class="all-categories">(.*?)</aside>')

    patron = '(?s)<li>.*?<a href="([^"]+)".*?>([^<]+).*?</a></li>'
    matches = re.compile(patron, re.DOTALL).findall(data)