Corrección scrapertools.cachepage y scrapertools.get_match

2019-04-03 17:19:52 +02:00
parent 867a14fe23
commit 550e67da94
33 changed files with 76 additions and 112 deletions
@@ -37,7 +37,7 @@ def categorias(item):
    logger.info()
    itemlist = []
    data = httptools.downloadpage(item.url).data
-    data = scrapertools.get_match(data,'<ul class="cf">(.*?)</ul>')
+    data = scrapertools.find_single_match(data,'<ul class="cf">(.*?)</ul>')
    data = re.sub(r"\n|\r|\t|&nbsp;|<br>", "", data)
    patron = '<li>.*?<a href="([^"]+)".*?'
    patron += '<img class="thumb" src="([^"]+)" alt="([^"]+)".*?'
@@ -57,7 +57,7 @@ def lista(item):
    logger.info()
    itemlist = []
    data = httptools.downloadpage(item.url).data
-    data = scrapertools.get_match(data,'<ul class="cf">(.*?)<h2>Advertisement</h2>')
+    data = scrapertools.find_single_match(data,'<ul class="cf">(.*?)<h2>Advertisement</h2>')
    patron  = '<li>.*?<a href="([^"]+)".*?'
    patron += 'src="([^"]+)" alt="([^"]+)".*?'
    patron += '<span class="time">(.*?)</span>'