# -*- coding: utf-8 -*- import re import urlparse from core import httptools from core import scrapertools from core import servertools from core.item import Item from platformcode import config, logger host = "http://www.peliculashindu.com/" def mainlist(item): logger.info() itemlist = list() #itemlist.append( # Item(channel=item.channel, action="lista", title="Top Películas", url=urlparse.urljoin(host, "top"))) #itemlist.append(Item(channel=item.channel, action="lista", title="Novedades", url=host)) itemlist.append(Item(channel=item.channel, action="explorar", title="Género", url=urlparse.urljoin(host, "genero"))) #itemlist.append(Item(channel=item.channel, action="explorar", title="Listado Alfabético", # url=urlparse.urljoin(host, "alfabetico"))) itemlist.append(Item(channel=item.channel, action="explorar", title="Listado por Año", url=urlparse.urljoin(host, "genero"))) #itemlist.append(Item(channel=item.channel, action="lista", title="Otras Películas (No Bollywood)", # url=urlparse.urljoin(host, "estrenos"))) #itemlist.append(Item(channel=item.channel, title="Buscar", action="search", url=urlparse.urljoin(host, "buscar-"))) return itemlist def explorar(item): logger.info() itemlist = list() urltitle = item.title data = httptools.downloadpage(item.url).data data = re.sub(r"\n|\r|\t|\s{2}| ", "", data) if 'Género' in urltitle: patron = "var accion = '

(.+?)<\/div>'" #if 'Listado Alfabético' in urltitle: # patron = '<\/li><\/ul>.+?

Pel.+?tico<\/h3>(.+?)<\/h3>' if 'Año' in urltitle: patron = "var anho = '
(.+?)<\/div>'" data_explorar = scrapertools.find_single_match(data, patron) patron_explorar = '
(.+?)<\/a><\/li>' matches = scrapertools.find_multiple_matches(data_explorar, patron_explorar) for scrapedurl, scrapedtitle in matches: if 'Acci' in scrapedtitle: scrapedtitle = 'Acción' if 'Anima' in scrapedtitle: scrapedtitle = 'Animación' if 'Fanta' in scrapedtitle: scrapedtitle = 'Fantasía' if 'Hist' in scrapedtitle: scrapedtitle = 'Histórico' if 'lico Guerra' in scrapedtitle: scrapedtitle = 'Bélico Guerra' if 'Biogra' in scrapedtitle: scrapedtitle = 'Biografía' if 'Ficcion' in scrapedtitle: scrapedtitle = 'Ciencia Ficción' itemlist.append(item.clone(action='lista', title=scrapedtitle, url=scrapedurl)) return itemlist def search(item, texto): logger.info() texto = texto.replace(" ", "-") item.url = item.url + texto # logger.info("item="+item.url) if texto != '': return lista(item) def lista(item): logger.info() itemlist = [] data = httptools.downloadpage(item.url).data data = re.sub(r"\n|\r|\t|\s{2}| ", "", data) # Eliminamos tabuladores, dobles espacios saltos de linea, etc... data_mov= scrapertools.find_single_match(data,'
(.+?)
') patron = "
" #generico patron += " .+?" #scrapedurl patron += " " #scrapedthumbnail patron += "
(.+?)<\/p>.+?" #scrapedplot patron += "
(.+?)" #scrapedyear patron += "<\/p>.+?
(.+?)<\/h2>" #scrapedtitle matches = scrapertools.find_multiple_matches(data_mov, patron) for scrapedurl, scrapedthumbnail, scrapedplot, scrapedyear, scrapedtitle in matches: if '"' in scrapedthumbnail: scrapedthumbnail=scrapedthumbnail.replace('"','') itemlist.append(item.clone(title=scrapedtitle+' ['+scrapedyear+']', url=scrapedurl, plot=scrapedplot, thumbnail=scrapedthumbnail, action="opcion", show=scrapedtitle)) # Paginacion patron_pag = '' paginasig = scrapertools.find_single_match(data, patron_pag) next_page_url = host + paginasig if paginasig != "": item.url = next_page_url itemlist.append(Item(channel=item.channel, action="lista", title="[COLOR cyan]Página Siguiente >>[/COLOR]", url=next_page_url, thumbnail='https://s32.postimg.cc/4zppxf5j9/siguiente.png')) return itemlist def opcion(item): logger.info() itemlist = [] data = httptools.downloadpage(item.url).data data = re.sub(r"\n|\r|\t|\s{2}| ", "", data) logger.info("inflos"+data) patron = '<\/div> <\/div> 0 and item.contentChannel!='videolibrary': # itemlist.append( # Item(channel=item.channel, title='[COLOR yellow]Añadir esta pelicula a la videoteca[/COLOR]', url=item.url, # action="add_pelicula_to_library", extra="findvideos", contentTitle=show)) # return itemlist