.*?0 resultados' in data: #error item = generictools.web_intervenida(item, data) #Verificamos que no haya sido clausurada if item.intervencion: #Sí ha sido clausurada judicialmente item, itemlist = generictools.post_tmdb_listado(item, itemlist) #Llamamos al método para el pintado del error return itemlist #Salimos logger.error("ERROR 02: LISTADO: Ha cambiado la estructura de la Web " + " / PATRON: " + patron + " / DATA: " + data) itemlist.append(item.clone(action='', title=item.channel.capitalize() + ': ERROR 02: LISTADO: Ha cambiado la estructura de la Web. Reportar el error con el log')) return itemlist #si no hay más datos, algo no funciona, pintamos lo que tenemos #Ahora se hace una simulación para saber cuantas líneas podemos albergar en este Itemlist. #Se controlará cuantas páginas web se tienen que leer para rellenar la lista, sin pasarse title_lista_alt_for = [] #usamos está lista de urls para el FOR, luego la integramos en la del WHILE for scrapedurl, scrapedthumb, quality, lang, scrapedtitle, date in matches_alt: #Realiza un control de las series que se añaden, ya que el buscador devuelve episodios y no las series completas #Se analiza si la url de la serie o pelicula ya se ha listado antes. Si es así, esa entrada se ignora #Cuando llega al num. máximo de entradas por página, la pinta y guarda los contadores y la lista de series scrapedurl_alt = scrapedurl if modo_serie_temp == 1: #si está en modo Serie agrupamos todos los episodios en una línea scrapedurl_alt = re.sub(r'-temporada.*?-\d+.*', '/', scrapedurl_alt) scrapedurl_alt = re.sub(r'-?\d+x\d+.*', '/', scrapedurl_alt) #quita los datos de Temporada/episodio else: #si es modo Temporada, se agrupan a una línea por Temporada num_temp = scrapertools.find_single_match(scrapedurl_alt, '-?(\d+)x') #captura num de Temporada scrapedurl_alt = re.sub(r'-?\d+x\d+.*', '-temporada-%s-completa' % num_temp, scrapedurl_alt) #epis. a Temporada if scrapedurl_alt in title_lista_alt or scrapedurl_alt in title_lista_alt_for: # si ya se ha tratado, pasamos al siguiente item continue title_lista_alt_for += [scrapedurl_alt] cnt_title += 1 # Sería una línea real más para Itemlist #Control de página if cnt_title > cnt_tot*0.65: #si se acerca al máximo num. de lineas por pagina, tratamos lo que tenemos cnt_next = 99 #Casi completo, no sobrepasar con la siguiente página if cnt_title > cnt_tot: cnt_title = 99 #Sobrepasado el máximo. Ignoro página actual #Restauro puntero "next" a la página actual, para releearla en otra pasada, y salgo item.post = re.sub(r"page\/\d+\/", "page/%s/" % post_num, item.post) break if cnt_title > 0: #Si se ha llegado a las 5 páginas tratadas, pintamos. Si no continuamos un poco if cnt_next >= cnt_top*0.5: cnt_next = 99 if cnt_title <= cnt_tot: matches.extend(matches_alt) #Acumulamos las entradas a tratar. Si nos hemos pasado ignoro última página title_lista_alt.extend(title_lista_alt_for) #logger.debug("BUCLE: " + item.post + " / post: " + str(post) + " / post_num: " + str(post_num) + " / cnt_next: " + str(cnt_next) + " / " + str(title_lista_alt)) #logger.debug("PATRON: " + patron) #logger.debug(matches) #logger.debug(video_section) cnt_title = 0 for scrapedurl, scrapedthumb, quality, lang, scrapedtitle, date in matches: #Realiza un control de las series que se añaden, ya que el buscador devuelve episodios y no las series completas #Se analiza si la url de la serie ya se ha listado antes. Si es así, esa entrada se ignora #El control de página ya se ha realizado más arriba scrapedurl_alt = scrapedurl if modo_serie_temp == 1: #si está en modo Serie agrupamos todos los episodios en una línea scrapedurl_alt = re.sub(r'-temporada.*?-\d+.*', '/', scrapedurl_alt) scrapedurl_alt = re.sub(r'-?\d+x\d+.*', '/', scrapedurl_alt) #quita los datos de Temporada/episodio else: #si es modo Temporada, se agrupan a una línea por Temporada num_temp = scrapertools.find_single_match(scrapedurl_alt, '-?(\d+)x') #captura num de Temporada scrapedurl_alt = re.sub(r'-?\d+x\d+.*', '-temporada-%s-completa' % num_temp, scrapedurl_alt) #epis. a Temporada if scrapedurl_alt in title_lista: # si ya se ha tratado, pasamos al siguiente item continue # solo guardamos la url para series y docus title_lista += [scrapedurl_alt] cnt_title += 1 # Sería una línea real más para Itemlist item_local = item.clone() #Creamos copia de Item para trabajar y limpiamos campos innecesarios if item_local.media: #Viene de Búsquedas del item_local.media if item_local.title_lista: del item_local.title_lista item_local.post = True del item_local.post if item_local.category: del item_local.category item_local.context = "['buscar_trailer']" title = re.sub('\r\n', '', scrapedtitle).decode('utf8').encode('utf8').strip() #Decode-encode utf8 title = re.sub(r"\s{2}", " ", title) title = title.replace("’", "'").replace("\xc3\x97", "x") item_local.url = urlparse.urljoin(host, scrapedurl) if "categoria" in item.url: #En páginas de Categorias no viene ni la calidad ni el idioma item_local.quality = scrapertools.find_single_match(item.url, r'\/categoria\/(.*?)\/') if "4k" in item_local.quality.lower(): item_local.quality = "4K HDR" #Maquillamos un poco la calidad lang = '' #Ignoramos el idioma elif not "post" in quality: item_local.quality = quality #Salvamos la calidad en el resto de páginas item_local.language = [] #Verificamos el idioma por si encontramos algo if "latino" in lang.lower() or "latino" in item.url or "latino" in title.lower(): item_local.language += ["LAT"] if "ingles" in lang.lower() or "ingles" in item.url or "vose" in scrapedurl or "vose" in item.url: if "VOSE" in lang.lower() or "sub" in title.lower() or "vose" in scrapedurl or "vose" in item.url: item_local.language += ["VOS"] else: item_local.language += ["VO"] if "dual" in lang.lower() or "dual" in title.lower(): item_local.language[0:0] = ["DUAL"] #Limpiamos el título de la basuna innecesaria title = title.replace("Dual", "").replace("dual", "").replace("Subtitulada", "").replace("subtitulada", "").replace("Subt", "").replace("subt", "").replace("Sub", "").replace("sub", "").replace("(Reparado)", "").replace("(Proper)", "").replace("(proper)", "").replace("Proper", "").replace("proper", "").replace("(Latino)", "").replace("Latino", "") title = title.replace("- HDRip", "").replace("(HDRip)", "").replace("- Hdrip", "").replace("(microHD)", "").replace("(DVDRip)", "").replace("(HDRip)", "").replace("(BR-LINE)", "").replace("(HDTS-SCREENER)", "").replace("(BDRip)", "").replace("(BR-Screener)", "").replace("(DVDScreener)", "").replace("TS-Screener", "").replace(" TS", "").replace(" Ts", "") if item_local.extra == "peliculas": #preparamos Item para películas if "/serie" in scrapedurl or "/serie" in item.url: continue item_local.contentType = "movie" item_local.action = "findvideos" title = scrapertools.htmlclean(title) #Quitamos html restante item_local.contentTitle = title.strip() else: #preparamos Item para series if not "/serie" in scrapedurl and not "/serie" in item.url: continue if modo_serie_temp == 1: #si está en modo Serie item_local.contentType = "tvshow" item_local.extra = "tvshow" else: #si no, en modo temporada item_local.contentType = "season" item_local.extra = "season" item_local.action = "episodios" title = re.sub(r'[t|T]emp.*?\d+.*', '', title) #Limpiamos temporadas completas, solo queremos la serie entera title = re.sub(r'\d?\d?&#.*', '', title) #Limpiamos temporada y episodio title = re.sub(r'\d+[x|×]\d+.*', '', title) #Limpiamos temporada y episodio title = scrapertools.htmlclean(title) #Quitamos html restante item_local.contentSerieName = title.strip() item_local.title = title.strip() #Salvamos el título item_local.from_title = title.strip() #Guardamos esta etiqueta para posible desambiguación de título item_local.infoLabels['year'] = "-" #Reseteamos el año para que TMDB nos lo de #Agrega el item local a la lista itemlist itemlist.append(item_local.clone()) #if not item.category and result_mode == 0: #Si este campo no existe, viene de la primera pasada de una búsqueda global # return itemlist #Retornamos sin pasar por la fase de maquillaje para ahorrar tiempo #Pasamos a TMDB la lista completa Itemlist tmdb.set_infoLabels(itemlist, __modo_grafico__) #Llamamos al método para el maquillaje de los títulos obtenidos desde TMDB item, itemlist = generictools.post_tmdb_listado(item, itemlist) #Gestionamos el paginador patron = '

.*?]+>(.*?)

') #Seleccionamos la zona de links patron = '\/icono_.*?png" title="(?P.*?)?" [^>]+><\/td>(?P.*?)?.*?(?P.*?)?<\/td>= item.infoLabels["number_of_seasons"]: #Si tenemos en .nfo igaual o más temporadas, investigar cnt_s = 0 for s in item.library_playcounts: #Ver cuántas Temporadas hay en Videoteca if "season" in s: cnt_s += 1 if cnt_s > 1: #hay más de 1 temporada en Videoteca, es Serie? if temp_actual_num > 1: #Temp. actual > 1, parece Temporada s = 1 while s <= item.infoLabels["number_of_seasons"]: #Buscamos la primera Temporada de Videoteca if item.library_playcounts.has_key('season %d' % s): #Buscamos si la Temporada 1 existe if item.library_playcounts["season %d" % s] < temp_actual_num: #Si menor que actual, es Temp. item.contentType = "season" else: item.contentType = "tvshow" #No es Temporada 1, pero es más baja que la actual. Es Serie break s += 1 else: #Sí, es Serie item.contentType = "tvshow" else: #Solo hay una temporada en la Videoteca if temp_actual_num > 1: #es Temporada la actual? if item.contentSeason: item.contentType = "season" #Si está informado el num de Temp. se creó como Temporada else: item.contentType = "tvshow" #Si no, es Serie que no tiene Temp. 1 else: #Si es Temp. 1, se procesa según el valor de configuración if modo_serie_temp == 0: #Es Temporada item.contentType = "season" else: #Es Serie item.contentType = "tvshow" else: item.contentType = "list" temp_lista = [] temp_bucle = 0 temp_next_alt = '' while temp_actual != '': #revisamos las temporadas hasta el final if not data: #si no hay datos, descargamos. Si los hay de loop anterior, los usamos try: data = re.sub(r"\n|\r|\t|\s{2,}", "", httptools.downloadpage(temp_actual).data) #Controla que no haya un bucle en la cadena de links entre temporadas if scrapertools.find_single_match(temp_actual, patron_actual_num) in temp_lista: temp_bucle += 1 if temp_bucle > 5: #Si ha pasado por aquí más de 5 veces es que algo anda mal logger.error("ERROR 05: EPISODIOS: Los links entre temporadas están rotos y se está metiendo en un loop: " + temp_actual + " (" + str (temp_actual_num) + ") / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / Lista temps: " + str(temp_lista) + " / DATA: " + data) itemlist.append(item.clone(action='', title=item.channel + ': ERROR 05: EPISODIOS. Los links entre temporadas están rotos y se está metiendo en un loop. Reportar error con log')) data = '' return itemlist #Algo no funciona con los links, pintamos lo que tenemos if temp_advance == "back": #Se salta una temporada hacia atrás logger.error("ERROR 05: EPISODIOS: Temporada duplicada. Link BACK erroneo: " + temp_actual + " (" + str (temp_actual_num) + ") / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / Lista temps: " + str(temp_lista) + " / Bucle: " + str(temp_bucle) + " / DATA: " + data) temp_actual = scrapertools.find_single_match(data, patron_previous) #url de temporada anterior data = '' continue #volvemos a leer página con la url de la anterior if temp_advance == "forw": #Se salta una temporada hacia adelante logger.error("ERROR 05: EPISODIOS: Temporada duplicada. Link FORW erroneo: " + temp_actual + " (" + str (temp_actual_num) + ") / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / Lista temps: " + str(temp_lista) + " / Bucle: " + str(temp_bucle) + " / DATA: " + data) temp_actual = scrapertools.find_single_match(data, patron_next) #url de temporada siguiente data = '' continue #volvemos a leer página con la url de la siguiente #Comprobamos si se ha saltado una Temporada if temp_advance == "back": #Avanza marcha atrás? temp_num_alt = int(scrapertools.find_single_match(temp_actual, patron_actual_num)) #nuevo num. Temp. if temp_num_alt < temp_actual_num - 1: #Hay un salto a la Temp. anterior, o más? temp_next_alt = scrapertools.find_single_match(data, patron_next) #url de temporada siguiente temp_num_alt = int(scrapertools.find_single_match(temp_next_alt, patron_actual_num)) #Localizamos la Temp. siguiente y nos aseguramos que no está procesada if temp_num_alt <= temp_actual_num - 1 and temp_num_alt not in temp_lista: temp_actual_alt = temp_next_alt #url actual de la temporada = url de la siguiente temp_previous_alt = temp_actual #url temporada anterior = url de la actual anterior logger.error("ERROR 06: EPISODIOS: Se ha saltado una Temporda: Actual: " + temp_actual + " / Actual ALT: " + temp_actual_alt + " / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / Bucle: " + str(temp_bucle)) temp_actual = temp_actual_alt #url actual de la temporada = url de la siguiente temp_bucle += 1 if temp_bucle > 5: #Evitamos loops infinitos logger.error("ERROR 05: EPISODIOS: Los links entre temporadas están rotos y se está metiendo en un loop: " + temp_actual + " (" + str (temp_actual_num) + ") / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / Lista temps: " + str(temp_lista) + " / DATA: " + data) data = '' itemlist.append(item.clone(action='', title=item.channel + ': ERROR 05: EPISODIOS. Los links entre temporadas están rotos y se está metiendo en un loop. Reportar error con log')) return itemlist #Algo no funciona con los links, pintamos lo que tenemos data = '' continue #volvemos a leer página con la url de la siguiente #Comprobamos si se ha saltado una Temporada if temp_advance == "forw": #Avanza marcha adelante? temp_num_alt = int(scrapertools.find_single_match(temp_actual, patron_actual_num)) #nuevo num. Temp. if temp_num_alt > temp_actual_num + 1: #Hay un salto a la Temp. siguiente, o más? temp_previous_alt = scrapertools.find_single_match(data, patron_previous) #url de temporada anterior temp_num_alt = int(scrapertools.find_single_match(temp_previous_alt, patron_actual_num)) #Localizamos la Temp. anterior y nos aseguramos que no está procesada if temp_num_alt >= temp_actual_num + 1 and temp_num_alt not in temp_lista: temp_actual_alt = temp_previous_alt #url actual de la temporada = url de la anterior temp_next_alt = temp_actual #url temporada siguiente = url de la actual anterior logger.error("ERROR 06: EPISODIOS: Se ha saltado una Temporda: Actual: " + temp_actual + " / Actual ALT: " + temp_actual_alt + " / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / Bucle: " + str(temp_bucle)) temp_actual = temp_actual_alt #url actual de la temporada = url de la siguiente temp_bucle += 1 if temp_bucle > 5: #Evitamos loops infinitos logger.error("ERROR 05: EPISODIOS: Los links entre temporadas están rotos y se está metiendo en un loop: " + temp_actual + " (" + str (temp_actual_num) + ") / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / Lista temps: " + str(temp_lista) + " / DATA: " + data) data = '' itemlist.append(item.clone(action='', title=item.channel + ': ERROR 05: EPISODIOS. Los links entre temporadas están rotos y se está metiendo en un loop. Reportar error con log')) return itemlist #Algo no funciona con los links, pintamos lo que tenemos data = '' continue #volvemos a leer página con la url de la siguiente temp_actual_num = scrapertools.find_single_match(temp_actual, patron_actual_num) #num de la temporada actual temp_actual_num = int(temp_actual_num) temp_previous = scrapertools.find_single_match(data, patron_previous) #url de temporada anterior if temp_advance == 'forw': #si estamos con temporadas previas, dejamos la url de la siguiente temporada inicial temp_next = scrapertools.find_single_match(data, patron_next) #url de temporada siguiente temp_previous = '' #ya están procesadas las temporadas previas, no volvemos a hacerlo except: #Error al leer o procesar la página actual? Salimos logger.error("ERROR 01: EPISODIOS:. La Web no responde o la URL es erronea: " + temp_actual + " (" + str (temp_actual_num) + ") / Previa: " + temp_previous + " / o Siguiente: " + temp_next + " / Avance: " + temp_advance + " / DATA: " + data) itemlist.append(item.clone(action='', title=item.channel.capitalize() + ': ERROR 01: EPISODIOS:. La Web no responde o la URL es erronea. Si la Web está activa, reportar el error con el log')) return itemlist #si no hay más datos, algo no funciona, pintamos lo que tenemos if item.contentType == "season": temp_advance = '' #Es la única temporada if temp_next and item.library_playcounts: #Permitimos en actualización de Videoteca añadir nuevas temporadas temp_advance = 'forw' #Si hay nueva temporada, pasamos a esa como actual temp_previous = '' #lo limpiamos, por control item.url = temp_actual #Salvamos la temporada actual como primera para la Videoteca contentSeason = temp_actual_num #Salvamos el núm de temporada elif temp_previous: #Para Series, vamos retrocediendo y procesando temporadas if temp_advance == 'back': if not modo_ultima_temp: #Actualiza la Serie entera en la Videoteca? item.url = temp_previous #Salvamos la temporada previa como primera para la Videoteca contentSeason = temp_previous_num #Salvamos en núm de temporada temp_advance = 'back' #hay temporadas anteriores, iremos marcha atrás procesándolas elif temp_next: if temp_advance == 'back': #Esta es la primera temporada disponible if not modo_ultima_temp: #Actualiza la Serie entera en la Videoteca? item.url = temp_actual #Salvamos la temporada actual como primera para la Videoteca contentSeason = temp_actual_num #Salvamos en núm de temporada else: if modo_ultima_temp and not item.library_playcounts: #Actualiza la última Temporada en la Videoteca? item.url = temp_next #Salvamos la temporada siguiente como primera para la Videoteca temp_advance = 'forw' #No hay temporadas anteriores, pero sí posteriores. Las procesamos else: temp_advance = '' #lo limpiamos, por control data = unicode(data, "utf-8", errors="replace").encode("utf-8") data = scrapertools.find_single_match(data, 'div id="Tokyo" [^>]+>(.*?)