animeid: fix

2018-01-26 16:50:51 -05:00
parent 95c3f619af
commit e24311b20e
1 changed files with 62 additions and 163 deletions
@@ -4,25 +4,25 @@ import re
 import urlparse
 from core import httptools
 from core import jsontools
 from core import scrapertools
 from core import servertools
 from core.item import Item
 from platformcode import config, logger
-CHANNEL_HOST = "http://animeid.tv/"
+CHANNEL_HOST = "https://www.animeid.tv/"
 def mainlist(item):
    logger.info()
    itemlist = list()
    itemlist.append(
-        Item(channel=item.channel, action="novedades_series", title="Últimas series", url="http://www.animeid.tv/"))
+        Item(channel=item.channel, action="novedades_series", title="Últimas series", url=CHANNEL_HOST))
    itemlist.append(Item(channel=item.channel, action="novedades_episodios", title="Últimos episodios",
-                         url="http://www.animeid.tv/", viewmode="movie_with_plot"))
+                         url=CHANNEL_HOST, viewmode="movie_with_plot"))
    itemlist.append(
-        Item(channel=item.channel, action="generos", title="Listado por genero", url="http://www.animeid.tv/"))
+        Item(channel=item.channel, action="generos", title="Listado por genero", url=CHANNEL_HOST))
    itemlist.append(
-        Item(channel=item.channel, action="letras", title="Listado alfabetico", url="http://www.animeid.tv/"))
+        Item(channel=item.channel, action="letras", title="Listado alfabetico", url=CHANNEL_HOST))
    itemlist.append(Item(channel=item.channel, action="search", title="Buscar..."))
    return itemlist
@@ -33,7 +33,7 @@ def newest(categoria):
    item = Item()
    try:
        if categoria == 'anime':
-            item.url = "http://animeid.tv/"
+            item.url = CHANNEL_HOST
            itemlist = novedades_episodios(item)
    # Se captura la excepción, para no interrumpir al canal novedades si un canal falla
    except:
@@ -50,19 +50,17 @@ def search(item, texto):
    itemlist = []
    if item.url == "":
-        item.url = "http://www.animeid.tv/ajax/search?q="
+        item.url = CHANNEL_HOST + "ajax/search?q="
    texto = texto.replace(" ", "+")
    item.url = item.url + texto
    try:
        headers = []
        headers.append(
            ["User-Agent", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:19.0) Gecko/20100101 Firefox/19.0"])
-        headers.append(["Referer", "http://www.animeid.tv/"])
+        headers.append(["Referer", CHANNEL_HOST])
        headers.append(["X-Requested-With", "XMLHttpRequest"])
        data = scrapertools.cache_page(item.url, headers=headers)
        data = data.replace("\\", "")
        logger.debug("data=" + data)
        patron = '{"id":"([^"]+)","text":"([^"]+)","date":"[^"]*","image":"([^"]+)","link":"([^"]+)"}'
        matches = re.compile(patron, re.DOTALL).findall(data)
@@ -71,8 +69,6 @@ def search(item, texto):
            url = urlparse.urljoin(item.url, scrapedurl)
            thumbnail = scrapedthumbnail
            plot = ""
            logger.debug("title=[" + title + "], url=[" + url + "], thumbnail=[" + thumbnail + "]")
            itemlist.append(
                Item(channel=item.channel, action="episodios", title=title, url=url, thumbnail=thumbnail, plot=plot,
                     show=title, viewmode="movie_with_plot"))
@@ -89,240 +85,146 @@ def search(item, texto):
 def novedades_series(item):
    logger.info()
    # Descarga la pagina
    data = httptools.downloadpage(item.url).data
    data = scrapertools.get_match(data, '<section class="series">(.*?)</section>')
    patronvideos = '<li><a href="([^"]+)"><span class="tipo\d+">([^<]+)</span><strong>([^<]+)</strong>'
    matches = re.compile(patronvideos, re.DOTALL).findall(data)
    itemlist = []
-
+    data = httptools.downloadpage(item.url).data
    data = scrapertools.find_single_match(data, '<section class="series">(.*?)</section>')
    patronvideos = '(?s)<a href="([^"]+)">.*?tipo\d+">([^<]+)</span>.*?<strong>([^<]+)</strong>'
    matches = re.compile(patronvideos, re.DOTALL).findall(data)
    for url, tipo, title in matches:
        scrapedtitle = title + " (" + tipo + ")"
        scrapedurl = urlparse.urljoin(item.url, url)
        scrapedthumbnail = ""
        scrapedplot = ""
        logger.debug("title=[" + scrapedtitle + "], url=[" + scrapedurl + "], thumbnail=[" + scrapedthumbnail + "]")
        itemlist.append(Item(channel=item.channel, action="episodios", title=scrapedtitle, url=scrapedurl,
-                             thumbnail=scrapedthumbnail, plot=scrapedplot, show=title, viewmode="movie_with_plot"))
+                             show=title, viewmode="movie_with_plot"))
    return itemlist
 def novedades_episodios(item):
    logger.info()
    # Descarga la pagina
    # <article> <a href="/ver/uchuu-kyoudai-35"> <header>Uchuu Kyoudai #35</header> <figure><img src="http://static.animeid.com/art/uchuu-kyoudai/normal/b4934a1d.jpg" class="cover" alt="Uchuu Kyoudai" width="250" height="140" /></figure><div class="mask"></div> <aside><span class="p"><strong>Reproducciones: </strong>306</span> <span class="f"><strong>Favoritos: </strong>0</span></aside> </a> <p>Una noche en el año 2006, cuando eran jovenes, los dos hermanos Mutta (el mayor) y Hibito (el menor) vieron un OVNI que hiba en dirección hacia la luna. Esa misma noche decidieron que ellos se convertirian en astronautas y irian al espacio exterior. En el año 2050, Hibito se ha convertido en astronauta y que ademas está incluido en una misión que irá a la luna. En cambio Mutta siguió una carrera mas tradicional, y terminó trabajando en una compañia de fabricación de automoviles. Sin embargo, Mutta termina arruinando su carrera por ciertos problemas que tiene con su jefe. Ahora bien, no sólo perdió su trabajo si no que fue incluido en la lista negra de la industria laboral. Pueda ser que esta sea su unica oportunidad que tenga Mutta de volver a perseguir su sueño de la infancia y convertirse en astronauta, al igual que su perqueño hermano Hibito.</p> </article>
    # <img pagespeed_high_res_src="
    data = httptools.downloadpage(item.url).data
-    data = scrapertools.get_match(data, '<section class="lastcap">(.*?)</section>')
+    data = scrapertools.find_single_match(data, '<section class="lastcap">(.*?)</section>')
-
+    patronvideos  = '(?s)<a href="([^"]+)">[^<]+<header>([^<]+).*?src="([^"]+)"[\s\S]+?<p>(.+?)</p>'
    patronvideos = '<a href="([^"]+)">[^<]+<header>([^<]+)</header>[^<]+<figure><img[^>]+src="([^"]+)"[\s\S]+?<p>(.+?)</p>'
    matches = re.compile(patronvideos, re.DOTALL).findall(data)
    itemlist = []
    for url, title, thumbnail, plot in matches:
        scrapedtitle = scrapertools.entityunescape(title)
        scrapedurl = urlparse.urljoin(item.url, url)
        scrapedthumbnail = thumbnail
        scrapedplot = plot
-        logger.debug("title=[" + scrapedtitle + "], url=[" + scrapedurl + "], thumbnail=[" + scrapedthumbnail + "]")
+        episodio = scrapertools.find_single_match(scrapedtitle, '\s+#(.*?)$')
        episodio = scrapertools.get_match(scrapedtitle, '\s+#(.*?)$')
        contentTitle = scrapedtitle.replace('#' + episodio, '')
        itemlist.append(Item(channel=item.channel, action="findvideos", title=scrapedtitle, url=scrapedurl,
                             thumbnail=scrapedthumbnail, plot=scrapedplot, contentSeason=1, contentTitle=contentTitle))
    return itemlist
 def generos(item):
    logger.info()
    # Descarga la pagina
    data = httptools.downloadpage(item.url).data
    data = scrapertools.get_match(data, '<div class="generos">(.*?)</div>')
    patronvideos = '<li> <a href="([^"]+)">([^<]+)</a>'
    matches = re.compile(patronvideos, re.DOTALL).findall(data)
    itemlist = []
-
+    data = httptools.downloadpage(item.url).data
    data = scrapertools.find_single_match(data, '<div class="generos">(.*?)</div>')
    patronvideos = '(?s)<a href="([^"]+)">([^<]+)</a>'
    matches = re.compile(patronvideos, re.DOTALL).findall(data)
    for url, title in matches:
        scrapedtitle = title
        scrapedurl = urlparse.urljoin(item.url, url)
        scrapedthumbnail = ""
        scrapedplot = ""
        logger.debug("title=[" + scrapedtitle + "], url=[" + scrapedurl + "], thumbnail=[" + scrapedthumbnail + "]")
        itemlist.append(
            Item(channel=item.channel, action="series", title=scrapedtitle, url=scrapedurl, thumbnail=scrapedthumbnail,
                 plot=scrapedplot, show=title, viewmode="movie_with_plot"))
    return itemlist
 def letras(item):
    logger.info()
    # Descarga la pagina
    data = httptools.downloadpage(item.url).data
-    data = scrapertools.get_match(data, '<ul id="letras">(.*?)</ul>')
+    data = scrapertools.find_single_match(data, '<ul id="letras">(.*?)</ul>')
    patronvideos = '<li> <a href="([^"]+)">([^<]+)</a>'
    matches = re.compile(patronvideos, re.DOTALL).findall(data)
    itemlist = []
    for url, title in matches:
        scrapedtitle = title
        scrapedurl = urlparse.urljoin(item.url, url)
        scrapedthumbnail = ""
        scrapedplot = ""
        logger.debug("title=[" + scrapedtitle + "], url=[" + scrapedurl + "], thumbnail=[" + scrapedthumbnail + "]")
        itemlist.append(
-            Item(channel=item.channel, action="series", title=scrapedtitle, url=scrapedurl, thumbnail=scrapedthumbnail,
+            Item(channel=item.channel, action="series", title=scrapedtitle, url=scrapedurl,
-                 plot=scrapedplot, show=title, viewmode="movie_with_plot"))
+                 show=title, viewmode="movie_with_plot"))
    return itemlist
 def series(item):
    logger.info()
    # Descarga la pagina
    data = httptools.downloadpage(item.url).data
    logger.debug("datito %s" % data)
    '''
    <article class="item"> 
        <a href="/aoi-sekai-no-chuushin-de">
            <header>Aoi Sekai no Chuushin de</header> 
            <figure>
                <img src="http://static.animeid.com/art/aoi-sekai-no-chuushin-de/cover/0077cb45.jpg" width="116" 
                    height="164" />
            </figure>
            <div class="mask"></div>
        </a> 
        <p>
            El Reino de Segua ha ido perdiendo la guerra contra el Imperio de Ninterdo pero la situación ha cambiado 
            con la aparición de un chico llamado Gear. Todos los personajes son parodias de protas de videojuegos de 
            Nintendo y Sega respectivamente, como lo son Sonic the Hedgehog, Super Mario Bros., The Legend of Zelda, 
            etc.
        </p>
    </article>
    '''
    patron = '<article class="item"[^<]+'
    patron += '<a href="([^"]+)"[^<]+<header>([^<]+)</header[^<]+'
    patron += '<figure><img[\sa-z_]+src="([^"]+)"[^<]+</figure><div class="mask"></div></a>[^<]+<p>(.*?)<'
    matches = re.compile(patron, re.DOTALL).findall(data)
    itemlist = []
-
+    data = httptools.downloadpage(item.url).data
    patron = '(?s)<article class="item"[^<]+'
    patron += '<a href="([^"]+)"[^<]+<header>([^<]+)</header[^<]+.*?'
    patron += 'src="([^"]+)".*?<p>(.*?)<'
    matches = scrapertools.find_multiple_matches(data, patron)
    for url, title, thumbnail, plot in matches:
        scrapedtitle = title
        scrapedurl = urlparse.urljoin(item.url, url)
        scrapedthumbnail = thumbnail
        scrapedplot = plot
        logger.debug("title=[" + scrapedtitle + "], url=[" + scrapedurl + "], thumbnail=[" + scrapedthumbnail + "]")
        itemlist.append(Item(channel=item.channel, action="episodios", title=scrapedtitle, url=scrapedurl,
                             thumbnail=scrapedthumbnail, plot=scrapedplot, show=scrapedtitle,
                             viewmode="movie_with_plot"))
    itemlist = sorted(itemlist, key=lambda it: it.title)
    try:
-        page_url = scrapertools.get_match(data, '<li><a href="([^"]+)">&gt;</a></li>')
+        page_url = scrapertools.find_single_match(data, '<li><a href="([^"]+)">&gt;</a></li>')
        itemlist.append(Item(channel=item.channel, action="series", title=">> Página siguiente",
                             url=urlparse.urljoin(item.url, page_url), viewmode="movie_with_plot", thumbnail="",
                             plot=""))
    except:
        pass
    return itemlist
 def episodios(item, final=True):
    logger.info()
    # Descarga la pagina
    body = httptools.downloadpage(item.url).data
    try:
        scrapedplot = scrapertools.get_match(body, '<meta name="description" content="([^"]+)"')
    except:
        pass
    try:
        scrapedthumbnail = scrapertools.get_match(body, '<link rel="image_src" href="([^"]+)"')
    except:
        pass
    data = scrapertools.get_match(body, '<ul id="listado">(.*?)</ul>')
    patron = '<li><a href="([^"]+)">(.*?)</a></li>'
    matches = re.compile(patron, re.DOTALL).findall(data)
    itemlist = []
-
+    data = httptools.downloadpage(item.url).data
-    for url, title in matches:
+    data_id = scrapertools.find_single_match(data, 'data-id="([^"]+)')
-        scrapedtitle = scrapertools.htmlclean(title)
+    CHANNEL_HEADERS = [
-
+    ["Host", "m.animeid.tv"],
-        try:
+    ["X-Requested-With", "XMLHttpRequest"]
-            episodio = scrapertools.get_match(scrapedtitle, "Capítulo\s+(\d+)")
+    ]
-            titulo_limpio = re.compile("Capítulo\s+(\d+)\s+", re.DOTALL).sub("", scrapedtitle)
+    page = 0
-            if len(episodio) == 1:
+    while True:
-                scrapedtitle = "1x0" + episodio + " - " + titulo_limpio
+        page += 1
-            else:
+        u = "https://m.animeid.tv/ajax/caps?id=%s&ord=DESC&pag=%s" %(data_id, page)
-                scrapedtitle = "1x" + episodio + " - " + titulo_limpio
+        data = httptools.downloadpage(u, headers=CHANNEL_HEADERS).data
-        except:
+        # Cuando ya no hay datos devuelve: "list":[]
-            pass
+        if '"list":[]' in data:
-
+            break
-        scrapedurl = urlparse.urljoin(item.url, url)
+        dict_data = jsontools.load(data)
-        # scrapedthumbnail = ""
+        list = dict_data['list']
-        # scrapedplot = ""
+        for dict in list:
-        logger.debug("title=[" + scrapedtitle + "], url=[" + scrapedurl + "], thumbnail=[" + scrapedthumbnail + "]")
+             itemlist.append(Item(action = "findvideos",
-
+                                  channel = item.channel,
-        itemlist.append(Item(channel=item.channel, action="findvideos", title=scrapedtitle, url=scrapedurl,
+                                  title = "1x" + dict["numero"] + " - " + dict["date"],
-                             thumbnail=scrapedthumbnail, plot=scrapedplot, show=item.show))
+                                  url = CHANNEL_HOST + dict['href'],
-
+                                  thumbnail = item.thumbnail,
-    try:
+                                  show = item.show,
-        next_page = scrapertools.get_match(body, '<a href="([^"]+)">\&gt\;</a>')
+                                  viewmode = "movie_with_plot"
-        next_page = urlparse.urljoin(item.url, next_page)
+                                  ))
-        item2 = Item(channel=item.channel, action="episodios", title=item.title, url=next_page,
+    if config.get_videolibrary_support():
                     thumbnail=item.thumbnail, plot=item.plot, show=item.show, viewmode="movie_with_plot")
        itemlist.extend(episodios(item2, final=False))
    except:
        import traceback
        logger.error(traceback.format_exc())
    if final and config.get_videolibrary_support():
        itemlist.append(Item(channel=item.channel, title="Añadir esta serie a la videoteca", url=item.url,
                             action="add_serie_to_library", extra="episodios", show=item.show))
        itemlist.append(Item(channel=item.channel, title="Descargar todos los episodios de la serie", url=item.url,
                             action="download_all_episodes", extra="episodios", show=item.show))
    return itemlist
 def findvideos(item):
    logger.info()
    data = httptools.downloadpage(item.url).data
    itemlist = []
-
+    data = httptools.downloadpage(item.url).data
    url_anterior = scrapertools.find_single_match(data, '<li class="b"><a href="([^"]+)">« Capítulo anterior')
    url_siguiente = scrapertools.find_single_match(data, '<li class="b"><a href="([^"]+)">Siguiente capítulo »')
-
+    data = scrapertools.find_single_match(data, '<ul id="partes">(.*?)</ul>').decode("unicode-escape")
-    data = scrapertools.find_single_match(data, '<ul id="partes">(.*?)</ul>')
+    data = data.replace("\\/", "/").replace("%3A", ":").replace("%2F", "/")
-    data = data.replace("\\/", "/")
+    patron = '(https://www.animeid.tv/stream/[^/]+/\d+.[a-z0-9]+)'
-    data = data.replace("%3A", ":")
+    matches = scrapertools.find_multiple_matches(data, patron)
    data = data.replace("%2F", "/")
    logger.info("data=" + data)
    # http%3A%2F%2Fwww.animeid.moe%2Fstream%2F41TLmCj7_3q4BQLnfsban7%2F1440956023.mp4
    # http://www.animeid.moe/stream/41TLmCj7_3q4BQLnfsban7/1440956023.mp4
    # http://www.animeid.tv/stream/oiW0uG7yqBrg5TVM5Cm34n/1385370686.mp4
    patron = '(http://www.animeid.tv/stream/[^/]+/\d+.[a-z0-9]+)'
    matches = re.compile(patron, re.DOTALL).findall(data)
    encontrados = set()
    for url in matches:
        if url not in encontrados:
@@ -330,15 +232,12 @@ def findvideos(item):
                Item(channel=item.channel, action="play", title="[directo]", server="directo", url=url, thumbnail="",
                     plot="", show=item.show, folder=False))
            encontrados.add(url)
    from core import servertools
    itemlist.extend(servertools.find_video_items(data=data))
    for videoitem in itemlist:
        videoitem.channel = item.channel
        videoitem.action = "play"
        videoitem.folder = False
        videoitem.title = "[" + videoitem.server + "]"
    if url_anterior:
        title_anterior = url_anterior.strip("/v/").replace('-', ' ').strip('.html')
        itemlist.append(Item(channel=item.channel, action="findvideos", title="Anterior: " + title_anterior,