[mod] restore btdigg engine as btdig.com (#1515)

author: volth <volth@webmaster.ms> 2019-07-25 06:40:48 +0000
committer: Alexandre Flament <alex@al-f.net> 2019-07-25 08:40:48 +0200
commit: eb182df1324f84d6864f324551fe6be7c535e451 (patch)
tree: 90df3f071b6c8ee7ecbd3d6d8a6e201b3583ca47 /searx/engines
parent: 3b1122c5fa1bbac49f6e0eb9ff69efb8dca996ea (diff)
download: searxng-eb182df1324f84d6864f324551fe6be7c535e451.tar.gz
searxng-eb182df1324f84d6864f324551fe6be7c535e451.zip
1 files changed, 16 insertions, 23 deletions
diff --git a/searx/engines/btdigg.py b/searx/engines/btdigg.py
index 40438673f..82eedc24b 100644
--- a/searx/engines/btdigg.py
+++ b/searx/engines/btdigg.py
@@ -1,7 +1,7 @@
 """
  BTDigg (Videos, Music, Files)
 
- @website     https://btdigg.org
+ @website     https://btdig.com
  @provide-api yes (on demand)
 
  @using-api   no
@@ -21,7 +21,7 @@ categories = ['videos', 'music', 'files']
 paging = True
 
 # search-url
-url = 'https://btdigg.org'
+url = 'https://btdig.com'
 search_url = url + '/search?q={search_term}&p={pageno}'
 
 
@@ -39,7 +39,7 @@ def response(resp):
 
     dom = html.fromstring(resp.text)
 
-    search_res = dom.xpath('//div[@id="search_res"]/table/tr')
+    search_res = dom.xpath('//div[@class="one_result"]')
 
     # return empty array if nothing is found
     if not search_res:
@@ -47,46 +47,39 @@ def response(resp):
 
     # parse results
     for result in search_res:
-        link = result.xpath('.//td[@class="torrent_name"]//a')[0]
+        link = result.xpath('.//div[@class="torrent_name"]//a')[0]
         href = urljoin(url, link.attrib.get('href'))
         title = extract_text(link)
-        content = extract_text(result.xpath('.//pre[@class="snippet"]')[0])
-        content = "<br />".join(content.split("\n"))
 
-        filesize = result.xpath('.//span[@class="attr_val"]/text()')[0].split()[0]
-        filesize_multiplier = result.xpath('.//span[@class="attr_val"]/text()')[0].split()[1]
-        files = result.xpath('.//span[@class="attr_val"]/text()')[1]
-        seed = result.xpath('.//span[@class="attr_val"]/text()')[2]
+        excerpt = result.xpath('.//div[@class="torrent_excerpt"]')[0]
+        content = html.tostring(excerpt, encoding='unicode', method='text', with_tail=False)
+        # it is better to emit <br/> instead of |, but html tags are verboten
+        content = content.strip().replace('\n', ' | ')
+        content = ' '.join(content.split())
 
-        # convert seed to int if possible
-        if seed.isdigit():
-            seed = int(seed)
-        else:
-            seed = 0
-
-        leech = 0
+        filesize = result.xpath('.//span[@class="torrent_size"]/text()')[0].split()[0]
+        filesize_multiplier = result.xpath('.//span[@class="torrent_size"]/text()')[0].split()[1]
+        files = (result.xpath('.//span[@class="torrent_files"]/text()') or ['1'])[0]
 
         # convert filesize to byte if possible
         filesize = get_torrent_size(filesize, filesize_multiplier)
 
         # convert files to int if possible
-        if files.isdigit():
+        try:
             files = int(files)
-        else:
+        except:
             files = None
 
-        magnetlink = result.xpath('.//td[@class="ttth"]//a')[0].attrib['href']
+        magnetlink = result.xpath('.//div[@class="torrent_magnet"]//a')[0].attrib['href']
 
         # append result
         results.append({'url': href,
                         'title': title,
                         'content': content,
-                        'seed': seed,
-                        'leech': leech,
                         'filesize': filesize,
                         'files': files,
                         'magnetlink': magnetlink,
                         'template': 'torrent.html'})
 
     # return results sorted by seeder
-    return sorted(results, key=itemgetter('seed'), reverse=True)
+    return results
author	volth <volth@webmaster.ms>	2019-07-25 06:40:48 +0000
committer	Alexandre Flament <alex@al-f.net>	2019-07-25 08:40:48 +0200
commit	eb182df1324f84d6864f324551fe6be7c535e451 (patch)
tree	90df3f071b6c8ee7ecbd3d6d8a6e201b3583ca47 /searx/engines
parent	3b1122c5fa1bbac49f6e0eb9ff69efb8dca996ea (diff)
download	searxng-eb182df1324f84d6864f324551fe6be7c535e451.tar.gz searxng-eb182df1324f84d6864f324551fe6be7c535e451.zip