More Py3 changes

Tikipeter · web-flow · commit 4635807ef41e · 2020-06-27T03:28:33.000+10:00
diff --git a/lib/openscrapers/modules/cache.py b/lib/openscrapers/modules/cache.py
@@ -32,7 +32,11 @@ def get(function, duration, *args):
 		cache_result = cache_get(key)
 		if cache_result:
 			if _is_cache_valid(cache_result['date'], duration):
-				return ast.literal_eval(cache_result['value'].encode('utf-8'))
+				try:
+					result = ast.literal_eval(cache_result['value'].encode('utf-8'))
+				except:
+					result = ast.literal_eval(cache_result['value'])
+				return result
 
 		fresh_result = repr(function(*args))
 		if not fresh_result:
@@ -42,7 +46,11 @@ def get(function, duration, *args):
 			return None
 
 		cache_insert(key, fresh_result)
-		return ast.literal_eval(fresh_result.encode('utf-8'))
+		try:
+			result = ast.literal_eval(fresh_result.encode('utf-8'))
+		except:
+			result = ast.literal_eval(fresh_result)
+		return result
 	except:
 		log_utils.error()
 		return None
diff --git a/lib/openscrapers/modules/client.py b/lib/openscrapers/modules/client.py
@@ -43,12 +43,17 @@
 except ImportError:
 	from urllib.parse import urlencode, quote_plus
 
+try:
+    # Python 2 forward compatibility
+    range = xrange
+except NameError:
+    pass
+
 from openscrapers.modules import cache
 from openscrapers.modules import dom_parser
 from openscrapers.modules import log_utils
 from openscrapers.modules import workers
 
-
 def request(url, close=True, redirect=True, error=False, proxy=None, post=None, headers=None, mobile=False, XHR=False,
 			limit=None, referer=None, cookie=None, compression=True, output='', timeout='30', ignoreSsl=False,
 			flare=True, ignoreErrors=None):
@@ -135,7 +140,9 @@ def http_response(self, request, response):
 
 		if isinstance(post, dict):
 			# Gets rid of the error: 'ascii' codec can't decode byte 0xd0 in position 0: ordinal not in range(128)
-			for key, value in post.iteritems():
+			try: iter_items = post.iteritems()
+			except: iter_items = post.items()
+			for key, value in iter_items:
 				try:
 					post[key] = value.encode('utf-8')
 				except:
@@ -391,7 +398,10 @@ def _get_result(response, limit=None):
 
 def parseDOM(html, name='', attrs=None, ret=False):
 	if attrs:
-		attrs = dict((key, re.compile(value + ('$' if value else ''))) for key, value in attrs.iteritems())
+		try:
+			attrs = dict((key, re.compile(value + ('$' if value else ''))) for key, value in attrs.iteritems())
+		except:
+			attrs = dict((key, re.compile(value + ('$' if value else ''))) for key, value in attrs.items())
 	results = dom_parser.parse_dom(html, name, attrs, ret)
 
 	if ret:
@@ -417,7 +427,7 @@ def _replaceHTMLCodes(txt):
 
 def randomagent():
 	BR_VERS = [
-		['%s.0' % i for i in xrange(18, 50)],
+		['%s.0' % i for i in range(18, 50)],
 		['37.0.2062.103', '37.0.2062.120', '37.0.2062.124', '38.0.2125.101', '38.0.2125.104', '38.0.2125.111',
 		 '39.0.2171.71', '39.0.2171.95', '39.0.2171.99', '40.0.2214.93', '40.0.2214.111', '40.0.2214.115',
 		 '42.0.2311.90', '42.0.2311.135', '42.0.2311.152', '43.0.2357.81', '43.0.2357.124', '44.0.2403.155',
@@ -449,11 +459,11 @@ def __init__(self):
 	def get(self, netloc, ua, timeout):
 		threads = []
 
-		for i in range(0, 15):
+		for i in list(range(0, 15)):
 			threads.append(workers.Thread(self.get_cookie, netloc, ua, timeout))
 		[i.start() for i in threads]
 
-		for i in range(0, 30):
+		for i in list(range(0, 30)):
 			if self.cookie is not None:
 				return self.cookie
 			time.sleep(1)
diff --git a/lib/openscrapers/modules/dom_parser.py b/lib/openscrapers/modules/dom_parser.py
@@ -54,8 +54,11 @@ def __get_dom_elements(item, name, attrs):
 		this_list = re.findall(pattern, item, re.M | re.S | re.I)
 	else:
 		last_list = None
-
-		for key, value in attrs.iteritems():
+		try:
+			iter_items = attrs.iteritems()
+		except:
+			iter_items = attrs.items()
+		for key, value in iter_items:
 			value_is_regex = isinstance(value, re_type)
 			value_is_str = isinstance(value, basestring)
 			pattern = '''(<{tag}[^>]*\s{key}=(?P<delim>['"])(.*?)(?P=delim)[^>]*>)'''.format(tag=name, key=key)
@@ -105,10 +108,12 @@ def parse_dom(html, name='', attrs=None, req=False, exclude_comments=False):
 	if attrs is None:
 		attrs = {}
 	name = name.strip()
-
-	if isinstance(html, unicode) or isinstance(html, DomMatch):
+	try:
+		if isinstance(html, unicode):
+			html = [html]
+	except: pass
+	if isinstance(html, DomMatch):
 		html = [html]
-
 	elif isinstance(html, str):
 		try:
 			html = [html.decode("utf-8")]  # Replace with chardet thingy
@@ -117,9 +122,10 @@ def parse_dom(html, name='', attrs=None, req=False, exclude_comments=False):
 				html = [html.decode("utf-8", "replace")]
 			except:
 				html = [html]
+
 	elif not isinstance(html, list):
 		return ''
-
+	
 	if not name:
 		return ''
 
diff --git a/lib/openscrapers/modules/getSum.py b/lib/openscrapers/modules/getSum.py
@@ -8,6 +8,7 @@
 except ImportError:
 	from html.parser import HTMLParser
 
+from openscrapers.modules.utils import byteify
 from openscrapers.modules import log_utils
 
 headers = {
@@ -54,7 +55,7 @@ def findSum(self, text, type=None):
 				links = re.compile(self._magnet_regex).findall(text)
 				if links:
 					for link in links:
-						link = str(replaceHTMLCodes(link).encode('utf-8').split('&tr')[0])
+						link = str(byteify(replaceHTMLCodes(link)).split('&tr')[0])
 						link = "magnet:" + link if not link.startswith('magnet') else link
 						if link in self.links:
 							continue
@@ -177,7 +178,7 @@ def get_video(text):
 	match = re.compile(pattern).findall(text)
 	links = []
 	for url in match:
-		links.append(url.encode('utf-8'))
+		links.append(byteify(url))
 	return links
 
 
diff --git a/lib/openscrapers/modules/jsunfuck.py b/lib/openscrapers/modules/jsunfuck.py
@@ -220,13 +220,19 @@ def cfunfuck(fuckedup):
 	fuck = re.findall(r's,t,o,p,b,r,e,a,k,i,n,g,f,\s*(\w+=).*?:\+?\(?(.*?)\)?\}', fuckedup)
 	fucks = re.findall(r'(\w+)\.\w+([\+\-\*\/]=)\+?\(?(.*?)\)?;', fuckedup)
 	endunfuck = fuck[0][0].split('=')[0]
-	unfuck = JSUnfuck(fuck[0][1]).decode()
+	try:
+		unfuck = JSUnfuck(fuck[0][1]).decode()
+	except:
+		unfuck = JSUnfuck(fuck[0][1])
 	unfuck = re.sub(r'[\(\)]', '', unfuck)
 	unfuck = fuck[0][0] + unfuck
 	exec (unfuck)
 
 	for fucker in fucks:
-		unfucker = JSUnfuck(fucker[2]).decode()
+		try:
+			unfucker = JSUnfuck(fucker[2]).decode()
+		except:
+			unfucker = JSUnfuck(fucker[2])
 		unfucker = re.sub(r'[\(\)]', '', unfucker)
 		unfucker = fucker[0] + fucker[1] + unfucker
 		exec (unfucker)
@@ -238,7 +244,10 @@ def main():
 	with open(sys.argv[1]) as f:
 		start_js = f.read()
 
-	print JSUnfuck(start_js).decode()
+	try:
+		print JSUnfuck(start_js).decode()
+	except:
+		print JSUnfuck(start_js)
 
 
 if __name__ == '__main__':
diff --git a/lib/openscrapers/modules/log_utils.py b/lib/openscrapers/modules/log_utils.py
@@ -35,8 +35,8 @@ def log(msg, caller=None, level=LOGNOTICE):
 	debug_enabled = control.setting('debug.enabled')
 	debug_log = control.setting('debug.location')
 
-	print DEBUGPREFIX + ' Debug Enabled?: ' + str(debug_enabled)
-	print DEBUGPREFIX + ' Debug Log?: ' + str(debug_log)
+	print( DEBUGPREFIX + ' Debug Enabled?: ' + str(debug_enabled))
+	print( DEBUGPREFIX + ' Debug Log?: ' + str(debug_log))
 
 	if control.setting('debug.enabled') != 'true':
 		return
@@ -50,9 +50,11 @@ def log(msg, caller=None, level=LOGNOTICE):
 
 		if caller is not None and level == LOGERROR:
 			msg = 'From func name: %s.%s() Line # :%s\n                       msg : %s'%(caller[0], caller[1], caller[2], msg)
-
-		if isinstance(msg, unicode):
-			msg = '%s (ENCODED)' % (msg.encode('utf-8'))
+		try:
+			if isinstance(msg, unicode):
+				msg = '%s (ENCODED)' % (msg.encode('utf-8'))
+		except:
+			pass
 
 		if not control.setting('debug.location') == '0':
 			log_file = os.path.join(LOGPATH, 'openscrapers.log')
diff --git a/lib/openscrapers/modules/regex.py b/lib/openscrapers/modules/regex.py
@@ -23,13 +23,14 @@
 import xbmc
 import xbmcaddon
 
-profile = functions_dir = xbmc.translatePath(xbmcaddon.Addon().getAddonInfo('profile').decode('utf-8'))
+profile = functions_dir = xbmc.translatePath(xbmcaddon.Addon().getAddonInfo('profile'))
 
 try:
 	from sqlite3 import dbapi2 as database
 except:
 	from pysqlite2 import dbapi2 as database
 
+from openscrapers.modules.utils import byteify
 from openscrapers.modules import client
 from openscrapers.modules import control
 
@@ -93,7 +94,7 @@ def resolve(regex):
 
 		url = regex.split('<regex>', 1)[0].strip()
 		url = client.replaceHTMLCodes(url)
-		url = url.encode('utf-8')
+		url = byteify(url)
 
 		r = getRegexParsed(regexs, url)
 
diff --git a/lib/openscrapers/modules/source_utils.py b/lib/openscrapers/modules/source_utils.py
@@ -273,7 +273,10 @@ def strip_domain(url):
 		if url.lower().startswith('http') or url.startswith('/'):
 			url = re.findall('(?://.+?|)(/.+)', url)[0]
 		url = client.replaceHTMLCodes(url)
-		url = url.encode('utf-8')
+		try:
+			url = url.encode('utf-8')
+		except:
+			pass
 		return url
 	except:
 		log_utils.error()
diff --git a/lib/openscrapers/modules/workers.py b/lib/openscrapers/modules/workers.py
@@ -5,12 +5,8 @@
 
 import threading
 
-
 class Thread(threading.Thread):
 	def __init__(self, target, *args):
 		self._target = target
 		self._args = args
-		threading.Thread.__init__(self)
-
-	def run(self):
-		self._target(*self._args)
+		threading.Thread.__init__(self, target=self._target, args=self._args)