Python cfscrape.create_scraper函数代码示例

OGeek|极客世界-中国程序员成长平台 › 门户 › 编程› Python›Python编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

本文整理汇总了Python中resources.lib.modules.cfscrape.create_scraper函数的典型用法代码示例。如果您正苦于以下问题：Python create_scraper函数的具体用法？Python create_scraper怎么用？Python create_scraper使用的例子？那么恭喜您, 这里精选的函数代码示例或许可以为您提供帮助。

在下文中一共展示了create_scraper函数的15个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于我们的系统推荐出更棒的Python代码示例。

示例1: sources

 def sources(self, url, hostDict, hostprDict):
     try:
         sources = []
         scraper = cfscrape.create_scraper()
         r = scraper.get(url).content
         try:
             qual = re.compile('class="quality">(.+?)<').findall(r)
             print qual
             for i in qual:
                 if 'HD' in i:
                     quality = '1080p'
                 else:
                     quality = 'SD'
             match = re.compile('<iframe src="(.+?)"').findall(r)
             for url in match:
                 valid, host = source_utils.is_host_valid(url, hostDict)
                 sources.append({'source': host, 'quality': quality, 'language': 'en',
                                 'url': url, 'direct': False, 'debridonly': False})
         except Exception:
             return sources
     except Exception:
         failure = traceback.format_exc()
         log_utils.log('PLAYMOVIES - Exception: \n' + str(failure))
         return sources
     return sources

开发者ID:vphuc81，项目名称:MyRepository，代码行数:25，代码来源:Fantastic+(18).py

示例2: __search

    def __search(self, titles, year):
        try:
            query = self.search_link % (urllib.quote_plus(cleantitle.getsearch(titles[0])))

            query = urlparse.urljoin(self.base_link, query)

            t = cleantitle.get(titles[0])
            scraper = cfscrape.create_scraper()
            data = scraper.get(query).content
            #data = client.request(query, referer=self.base_link)
            data = client.parseDOM(data, 'div', attrs={'class': 'result-item'})
            r = dom_parser.parse_dom(data, 'div', attrs={'class': 'title'})
            r = zip(dom_parser.parse_dom(r, 'a'), dom_parser.parse_dom(data, 'span', attrs={'class': 'year'}))

            url = []
            for i in range(len(r)):
                title = cleantitle.get(r[i][0][1])
                title = re.sub('(\d+p|4k|3d|hd|season\d+)','',title)
                y = r[i][1][1]
                link = r[i][0][0]['href']
                if 'season' in title: continue
                if t == title and y == year:
                    if 'season' in link:
                        url.append(source_utils.strip_domain(link))
                        print url[0]
                        return url[0]
                    else: url.append(source_utils.strip_domain(link))

            return url
        except:
            return

开发者ID:CYBERxNUKE，项目名称:xbmc-addon，代码行数:31，代码来源:mzmovies.py

示例3: init

 def __init__(self):
     self.priority = 1
     self.language = ['en']
     self.domains = ['xmovies8.tv', 'xmovies8.ru', 'xmovies8.es', 'xmovies8.nz']
     self.base_link = 'https://xmovies8.pl'
     self.search_link = '/movies/search?s=%s'
     self.scraper = cfscrape.create_scraper()

开发者ID:vphuc81，项目名称:MyRepository，代码行数:7，代码来源:xmovies8pl.py

示例4: __get_episode_url

    def __get_episode_url(self, data, hostDict):
        scraper = cfscrape.create_scraper()
        try:
            value = "/seasons/" + cleantitle.geturl(data['tvshowtitle']) + '-season-' + data['season']
            url = self.base_link + value
            print("INFO - " + url)
            html = scraper.get(self.base_link)
            html = scraper.get(url)
            page_list = BeautifulSoup(html.text, 'html.parser')
            page_list = page_list.find_all('div', {'class':'episodiotitle'})
            ep_page = ''
            for i in page_list:
                if re.sub(r'\W+', '', data['title'].lower()) in re.sub(r'\W+', '', i.text.lower()):
                    ep_page = i.prettify()
            if ep_page == '': return ''
            ep_page = BeautifulSoup(ep_page, 'html.parser').find_all('a')[0]['href']
            html = scraper.get(ep_page)
            embed = re.findall('<iframe.+?src=\"(.+?)\"', html.text)[0]
            url = embed
            sources = []
            if 'mehliz' in url:
                html = scraper.get(url, headers={'referer': self.base_link + '/'})
                files = re.findall('file: \"(.+?)\".+?label: \"(.+?)\"', html.text)

                for i in files:
                    try:
                        sources.append({
                            'source': 'gvideo',
                            'quality': i[2],
                            'language': 'en',
                            'url': i[0] + "|Referer=https://www.mehlizmovies.com",
                            'direct': True,
                            'debridonly': False
                        })

                    except Exception:
                        pass

            else:
                valid, hoster = source_utils.is_host_valid(url, hostDict)
                if not valid: return ''
                urls, host, direct = source_utils.check_directstreams(url, hoster)

                sources.append({
                    'source': host,
                    'quality': urls[0]['quality'],
                    'language': 'en',
                    'url': url + "|Referer=https://www.mehlizmovies.com",
                    'direct': False,
                    'debridonly': False
                })


            return sources

        except Exception:
            print("Unexpected error in Mehlix _get_episode_url Script:")
            exc_type, exc_obj, exc_tb = sys.exc_info()
            print(exc_type, exc_tb.tb_lineno)
            return ""

开发者ID:vphuc81，项目名称:MyRepository，代码行数:60，代码来源:megaHD.py

示例5: init

 def __init__(self):
     self.priority = 1
     self.language = ['en']
     self.domains = ['hdmega.unblckd.cc']
     self.base_link = 'http://hdmega.unblckd.ink/'
     self.search_link = '/search-movies/%s.html'
     self.scraper = cfscrape.create_scraper()

开发者ID:varunrai，项目名称:repository.magicality，代码行数:7，代码来源:uhd.py

示例6: init

    def __init__(self):
        self.priority = 1
        self.language = ['en']
        self.domains = ['ondarewatch.com', 'dailytvfix.com']
        self.base_link = 'http://www.dailytvfix.com'

        self.scraper = cfscrape.create_scraper()

开发者ID:YourFriendCaspian，项目名称:dotfiles，代码行数:7，代码来源:darewatch.py

示例7: init

 def __init__(self):
     self.priority = 0
     self.language = ['en']
     self.domains = ['tv-release.pw', 'tv-release.immunicity.st']
     self.base_link = 'http://tv-release.pw'
     self.search_link = '?s=%s'
     self.scraper = cfscrape.create_scraper()

开发者ID:varunrai，项目名称:repository.magicality，代码行数:7，代码来源:tvrelease.py

示例8: init

 def __init__(self):
     self.priority = 1
     self.language = ['en']
     self.domains = ['hdpopcorns.co','hdpopcorns.eu']
     self.base_link = 'http://hdpopcorns.co'
     self.search_link = '/?s=%s'
     self.scraper = cfscrape.create_scraper()

开发者ID:vphuc81，项目名称:MyRepository，代码行数:7，代码来源:hdpopcorns.py

示例9: init

 def __init__(self):
     self.priority = 1
     self.language = ['en']
     self.domains = ['ultrahdindir.com']
     self.base_link = 'http://ultrahdindir.com'
     self.post_link = '/index.php?do=search'
     self.scraper = cfscrape.create_scraper()

开发者ID:vphuc81，项目名称:MyRepository，代码行数:7，代码来源:ultrahd.py

示例10: init

 def __init__(self):
     self.priority = 0
     self.language = ['en']
     self.domains = ['watchserieshd.io']
     self.base_link = 'https://www4.watchserieshd.io'
     self.search_link = 'search.html?keyword=%s'
     self.scraper = cfscrape.create_scraper()

开发者ID:vphuc81，项目名称:MyRepository，代码行数:7，代码来源:watchserieshd.py

示例11: init

 def __init__(self):
     self.priority = 1
     self.language = ['en']
     self.domains = ['movie4k.to']
     self._base_link = None
     self.search_link = '/movies.php?list=search&search=%s'
     self.scraper = cfscrape.create_scraper()

开发者ID:vphuc81，项目名称:MyRepository，代码行数:7，代码来源:movie4kto.py

示例12: episode

    def episode(self, url, imdb, tvdb, title, premiered, season, episode):
        try:
            if url == None: return
            scraper = cfscrape.create_scraper()
            url = urlparse.parse_qs(url)
            url = dict([(i, url[i][0]) if url[i] else (i, '') for i in url])
            url['premiered'], url['season'], url['episode'] = premiered, season, episode
            try:
                clean_title = cleantitle.geturl(url['tvshowtitle'])+'-season-%d' % int(season)
                search_url = urlparse.urljoin(self.base_link, self.search_link % clean_title.replace('-', '+'))
                r = scraper.get(search_url).content
                r = client.parseDOM(r, 'div', {'id': 'movie-featured'})
                r = [(client.parseDOM(i, 'a', ret='href'),
                      re.findall('<b><i>(.+?)</i>', i)) for i in r]
                r = [(i[0][0], i[1][0]) for i in r if
                     cleantitle.get(i[1][0]) == cleantitle.get(clean_title)]
                url = r[0][0]
            except:
                pass
            data = scraper.get(url).content
            data = client.parseDOM(data, 'div', attrs={'id': 'details'})
            data = zip(client.parseDOM(data, 'a'), client.parseDOM(data, 'a', ret='href'))
            url = [(i[0], i[1]) for i in data if i[0] == str(int(episode))]

            return url[0][1]
        except:
            return

开发者ID:YourFriendCaspian，项目名称:dotfiles，代码行数:27，代码来源:123hulu.py

示例13: init

 def __init__(self):
     self.priority = 1
     self.language = ['en']
     self.domains = ['l23movies.com']
     self.base_link = 'http://l23movies.com'
     self.movies_search_path = ('search-movies/%s.html')
     self.scraper = cfscrape.create_scraper()

开发者ID:YourFriendCaspian，项目名称:dotfiles，代码行数:7，代码来源:l23movies.py

示例14: init

 def __init__(self):
     self.priority = 1
     self.language = ['en']
     self.domains = ['scene-rls.com', 'scene-rls.net']
     self.base_link = 'http://scene-rls.net'
     self.search_link = '/?s=%s&submit=Find'
     self.scraper = cfscrape.create_scraper()

开发者ID:vphuc81，项目名称:MyRepository，代码行数:7，代码来源:Fantastic+(24).py

示例15: sources

 def sources(self, url, hostDict, hostprDict):
     try:
         sources = []
         scraper = cfscrape.create_scraper()
         r = scraper.get(url).content
         try:
             match = re.compile('<iframe .+?src="(.+?)"').findall(r)
             for url in match:
                 if 'youtube' in url:
                     continue
                 valid, hoster = source_utils.is_host_valid(url, hostDict)
                 if not valid:
                     continue
                 sources.append({
                     'source': hoster,
                     'quality': 'SD',
                     'language': 'en',
                     'url': url,
                     'direct': False,
                     'debridonly': False
                 })
         except Exception:
             return sources
     except Exception:
         failure = traceback.format_exc()
         log_utils.log('HackIMDB - Exception: \n' + str(failure))
         return sources
     return sources

开发者ID:vphuc81，项目名称:MyRepository，代码行数:28，代码来源:Fantastic+(13).py

注：本文中的resources.lib.modules.cfscrape.create_scraper函数示例由纯净天空整理自Github/MSDocs等源码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

Python cleangenre.lang函数代码示例发布时间：2022-05-26

Python cache.timeout函数代码示例发布时间：2022-05-26

Python util.grid_equal函数代码示例

1 Python 入门教程

Python入门教程 Python 是一种解释型、面向对象、动态数据类型的高级程序设计语言。 P

阅读：13794|2022-01-22

2 Python wikiutil.getFrontPage函数代码示例

Python wikiutil.getFrontPage函数代码示例

阅读：10180|2022-05-24

3 Python 简介

Python 简介 Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本

阅读：4078|2022-01-22

4 Python tests.group函数代码示例

Python tests.group函数代码示例

阅读：4041|2022-05-27

5 Python util.check_if_user_has_permission

Python util.check_if_user_has_permission函数代码示例

阅读：3840|2022-05-27

6 Python 操练实例98

Python 练习实例98 Python 100例题目：从键盘输入一个字符串，将小写字母全部转换成大

阅读：3509|2022-01-22

7 Python 环境搭建

Python 环境搭建本章节我们将向大家介绍如何在本地搭建 Python 开发环境。 Py

阅读：3030|2022-01-22

8 Python output.darkgreen函数代码示例

Python output.darkgreen函数代码示例

阅读：2648|2022-05-25

9 Python 基础语法

Python 基础语法 Python 语言与 Perl，C 和 Java 等语言有许多相似之处。但是，也

阅读：2640|2022-01-22

10 Python 中文编码

Python 中文编码前面章节中我们已经学会了如何用 Python 输出 Hello, World!，英文没

阅读：2295|2022-01-22

客服电话

电子邮件

Python cfscrape.create_scraper函数代码示例

示例1: sources

示例2: __search

示例3: init

示例4: __get_episode_url

示例5: init

示例6: init

示例7: init

示例8: init

示例9: init

示例10: init

示例11: init

示例12: episode

示例13: init

示例14: init

示例15: sources

请发表评论

全部评论

上一篇：

下一篇：

Python util.grid_equal函数代码示例

Python util.get_worker_name函数代码示例

Python util.get_webmention_target函数代

Python util.get_uuid函数代码示例

Python util.get_type_by_name函数代码示例

Python util.grid_equal函数代码示例

Python util.get_worker_name函数代码示例

Python util.get_webmention_target函数代

Python util.get_uuid函数代码示例

Python util.get_type_by_name函数代码示例

Python util.get_stdout函数代码示例

关于我们

产品与服务

解决方案

139-2527-9053

客服电话

电子邮件

Python cfscrape.create_scraper函数代码示例

示例1: sources

示例2: __search

示例3: __init__

示例4: __get_episode_url

示例5: __init__

示例6: __init__

示例7: __init__

示例8: __init__

示例9: __init__

示例10: __init__

示例11: __init__

示例12: episode

示例13: __init__

示例14: __init__

示例15: sources

请发表评论

全部评论

上一篇：

下一篇：

Python util.grid_equal函数代码示例

Python util.get_worker_name函数代码示例

Python util.get_webmention_target函数代

Python util.get_uuid函数代码示例

Python util.get_type_by_name函数代码示例

Python util.grid_equal函数代码示例

Python util.get_worker_name函数代码示例

Python util.get_webmention_target函数代

Python util.get_uuid函数代码示例

Python util.get_type_by_name函数代码示例

Python util.get_stdout函数代码示例

关于我们

产品与服务

解决方案

139-2527-9053

示例3: init

示例5: init

示例6: init

示例7: init

示例8: init

示例9: init

示例10: init

示例11: init

示例13: init

示例14: init