【python】爬取大众脸插件发布时间和标题

杂记编程
21年8月1日
编辑

月离离

import re
from lxml import etree
import time

# 获取总页数
def get_page_num(url):
    res = requests.get(url)
    pattern = re.compile(r'共\s(.+)\s页')  # 查找数字
    pages_num = pattern.findall(res.text)[0]
    return int(pages_num)
# 获取文章名称和日期
def get_data(pages_num,url):
    titles,dates = [],[]
    for i in range(pages_num, 1, -1):
        page_url = url + 'page/' + str(i) +'/'
        r = requests.get(page_url)
        html = etree.HTML(r.content)
        title_data = html.xpath('/html/body/section/div[2]/div/article[*]/h2/a/text()')
        date_data = html.xpath('/html/body/section/div[2]/div/article[*]/footer/time/text()')
        titles += title_data
        dates += date_data
    r = requests.get(url)
    html = etree.HTML(r.content)
    title_data = html.xpath('/html/body/section/div[1]/div/article[*]/h2/a/text()')
    date_data = html.xpath('/html/body/section/div[2]/div/article[*]/h2/a/text()')
    titles += title_data
    dates += date_data
    time.sleep(0.5) # 限制爬取速度
    return titles,dates
if __name__ != '__main__.':
    url = 'https://www.lookae.com/after-effects/aechajian/'
    data = get_data(get_page_num(url),url)
    print(data)

{{userData.name}}已认证

【python】爬取大众脸插件发布时间和标题

【python】爬取AE scripts的AE插件信息

【python】正则表达式

【转场周期表】Triangle Wipe

【Blender】常用快捷键大全

【脚本案例】导入预设文件修改合成尺寸

【打光】AE摄影打光流程

【PR脚本】添加到AME渲染

【AE效果】扫光

Ps ToolBox

【AE脚本】位置属性绑定空对象

【AE脚本】- NewLayer 干掉一堆一模一样却只用一次的空对象、纯色层

【Shape Connector】AE一键制作变形动画

【限时8折】【Psd Updater】AE一键同步PSD新增图层

【AE脚本】- ShapeSelect 形状图层属性给我展开！

月离文档站

月离云盘

月离导航站

链接缩短

关注我们

法律声明

在线工单

查看帮助

{{userData.name}}已认证

【python】爬取AE scripts的AE插件信息

【python】正则表达式

Ps ToolBox

【AE脚本】位置属性绑定空对象

【AE脚本】- NewLayer 干掉一堆一模一样却只用一次的空对象、纯色层

【Shape Connector】AE一键制作变形动画

【限时8折】【Psd Updater】AE一键同步PSD新增图层

【AE脚本】- ShapeSelect 形 状 图 层 属 性 给 我 展 开 ！

相似站点

月离文档站

月离云盘

月离导航站

链接缩短

关注我们

法律声明

在线工单

查看帮助

【AE脚本】- ShapeSelect 形状图层属性给我展开！