网易云音乐热歌榜爬虫

源码 55 字 大概 1 分钟 284 次
爬虫将会生成一个html文件,用以保存歌曲及链接

运行实例

2018060815550822.png

爬虫代码

#python3  s0s.cc
import requests
import re

def main():
    data1=re.findall('<li><a href=\"(.*?)</li>',ret2)
    data4='<html><head><title>云音乐热歌榜 - 排行榜 - 网易云音乐</title><body>'
    for data2 in data1:
        data3='<li><a href="https://music.163.com/#'+data2+'</li>'
        data4=data4 + data3
    html=data4 +'</body></html>'
    savefile=open('D:/hotmusic.html','wb+')
    savefile.write(html.encode('gbk','ignore'))
    print('爬取完成,文件位于D:/hotmusic.html')
    savefile.close()

if __name__ == "__main__":
    url='https://music.163.com/discover/toplist?id=3778678'#根据当日更改
    requests.adapters.DEFAULT_RETRIES = 5
    headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:60.0) Gecko/20100101 Firefox/60.0','Content-Type':'application/x-www-form-urlencoded'}
    ret=requests.get(url=url,headers=headers,timeout=10)
    ret1=re.findall('<ul class=\"f-hide\">(.*)</ul>',ret.text)
    for ret2 in ret1:
        main()
文章目录
END

本作品采用 知识共享署名-相同方式共享 4.0 国际许可协议 进行许可。

发表感想